谷歌發(fā)布史上最大“通才”AI模型,可讓機器人更自主
鈦媒體App 3月8日消息,谷歌和柏林工業(yè)大學(xué)的團隊重磅推出了史上最大的視覺語言模型——PaLM-E,參數(shù)量高達5620億(GPT-3的參數(shù)量為1750億)。作為一種多模態(tài)具身視覺語言模型(VLM),PaLM-E不僅可以理解圖像,還能理解、生成語言,可以執(zhí)行各種復(fù)雜的機器人指令而無需重新訓(xùn)練。谷歌研究人員計劃探索PaLM-E在現(xiàn)實世界場景中的更多應(yīng)用,例如家庭自動化或工業(yè)機器人。他們希望PaLM-E能夠激發(fā)更多關(guān)于多模態(tài)推理和具身AI的研究。
本文內(nèi)容僅供參考,不構(gòu)成投資建議,請謹(jǐn)慎對待。
根據(jù)《網(wǎng)絡(luò)安全法》實名制要求,請綁定手機號后發(fā)表評論