機(jī)器人(圖片來源:Unsplash)

過去一周風(fēng)靡社交網(wǎng)絡(luò)的人工智能(AI)產(chǎn)品,非ChatGPT莫屬。

12月5日,微軟投資的美國 AI 實驗室 OpenAI 創(chuàng)始人兼CEO Sam Altman在社交媒體上宣布,其11月30日發(fā)布的聊天機(jī)器人模型ChatGPT,上線短短五天,用戶已經(jīng)突破了100萬。

所謂ChatGPT,就是模仿人類說話風(fēng)格的同時回答大量的問題,通過 OpenAI 的新模型生成一些語義答案,利用網(wǎng)頁應(yīng)用形式與用戶對話互動,實現(xiàn)簡單聊天、信息咨詢、撰寫詩詞作文、修改代碼等。

由于其較高質(zhì)量的回答、高效獲取信息的方式以及上癮式的交互體驗,ChatGPT引起了國內(nèi)外社交媒體的廣泛傳播與關(guān)注,而且產(chǎn)生取代谷歌等搜索引擎的討論與可能性。

連世界首富、特斯拉CEO馬斯克也稱:“許多人陷入了該死的瘋狂ChatGPT循環(huán)中。”甚至已經(jīng)有國內(nèi)投資人開始尋找ChatGPT背后的 OpenAI 公司,求購其股份。

盡管對其有大量贊揚的聲音,但程序員聚集的問答社區(qū)Stack Overflow已經(jīng)宣布禁止使用ChatGPT生成的機(jī)器回復(fù),而且ChatGPT存在輸出結(jié)果不穩(wěn)定、沒有糾錯體系、商業(yè)落地難、數(shù)據(jù)安全難保護(hù)、對中國境內(nèi)的實名用戶不友好、關(guān)鍵模型不開源、AIGC(人工智能內(nèi)容生產(chǎn))賽道引發(fā)的創(chuàng)業(yè)與投資泡沫等問題,已引發(fā)業(yè)內(nèi)廣泛討論。
(這是記者輸入“鈦媒體”三字,chatGPT給出的答案,準(zhǔn)確度確實令人驚艷)

這是編輯輸入“鈦媒體”三字,chatGPT給出的答案,準(zhǔn)確度確實令人驚艷。

接受鈦媒體App獨家采訪時,京東集團(tuán)副總裁、IEEE Fellow何曉冬博士表示,中國應(yīng)該要發(fā)展自己的ChatGPT模型產(chǎn)品。

“坦白講,(語音機(jī)器人)這個方向是對的,以后會有這個市場需求。”何曉冬強(qiáng)調(diào),除了在研究方面繼續(xù)向前探索外,在文本生成上,ChatGPT有獨到的體驗和價值,已經(jīng)快要接近可商用的地步了。

ChatGPT到底是怎么形成的?能否取代搜索引擎?

“AI 快要成精了!”有投資人玩ChatGPT之后在朋友圈這樣感慨。

那么,什么是ChatGPT?

你可以理解為,ChatGPT偏任務(wù)型的多輪對話或問答系統(tǒng),定位于“通用型 AI 技術(shù)助理”。相比蘋果Siri 和小愛同學(xué)的“訂餐、訂票、訂賓館”,ChatGPT更多執(zhí)行開放域任務(wù),即問答、閱讀理解、推理、頭腦風(fēng)暴、寫作文、改錯等,可以說是“AI 版的知乎”。

今年3月4日,OpenAI 團(tuán)隊在預(yù)印版網(wǎng)站arxiv上提交了一篇題為“訓(xùn)練語言模型以遵循人類反饋的說明”的論文,詳細(xì)闡述了ChatGPT背后基于擁有13億個參數(shù)的InstructGPT大模型的技術(shù)能力。

OpenAI 在論文中指出,ChatGPT核心在于InstructGPT模型輸出,更深層次是基于 OpenAI 研發(fā)的GPT-3.5基座能力。盡管InstructGPT模型參數(shù),比NLP預(yù)訓(xùn)練模型——GPT-3 1750億個參數(shù)少100倍,但前者的數(shù)據(jù)模型有所甄選、校準(zhǔn)和微調(diào),訓(xùn)練出來的結(jié)果更精準(zhǔn),能夠更簡單的優(yōu)化語言模型。

該團(tuán)隊稱,ChatGPT大部分沿用了InstructGPT的訓(xùn)練方式,在數(shù)據(jù)收集階段招聘了人類 AI 訓(xùn)練師,同時扮演用戶和 AI 助理角色收集數(shù)據(jù)。在此過程中,這些 AI 訓(xùn)練師可以根據(jù)初始模型的結(jié)果修改模型生成的回復(fù),從而被用于有監(jiān)督地精調(diào)訓(xùn)練模型。隨后,工程師會對模型的多個生成結(jié)果進(jìn)行比較,從中甄選數(shù)據(jù)中更加符合人類偏好的輸出信息,甚至存在持續(xù)學(xué)習(xí)能力。OpenAI 統(tǒng)計發(fā)現(xiàn),其API用戶在超過70%的情況下更喜歡InstructGPT。

目前,ChatGPT仍處于免費測試階段,不限量向公眾開放。而基于其破百萬的用戶數(shù),平臺所花費的成本不算小。馬斯克曾詢問“每次聊天的平均費用是多少”,Altman回復(fù):“用戶平均每次聊天所花費的可能是個位數(shù)美分。”

鈦媒體App也第一時間嘗試使用ChatGPT模型,簡單問了三個關(guān)于芯片相關(guān)的問題。我們發(fā)現(xiàn),ChatGPT有些信息非常精準(zhǔn),有點像知乎或百科的回答,有時候像谷歌、Bing的搜索引擎結(jié)果。但它的答案精準(zhǔn)度依然有待商榷。

清華大學(xué)計算機(jī)科學(xué)與技術(shù)系長聘副教授、博導(dǎo),聆心智能創(chuàng)始人黃民烈告訴鈦媒體App,ChatGPT展示了新一代 AI 技術(shù)的能力,或許不遠(yuǎn)的未來,一定程度的AGI(通用人工智能)可以做到。至少無縫人機(jī)交互是樂觀的。他指出,InstructGPT的數(shù)據(jù)很好,勝在數(shù)據(jù)質(zhì)量高、多樣性、RLHF算法。其中,強(qiáng)化學(xué)習(xí)帶來的增益非常之大。

目前來看,ChatGPT的升級在于更多是算力與語料調(diào)教后的技術(shù)成果。

何曉冬則對鈦媒體App表示,ChatGPT模型在使用體驗上確實讓人感覺耳目一新。無論是流暢性,還是邏輯感都非常強(qiáng),邏輯強(qiáng)于內(nèi)容。但“干貨”量偏低,缺少一些知識的準(zhǔn)度,“其實某種意義上,我覺得它的實用價值現(xiàn)在還是比不上谷歌(搜索)的。”

前Google總部科學(xué)家、出門問問創(chuàng)始人李志飛接受采訪時表示,相對于語音助手和搜索引擎,ChatGPT還有很多不能干或干不好的事情。ChatGPT的“認(rèn)知”建立在虛擬訓(xùn)練文本上,沒有跟實時的數(shù)據(jù)庫或信息連接,仍有些“空中樓閣”的味道,所以特別適合插科打諢。

有用戶總結(jié),目前ChatGPT不能回答的話題包括:不能預(yù)測可能會但從未發(fā)生過的事件及其后果;不能OpenMind或打破常規(guī)建立新規(guī)則和新模式;不能深入問題的細(xì)節(jié)去回答而是停留概要層面;無法區(qū)分是否為事實問題,一些非事實問題無法得到回答;很偏門的問題(可能從未有人這么想過的問題)不會回答;不能列出非主流觀點;對話語境不能跳躍太大,領(lǐng)域跨度太大等。

但專欄作家Parmy Olson卻認(rèn)為,相比谷歌搜索抓取數(shù)十億個網(wǎng)頁內(nèi)容編制索引,然后按照最相關(guān)的答案對其進(jìn)行排名,包含鏈接列表來讓你點擊。ChatGPT卻直接基于它自己的搜索和信息綜合的單一答案,回復(fù)流程更加簡便。

針對外界認(rèn)為ChatGPT能否取代搜索引擎的討論,ChatGPT自己卻給出了“否定”回答:ChatGPT并不是搜索引擎。它的目的不是提供信息搜索。相對于搜索引擎通過索引網(wǎng)頁并匹配搜索詞來提供信息,ChatGPT則是通過對自然語言問題的回答來幫助用戶解決問題。因此,它們之間沒有直接的競爭關(guān)系,并不能相互顛覆。

早前,OpenAI還發(fā)布了DALL·E 2——可以通過文本描述中生成圖像的 AI 程序。國盛證券指出,相比于此前的AI繪畫,ChatGPT更具有將AI能力與工作流程相結(jié)合的潛力,如果將ChatGPT與Midjourney等創(chuàng)作工具融合,有可能直接輸出設(shè)計圖稿等內(nèi)容。而ChatGPT和DALL·E兩個產(chǎn)品都是AIGC技術(shù)帶來的新變革。

“我認(rèn)為 AI 的潛力還可以進(jìn)一步放大和挖掘?;乜催^去這十年,AI 技術(shù)的進(jìn)步確實超出想象。10年前你可以看到圖像、語音識別有突破,但肯定不會想到繪畫、文章也可以通過 AI 生成邏輯性產(chǎn)品,這兩者是不同的。這十年 AI 在不停的超越和突破很多人的預(yù)期和想象,這還是挺了不起的。”何曉冬對鈦媒體App表示,這次ChatGPT最大的創(chuàng)新點在新的半監(jiān)督學(xué)習(xí)算法,使得它對用戶的意圖理解,可能快達(dá)到大規(guī)模商用的搜索引擎水平。

何曉冬認(rèn)為,相較于之前大量使用無監(jiān)督深度學(xué)習(xí)算法,ChatGPT模型背后的算法和訓(xùn)練過程更加新穎。如果沒有人的數(shù)據(jù)甄選,這個模型參數(shù)即便大十幾倍,也很難達(dá)到這個效果。尤其ChatGPT把生成的文本模型更加“組織化”,這是非常大的技術(shù)創(chuàng)新。

“在某種意義上,這其實是對過去一味追求(參數(shù))大和追求無監(jiān)督學(xué)習(xí)的一個路線修正。”何曉冬表示。

OpenAI 于2021年底已經(jīng)完成了2.5億美元的A輪融資,投資人包括微軟、馬斯克、谷歌風(fēng)投、老虎基金、A16z以及Altman前東家Y-Combinator等。據(jù)The Information報道,成立七年的 OpenAI 公司估值已經(jīng)接近200億美元,是其2022年預(yù)計收入的500-800倍。

在2020年 OpenAI 發(fā)布GPT-3之后,微軟于當(dāng)年9月22日取得獨家授權(quán)。報道指,OpenAI 每年在微軟云計算上花費約為7000萬美元。

中國應(yīng)該有自己的ChatGPT

事實上,盡管ChatGPT海外爆紅、服務(wù)器被擠垮,百萬網(wǎng)友使用,但不包括中國境內(nèi)的實名用戶。很多擁有國內(nèi)+86電話用戶無法使用ChatGPT。雖然有很多替代的網(wǎng)站或方案,或直接到非官方渠道購買 OpenAI 網(wǎng)站賬號,但仍引發(fā)很多用戶抱怨,國內(nèi)用戶體驗大打折扣。

“中國必須要有自己的基座大模型,應(yīng)用大模型。很簡單,OpenAI 關(guān)鍵模型不開源,只給API,中國還不能隨便用,已經(jīng)是‘卡脖子’了,所以我們?yōu)槭裁床蛔鲞@樣的事情。”黃民烈對鈦媒體App表示,包括百度、聆心等國內(nèi)很多團(tuán)隊正在(對AIGC)做決心與相關(guān)資源投入解決相關(guān)問題。

告別硅谷崇拜,在中國互聯(lián)網(wǎng)世界中,國內(nèi)應(yīng)該建立有中國創(chuàng)新特色的ChatGPT,甚至是超越OpenAI能力的中國 AI 公司。這已經(jīng)成為中國 AI 產(chǎn)業(yè)發(fā)展的必答題。

事實上,2022年也因此被稱為“AIGC元年”,生成式 AI 發(fā)展迅速。今年9月一篇文章中提到,生成式 AI 可以處理的領(lǐng)域包括了知識工作和創(chuàng)造性工作,涉及數(shù)十億的人工勞動力。生成式AI 可以使這些人工的效率和創(chuàng)造力至少提高10%,有潛力產(chǎn)生數(shù)萬億美元的經(jīng)濟(jì)價值。

根據(jù)中關(guān)村大數(shù)據(jù)產(chǎn)業(yè)聯(lián)盟發(fā)布的《中國 AI 數(shù)字商業(yè)展望2021-2025》報告預(yù)計,至2025年,中國 AI 數(shù)字商業(yè)核心支柱產(chǎn)業(yè)鏈規(guī)模將達(dá)到1853億元,未來五年的復(fù)合增長率約為57.7%。國泰君安則預(yù)測,未來五年,或?qū)⒂凶疃?0%的圖片內(nèi)容由 AI 技術(shù)參與生成,相應(yīng)有600億以上的市場規(guī)模。
AIGC產(chǎn)業(yè)鏈(來源:報告)

AIGC產(chǎn)業(yè)鏈(來源:行業(yè)報告)

在國內(nèi),AIGC概念企業(yè)正逐步成長,包括奇績創(chuàng)壇、聯(lián)想創(chuàng)投、華創(chuàng)資本、唯獵資本等機(jī)構(gòu)都在觀望或關(guān)注。今年12月,AI生成3D內(nèi)容的數(shù)字品牌AVAR獲得天使+輪融資,成立一年間已連續(xù)完成三輪;另一家跨越星空也在半年內(nèi)連續(xù)完成兩輪共數(shù)千萬元融資。未來是否存在類似 AI 繪畫平臺Stable Diffusion背后的Stability AI 的獨角獸公司,依然需要時間等待。

何曉冬表示,目前GPT(AIGC)創(chuàng)業(yè)價值有兩點:一是如果從研究角度看,國內(nèi)會繼續(xù)往算法技術(shù)創(chuàng)新上探索;二是產(chǎn)業(yè)價值,特別在文本生成上有獨到的體驗和價值,本身已經(jīng)接近可商用的地步了。未來可能需要考慮具體場景應(yīng)用以及準(zhǔn)確性等,尤其是垂直的專業(yè)知識。

“現(xiàn)在確實是 AI 應(yīng)用發(fā)展的好時機(jī),尤其是應(yīng)用落地的時機(jī)。我對 AI 比較樂觀,而且我認(rèn)為 AI 未來肯定要走產(chǎn)業(yè)路線。我越來越感覺到產(chǎn)業(yè)界應(yīng)用機(jī)會比學(xué)術(shù)界更大。”何曉冬認(rèn)為,AI 技術(shù)慢慢地會從一個“作坊式”研究探索變成“工業(yè)級”工程或系統(tǒng)落地。目前,何曉冬團(tuán)隊正在對 AI 語音交互、多模態(tài)智能、數(shù)字人等諸多技術(shù)產(chǎn)品展開探索與研發(fā)落地。

對于有行業(yè)人士稱,ChatGPT存在輸出結(jié)果不穩(wěn)定,商業(yè)落地并不容易,還需深耕,而且很難找到工業(yè)端應(yīng)用范圍,尤其它需要大量算力。

黃民烈向鈦媒體App回應(yīng)稱,ChatGPT定位為通用任務(wù)型助理,作為工具,容易被很多人用到。當(dāng)然這里面商業(yè)成本是必須要考慮的,但他認(rèn)為未來一定是成本下行的趨勢,一定會產(chǎn)生很多商業(yè)應(yīng)用??梢詤⒖棘F(xiàn)在很多文生圖的公司和應(yīng)用、感知和認(rèn)知領(lǐng)域的 AIGC等。“所以我絕對是積極樂觀的。”

此外,AIGC帶來的法律版權(quán)、種族和性別偏見、倫理等問題不可忽視。據(jù)Axios報道,Adobe正在考慮將 AI 生成的圖片以付費形式售賣,消息一出引起廣泛討論。

大成律師事務(wù)所肖颯法律團(tuán)隊在公眾號發(fā)文指出,一般情況下 AI 創(chuàng)作并不會發(fā)生侵權(quán)行為,但如果 AI 在創(chuàng)作某一幅具體的畫作的過程中使用了過多某作品中的元素,或者是作為模板的作品本身屬于侵權(quán)作品,那么該 AI 生成的畫作就可能被認(rèn)定為侵權(quán)作品,從而存在侵權(quán)的可能性。“必須明確的是,AI 雖然能夠?qū)W習(xí),但本身并不懂法律,更不懂得侵權(quán)的概念,任憑其自由發(fā)展是完全不可取的。”

據(jù)財新,小冰公司CEO李笛表示,大家現(xiàn)在的熱情很容易被點燃,是因為ChatGPT的對話質(zhì)量超出預(yù)期,但真實商業(yè)化不像投資人想得那么簡單,ChatGPT的工業(yè)應(yīng)用還有很長的路要走。(本文首發(fā)鈦媒體App,作者|林志佳)

本文系作者 林志佳 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請注明出處、作者和本文鏈接。
本內(nèi)容來源于鈦媒體鈦度號,文章內(nèi)容僅供參考、交流、學(xué)習(xí),不構(gòu)成投資建議。
想和千萬鈦媒體用戶分享你的新奇觀點和發(fā)現(xiàn),點擊這里投稿 。創(chuàng)業(yè)或融資尋求報道,點擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實名制要求,請綁定手機(jī)號后發(fā)表評論

登錄后輸入評論內(nèi)容
  • 單一性是做大的問題。ai通過數(shù)據(jù)形成一個單獨的觀點??墒怯^點就有視角問題。多種可能性和結(jié)果我們可以通過點擊不同的網(wǎng)站查看詳情來建立自己個人的觀點。可是ai基本是在輸出獨立的人觀點。只是區(qū)別可能是數(shù)據(jù)模型顯示這個觀點復(fù)合最多人的聲音

    回復(fù) 2022.12.09 · via netease
  • 寫的很不錯,關(guān)注了

    回復(fù) 2023.02.01 · via iphone
  • ChatGPT會節(jié)省很多作者的“創(chuàng)作”時間

    回復(fù) 2023.02.01 · via iphone
  • 不大可能因為他的數(shù)據(jù)來自搜索,就好比自來水的水也來自江河湖海

    回復(fù) 2022.12.09 · via qq
  • 單一性是做大的問題。ai通過數(shù)據(jù)形成一個單獨的觀點。可是觀點就有視角問題。多種可能性和結(jié)果我們可以通過點擊不同的網(wǎng)站查看詳情來建立自己個人的觀點??墒莂i基本是在輸出獨立的人觀點。只是區(qū)別可能是數(shù)據(jù)模型顯示這個觀點復(fù)合最多人的聲音

    回復(fù) 2022.12.09 · via qq

快報

更多

08:21

現(xiàn)貨白銀日內(nèi)跌1%,現(xiàn)報69.26美元/盎司

08:20

韓國KOSPI指數(shù)跌幅擴(kuò)大至4%

08:10

最新一批業(yè)績大增股出爐,20股全年凈利潤增速超100%

08:09

日韓股市低開,韓國綜合指數(shù)跌近3%

08:01

中信建投:系統(tǒng)運行費上漲僅個別省份較為明顯,總體對儲能經(jīng)濟(jì)性影響較小

08:00

華泰證券:黃金中長期資產(chǎn)再配置邏輯仍穩(wěn)固

07:59

深圳:支持產(chǎn)業(yè)升級類產(chǎn)品進(jìn)口,探索推進(jìn)汽車研發(fā)測試用廢舊關(guān)鍵零部件進(jìn)口試點

07:49

廣東發(fā)布金融“十六條”,支持傳統(tǒng)產(chǎn)業(yè)提質(zhì)煥新

07:47

日本3月東京CPI同比上升1.4%,預(yù)期1.60%

07:47

日本2月失業(yè)率為2.6%,預(yù)期2.70%

07:47

日本3月東京核心CPI同比上升1.7%,預(yù)期1.80%

07:46

A股限售股解禁一覽:6.99億元市值限售股今日解禁

07:46

二手手機(jī)回收價大漲?實探:“回收價漲了,但沒那么夸張”

07:45

鈦白粉價格月內(nèi)三連漲,成本激增企業(yè)難言盈利

07:45

蘿卜快跑正式啟動迪拜全無人商業(yè)化運營

07:44

中信建投:非銀估值處于低位,板塊戰(zhàn)略配置價值凸顯

07:44

中金與銀河高管“互換”進(jìn)行時,最新公布4位高管

07:43

谷歌:人工智能電池預(yù)測功能現(xiàn)已在美國超過15個品牌的數(shù)百款電動汽車車型上推出

07:43

IMF稱伊朗戰(zhàn)爭將推高全球價格并拖累經(jīng)濟(jì)增長,或引發(fā)不對稱沖擊

07:42

中國東航:擬5億-10億元回購股份,將全部注銷以減少注冊資本

5

掃描下載App