附上本期直播時(shí)間軸,幫你快速跳轉(zhuǎn)感興趣的部分

00:03:39  AI發(fā)展的幾個(gè)階段

00:10:04  資本如何看待AI公司的發(fā)展前景?

00:15:55  AI對(duì)于企業(yè)的意義和價(jià)值

00:24:18  企業(yè)在訓(xùn)練模型的過程中,還有哪些問題?

00:34:25  資本對(duì)AI賽道和對(duì)企業(yè)有什么判斷?

以下為對(duì)話實(shí)錄,經(jīng)筆者整理:

萬寧:星塵數(shù)據(jù)在數(shù)據(jù)標(biāo)注領(lǐng)域進(jìn)入的傳統(tǒng)業(yè)務(wù)有哪些?

章磊:星塵數(shù)據(jù)是國(guó)內(nèi)最早一批專注于AI數(shù)據(jù)的創(chuàng)業(yè)公司,經(jīng)歷了每一波AI創(chuàng)業(yè)浪潮和AI技術(shù)的顛覆,并且深入與每個(gè)時(shí)代處于“風(fēng)口浪尖”的公司進(jìn)行了合作,幫助他們創(chuàng)造了更大的價(jià)值。從最初NLP應(yīng)用,到2018年前后的自動(dòng)駕駛,我們?yōu)閹准臆嚻髲?到1解決了他們首款量產(chǎn)(自動(dòng)駕駛)車輛的算法問題。在大模型問世之后,我們也與頭部的大模型公司進(jìn)行深入的合作,共研創(chuàng)新技術(shù),解決大模型發(fā)展中遇見包括幻覺、指令跟隨等在內(nèi)的各種問題。

我們觀察到AI的演進(jìn)路徑是:從最初的CV、NLP等一些簡(jiǎn)單的模型算法的落地,到自動(dòng)駕駛,需要通過大量感知型數(shù)據(jù)標(biāo)注來解決常識(shí)性的問題,再到認(rèn)知型的問題,再到現(xiàn)在,隨著大模型學(xué)習(xí)互聯(lián)網(wǎng)知識(shí)已經(jīng)告一段落,就進(jìn)入了專家型知識(shí)學(xué)習(xí)和交互型知識(shí)學(xué)習(xí)的階段,還有就是像具身智能等與環(huán)境進(jìn)行數(shù)據(jù)交互的階段。

此外,數(shù)據(jù)也從低價(jià)值階段向著高價(jià)值轉(zhuǎn)變,原先一條數(shù)據(jù)可能幾塊錢、幾毛錢,但是現(xiàn)在一條數(shù)據(jù)可能幾十塊錢、幾百塊錢,甚至幾千塊錢。

在此基礎(chǔ)上,未來到底還需要多少數(shù)據(jù)呢?——這是目前大家經(jīng)常問的問題。我認(rèn)為答案是:無窮無盡。因?yàn)槲覀冃枰蕾囈惶椎讓蛹夹g(shù)——機(jī)器學(xué)習(xí),學(xué)習(xí)的內(nèi)容就是我們標(biāo)注好的知識(shí),或者一些交互型的知識(shí),學(xué)習(xí)的過程是無窮無盡的。如果機(jī)器能夠達(dá)到自我學(xué)習(xí)了,那么人類的意義又在哪里?但這一天離我們還很遙遠(yuǎn),至少在未來的幾十年內(nèi),AI還需要不斷通過人類提供的數(shù)據(jù)進(jìn)行學(xué)習(xí)和演進(jìn),同時(shí)學(xué)習(xí)的方式和內(nèi)部機(jī)制也在不斷演進(jìn)。接下來的幾年,我們?nèi)匀豢梢钥吹?,AI會(huì)不斷攻破一個(gè)又一個(gè)人類認(rèn)為不可企及的知識(shí)高峰。這里面包括了數(shù)學(xué)競(jìng)賽的問題、前沿物理學(xué),以及DNA基因等方面。這是我認(rèn)為星塵數(shù)據(jù)存在最大的意義。

從數(shù)據(jù)標(biāo)注行業(yè)角度出發(fā),我們也從由互聯(lián)網(wǎng)、科技公司領(lǐng)投的企業(yè),到自動(dòng)駕駛、車廠領(lǐng)投的方向,再到接下來我們已經(jīng)做了很多央國(guó)企,比如能源、交通、法律、金融保險(xiǎn)等領(lǐng)域,現(xiàn)在各行業(yè)都有我們的應(yīng)用案例。這是因?yàn)槟P偷拈T檻已經(jīng)下降到各行各業(yè)都能夠應(yīng)用的階段。在這個(gè)階段,星塵數(shù)據(jù)不僅提供數(shù)據(jù)標(biāo)注,還提供了數(shù)據(jù)平臺(tái)、模型搭建的解決方案、顧問等服務(wù),幫助各行業(yè)企業(yè)真正通過AI實(shí)現(xiàn)賦能。

萬寧:請(qǐng)介紹一下水木清華基金,以及從投資人角度出發(fā),如何看待諸如星塵數(shù)據(jù)這樣的AI創(chuàng)業(yè)企業(yè)的未來?

丁昳婷:水木清華校友種子基金主要專注于投資清華校友相關(guān)的初創(chuàng)企業(yè)。我們成立于2014年前后,陸續(xù)進(jìn)行到了第五期基金。在AI方面,從之前的CV,逐漸到大模型相關(guān)的AI技術(shù),清華校友圈從事AI行業(yè)的人很多。所以我們也比較早開始在AI方面的投資,從上一代AI開始,到大模型,再到具身智能等方向與相關(guān)產(chǎn)業(yè)都投了很多項(xiàng)目。比如星塵數(shù)據(jù)這樣的企業(yè),還有一些AI安全相關(guān)的企業(yè)。我們創(chuàng)立的初衷就是致力于成為清華校友創(chuàng)業(yè)第一站,給予校友在早期創(chuàng)業(yè)的科技項(xiàng)目提供一些幫助。

關(guān)于AI應(yīng)用方面,我認(rèn)為數(shù)據(jù)基座是非常關(guān)鍵的,近段時(shí)間也能感受到大家對(duì)數(shù)據(jù)的關(guān)注度很高,包括硅谷投資熱點(diǎn)也在向數(shù)據(jù)相關(guān)領(lǐng)域轉(zhuǎn)移。

從我們的觀點(diǎn)出發(fā),無論是之前的自動(dòng)駕駛,還是模型數(shù)據(jù),甚至是CV技術(shù)的階段,大量?jī)?yōu)質(zhì)數(shù)據(jù)的獲取一直都是各行業(yè)能夠應(yīng)用AI技術(shù)的前提。我們認(rèn)為星塵數(shù)據(jù)所做的事情,就是在AI的“掘金”時(shí)代“賣鏟子”,為AI提供了核心要素,提供了標(biāo)注能力,以及對(duì)整個(gè)世界理解的能力。這點(diǎn)在國(guó)際上也是,比如一些與星塵數(shù)據(jù)類似的美國(guó)企業(yè),在美國(guó)也得到了資本界的認(rèn)可,估值也很高,這也體現(xiàn)了資本市場(chǎng)對(duì)于這個(gè)環(huán)節(jié)價(jià)值的認(rèn)可度。

基于此,我們認(rèn)為,不管AI發(fā)展到了什么時(shí)代,數(shù)據(jù)一定是基礎(chǔ),就像剛剛章總所說的,隨著AI向各行各業(yè)滲透,大家在希望更好地?fù)肀I的過程中,數(shù)據(jù)這個(gè)環(huán)節(jié)的價(jià)值會(huì)越來越大,越來越受重視。

萬寧:回溯技術(shù)的演進(jìn),AI在企業(yè)的意義和價(jià)值是什么樣的?

章磊:我相信當(dāng)下,絕大部分企業(yè)都會(huì)購(gòu)買DeepSeek的一體機(jī),但當(dāng)部署了之后,DeepSeek是否真正解決了公司業(yè)務(wù)當(dāng)中的問題?我相信很多公司的答案都是:沒有。

為什么?因?yàn)镈eepSeek學(xué)的是互聯(lián)網(wǎng)知識(shí),通用知識(shí)。但在企業(yè)內(nèi)部業(yè)務(wù)環(huán)節(jié),每家企業(yè)的業(yè)務(wù)知識(shí)都不一樣,怎么樣能讓一個(gè)通用大模型去解決私有化業(yè)務(wù)場(chǎng)景中的問題呢?我認(rèn)為,最好的辦法就是:通過企業(yè)私有化的數(shù)據(jù),訓(xùn)練出一個(gè)私有化的大模型和私有化的AI技術(shù),這是現(xiàn)在大多數(shù)企業(yè)所面臨和忽略的一個(gè)問題。

同時(shí),我認(rèn)為一些簡(jiǎn)單的推理問題、信息檢索的問題,可以通過RAG解決,但企業(yè)最核心的業(yè)務(wù)的問題,仍然需要私有化大模型去解決。而且,很多企業(yè)都存在信息墻——內(nèi)部信息是不能通過外部通用大模型使用的,而這個(gè)時(shí)候,就更需要一個(gè)私有化的大模型。

在這個(gè)過程中,企業(yè)會(huì)面臨很多問題。首先是“幻覺”問題?;糜X問題不是技術(shù)問題,也不是架構(gòu)問題,而是數(shù)據(jù)質(zhì)量、數(shù)據(jù)分布、數(shù)據(jù)重復(fù)、數(shù)據(jù)矛盾等問題,有噪音,以及“臟”數(shù)據(jù),都會(huì)導(dǎo)致幻覺問題。這個(gè)問題就需要通過高質(zhì)量編排的訓(xùn)練數(shù)據(jù)解決。

星塵數(shù)據(jù)通過MorningStar這樣一個(gè)以數(shù)據(jù)為中心的數(shù)據(jù)平臺(tái)解決這些問題。同時(shí),還需要區(qū)分業(yè)務(wù)邏輯和知識(shí)之間的關(guān)系。很多時(shí)候問一個(gè)帶著業(yè)務(wù)邏輯的問題,不僅是一個(gè)通過知識(shí)+通用落地就能回答的問題,而是需要有業(yè)務(wù)邏輯關(guān)系來解決的。我們通過MorningStar平臺(tái)將客戶的業(yè)務(wù)思維鏈整理出來,讓其具備特定業(yè)務(wù)場(chǎng)景下的推理能力,再結(jié)合業(yè)務(wù)中的數(shù)據(jù),梳理好一本精心編排的“教科書”,讓模型進(jìn)行學(xué)習(xí)。

另一個(gè)挑戰(zhàn)是:正在被逐步解決的多模態(tài)的問題。如何將業(yè)務(wù)中Word、PPT這樣的文件,轉(zhuǎn)化為一條條的訓(xùn)練數(shù)據(jù),需要一個(gè)轉(zhuǎn)化過程,這個(gè)過程可能是半自動(dòng)化的,也可能是全自動(dòng)化的。當(dāng)然,在這個(gè)過程中,我們也碰見過數(shù)據(jù)量不夠的問題。一些企業(yè)當(dāng)中,真正了解業(yè)務(wù)的人往往是企業(yè)高管,這些高管的時(shí)間十分寶貴,可能一周都安排不出一小時(shí)與我們進(jìn)行溝通建設(shè)思路之類的問題。所以,在這方面,我認(rèn)為多模態(tài)業(yè)務(wù)數(shù)據(jù),再加上核心業(yè)務(wù)人員的時(shí)間投入是必要的,這樣才能將一些類似于工業(yè)內(nèi)部智能制造的數(shù)據(jù),結(jié)合到企業(yè)真正業(yè)務(wù)過程中,真正落地好AI應(yīng)用。

綜合來看,要解決企業(yè)內(nèi)部問題,不僅需要一個(gè)錘子(工具),還需要企業(yè)有“能工巧匠”,同時(shí)還要有時(shí)間的投入和耐心,以及公司內(nèi)部達(dá)成落地AI應(yīng)用的共識(shí)和決心,才能真正解決AI落地的問題。

萬寧:除了業(yè)務(wù)人員時(shí)間投入不足之外,企業(yè)在訓(xùn)練模型的過程中,還有哪些問題?

章磊:第一點(diǎn),企業(yè)一定要有耐心。就好像人們對(duì)自己的子女有很大的耐心,能夠反復(fù)地傳授他們知識(shí)、培養(yǎng)能力,一點(diǎn)點(diǎn)地成長(zhǎng)。AI的學(xué)習(xí)能力比人要強(qiáng)很多,但這個(gè)學(xué)習(xí)的過程也需要人們給予更多的耐心。

第二點(diǎn),在應(yīng)用AI方面要有決心,因?yàn)锳I已經(jīng)是一個(gè)不可逆的趨勢(shì)。我們發(fā)現(xiàn)很多企業(yè)的業(yè)務(wù)人員內(nèi)心還存在僥幸,他們覺得,AI不好用,就不用了,公司就不推廣AI應(yīng)用了。這是不可能的,公司肯定會(huì)推廣AI應(yīng)用,只不過是快慢的問題。

第三點(diǎn),管理層要制定好機(jī)制。讓中層、一線員工,有足夠的時(shí)間使用AI、迭代AI、磨合AI。同時(shí)還要推行良好的管理機(jī)制、競(jìng)爭(zhēng)機(jī)制、分享機(jī)制,將資源分配到AI應(yīng)用上,才能做好AI落地。

第四點(diǎn),企業(yè)不要“單打獨(dú)斗”,要通過生態(tài)解決問題,而不要內(nèi)部自己研究。像星塵數(shù)據(jù)這樣的,具備充足行業(yè)解決方案經(jīng)驗(yàn)的公司有很多,即便企業(yè)所處行業(yè)有一些獨(dú)特的問題,也能通過其他行業(yè)的一些經(jīng)驗(yàn),加速企業(yè)在行業(yè)內(nèi)落地AI應(yīng)用的進(jìn)程。

萬寧:在AI落地,以及智能體落地的過程中,星塵數(shù)據(jù)會(huì)給客戶怎樣的建議?

章磊:我覺得要在有耐心的前提下,做到“小步快跑”。一個(gè)項(xiàng)目需要從前期咨詢/溝通、數(shù)據(jù)策略、模型架構(gòu)策略、設(shè)計(jì),到小規(guī)模驗(yàn)證,然后再到大量數(shù)據(jù)合成、標(biāo)注,準(zhǔn)備好數(shù)據(jù),再到模型訓(xùn)練、部署、應(yīng)用、集成,最后再到數(shù)據(jù)迭代、模型迭代,是一個(gè)很長(zhǎng)的鏈路。這個(gè)過程中,也會(huì)出現(xiàn)剛剛提到的幻覺、思維鏈不對(duì)等問題,這些問題就需要一點(diǎn)點(diǎn)去解決。沒有一個(gè)企業(yè)的業(yè)務(wù)問題是可以通過通用大模型一下就解決的。

舉個(gè)例子,比如法務(wù)行業(yè),客戶需要撰寫某一個(gè)專業(yè)領(lǐng)域的法務(wù)合同。這個(gè)過程中就會(huì)遇見很多問題,比如,無法通過RAG進(jìn)行多份合同的沖突分析、證據(jù)鏈構(gòu)建,法律原則適用度判斷,這些都無法通過信息檢索來解決。就需要通過先學(xué)習(xí)法律基礎(chǔ)知識(shí),內(nèi)化法律語義和推理,然后構(gòu)建復(fù)雜的證據(jù)鏈,沉淀專家經(jīng)驗(yàn),再將專家策略邏輯寫成代碼,轉(zhuǎn)化為可以訓(xùn)練的內(nèi)容,這些都需要一點(diǎn)點(diǎn)迭代完成。

再比如制造業(yè)。需要多模態(tài)的能力,而RAG很難通過圖像特征、工藝參數(shù)深度關(guān)聯(lián),進(jìn)行參數(shù)溯源,復(fù)雜因果推理,工藝優(yōu)化建議等能力,這時(shí)候模型就需要學(xué)習(xí)制造工藝材料學(xué)等一些知識(shí),并在多模態(tài)數(shù)據(jù)上進(jìn)行溯源歸因,將專家經(jīng)驗(yàn)沉淀下來,這個(gè)過程也是漫長(zhǎng)的。

像RAG、Agent、Workflow都屬于工程類,是人類邏輯能夠快速理解的,我相信企業(yè)業(yè)務(wù)人員肯定會(huì)有比較聰明的人,能夠快速地掌握這些工具鏈去解決問題。但真正要解決數(shù)據(jù)的問題,才能在這些工具鏈上解決問題。我們認(rèn)為,Agent、Workflow是一個(gè)短暫過渡的產(chǎn)物,當(dāng)GPT5、GPT6出來之后,你會(huì)發(fā)現(xiàn),其實(shí)不需要這些工具流,因?yàn)樗且粋€(gè)人的邏輯鏈,而真實(shí)的問題復(fù)雜度非常高。

就像自動(dòng)駕駛,原先在L2的時(shí)候,車企為了趕交付周期,寫了上萬條規(guī)則,但后來特斯拉就使用端到端,將規(guī)則全部?jī)?nèi)化成深度的信息。我相信大模型也是一樣,通過Workflow會(huì)發(fā)現(xiàn),補(bǔ)丁加了很多,規(guī)則加了很多,最后很難網(wǎng)簽執(zhí)行,因?yàn)樗荒芙鉀Q一個(gè)具體的小問題。但如果它是一個(gè)公司的業(yè)務(wù)大腦,最后公司的業(yè)務(wù)形態(tài)也會(huì)轉(zhuǎn)變,原來是以人為中心,計(jì)算機(jī)輔助,現(xiàn)在是以模型為中心,人不斷“喂養(yǎng)”這個(gè)模型,這樣模型才能越來越好用,真正解決企業(yè)的問題。

萬寧:作為投資人,在AI落地方面,對(duì)賽道和對(duì)企業(yè)有什么判斷?

丁昳婷:AI已經(jīng)從原先的提升某個(gè)環(huán)節(jié)的效率,走向大家更期待AI能夠直接交付一個(gè)結(jié)果,或者說是深度理解業(yè)務(wù)流,然后幫助企業(yè)在某些業(yè)務(wù)中,交付更好的結(jié)果。

我們看到在很多行業(yè),或者說業(yè)務(wù)方向上,AI更容易落地。比如在AI營(yíng)銷,或者客服(售前),通過學(xué)習(xí)大量數(shù)據(jù),與顧客進(jìn)行溝通,或者售后方面的一些預(yù)溝通。這些相對(duì)容易落地的方向,已經(jīng)有越來越多的團(tuán)隊(duì)涉足這些領(lǐng)域。

如果要更深入到整個(gè)企業(yè)的流程中,就需要與業(yè)務(wù)深度綁定。以制造業(yè)企業(yè)為例,制造業(yè)涉及了生產(chǎn)過程管理、產(chǎn)線管理,就需要AI理解一整套系統(tǒng),需要有人理解整個(gè)業(yè)務(wù)流程是什么樣的,然后讓AI學(xué)會(huì)整個(gè)業(yè)務(wù)流程。然后再將AI的能力逐步深入滲透到業(yè)務(wù)的各個(gè)環(huán)節(jié)。

在這個(gè)過程中,也有很多困難需要解決。比如在多Agent協(xié)同減少人力成本的過程中,就可能面臨幾個(gè)問題。一個(gè)是標(biāo)準(zhǔn)化,可規(guī)?;瘡?fù)制的能力。比如一個(gè)龍頭客戶將某個(gè)場(chǎng)景下的AI能力迭代了一遍,這個(gè)能力能否具備向同行業(yè),甚至跨行業(yè)客戶遷移(復(fù)用)的能力。投資機(jī)構(gòu)在評(píng)估的時(shí)候,也會(huì)考慮這些因素。

在我看來,當(dāng)下是一個(gè)傳統(tǒng)行業(yè)+AI的機(jī)會(huì),傳統(tǒng)行業(yè)本身具有了豐富的行業(yè)Know-How,能將AI的能力在應(yīng)用過程中,進(jìn)一步提升。而對(duì)于創(chuàng)業(yè)公司來說,他們可能缺乏行業(yè)深度業(yè)務(wù)流程的理解能力。

但從另一個(gè)維度上看,越來越多的創(chuàng)業(yè)公司將標(biāo)準(zhǔn)化的能力抽象出來,主要解決一個(gè)方面問題,就有可能在更多的行業(yè)(場(chǎng)景)中復(fù)用。這就需要整體生態(tài)的支撐,不同的團(tuán)隊(duì),側(cè)重不同的方面,比如有的團(tuán)隊(duì)就通過大量行業(yè)專有數(shù)據(jù),打造好垂類的行業(yè)大模型。

在某些行業(yè)AI對(duì)生產(chǎn)力的提升已經(jīng)很明顯了。比如在編程領(lǐng)域,國(guó)內(nèi)外有大量公司布局這個(gè)方面的業(yè)務(wù),通過LLM語言模型,在編程方面能夠替代大量的人工。同時(shí),AI編程也可以幫助一些原來不會(huì)編程的人,通過輕量化的方式,構(gòu)建個(gè)人網(wǎng)站。現(xiàn)在已經(jīng)有一些公司具備了這樣的能力,能夠幫助用戶快速地構(gòu)建一個(gè)相對(duì)標(biāo)準(zhǔn)化的產(chǎn)品。

總結(jié)來看,無論在企業(yè)側(cè),還是個(gè)人側(cè),AI都在越來越多地替代我們身邊的角色,這個(gè)過程中,有很多多樣化的需求,有一些容易用AI實(shí)現(xiàn)的功能,已經(jīng)有很多初創(chuàng)公司推出了“百花齊放”的產(chǎn)品。但從另一個(gè)角度來說,離真正的解決專業(yè)性極強(qiáng)的行業(yè)場(chǎng)景還有比較遠(yuǎn)的距離。這就需要構(gòu)建完善的生態(tài),通過行業(yè)專有數(shù)據(jù),進(jìn)行結(jié)合。

我們也看到了一些現(xiàn)象——現(xiàn)在很多大企業(yè)都非常迫切地尋找一個(gè)強(qiáng)力的AI團(tuán)隊(duì),他們認(rèn)為有了這個(gè)團(tuán)隊(duì),就能解決公司的問題。在這個(gè)過程中也有一些難題。比如,雖然老板的決心很強(qiáng),但在專業(yè)性方面,對(duì)流程并不是很理解的情況下,很難評(píng)估工作量、協(xié)同資源、計(jì)算投入。所以究竟什么樣的人員構(gòu)成,以及什么樣的業(yè)態(tài)才能更好地幫助傳統(tǒng)行業(yè)進(jìn)一步實(shí)現(xiàn)AI轉(zhuǎn)型,也是目前行業(yè)內(nèi)在討論的一個(gè)熱議話題。

萬寧:在AI已經(jīng)是必選項(xiàng)的背景下,很多企業(yè)希望通過多Agent協(xié)同來落地AI應(yīng)用,但大多數(shù)企業(yè)的費(fèi)效比并不是很好,您如何看待這個(gè)問題?

章磊:我覺得核心的問題是管理的方式還有待提高。我們內(nèi)部管理層開會(huì)的時(shí)候,也說要倡導(dǎo)員工擁抱AI。其實(shí)我們自己也需要擁抱AI,因?yàn)椴皇敲總€(gè)星塵的員工都是算法工程師,都懂AI,我們也有大量業(yè)務(wù)人員。這種情況下,首先我們就有一些體系上、制度上、財(cái)務(wù)上的支持。比如,給員工報(bào)課,每周進(jìn)行分享,然后在評(píng)級(jí)的時(shí)候,將使用AI算在評(píng)級(jí)內(nèi)。招聘的時(shí)候,我們要求應(yīng)聘者對(duì)AI有強(qiáng)烈的興趣。

第二點(diǎn),要有機(jī)制。比如我們幫助客戶打造了業(yè)務(wù)問答助手,也會(huì)告訴客戶打造完不是終點(diǎn),而是起點(diǎn)。因?yàn)檫@個(gè)助手現(xiàn)在將將夠用,但企業(yè)若想要將它打造成內(nèi)部業(yè)務(wù)助理,就需要與員工進(jìn)行大量的交互,并且企業(yè)需要專門安排一個(gè)員工實(shí)時(shí)監(jiān)測(cè)問答效果好不好,不好的數(shù)據(jù)需要剔除。比如星塵的MorningStar平臺(tái)就有這么一個(gè)功能:將不好的答案自動(dòng)挖掘出來,自動(dòng)收錄起來,生成新的數(shù)據(jù),再進(jìn)行訓(xùn)練,形成一個(gè)迭代的思維。

在管理層上,需要管理者將員工擁抱AI的熱情慢慢調(diào)動(dòng)起來;在數(shù)據(jù)層面、模型層面,需要不斷對(duì)模型進(jìn)行迭代、優(yōu)化。

這個(gè)過程中,相對(duì)于ChatGPT這樣的幾百B參數(shù)的通用模型來說,企業(yè)需要的是真正能解決業(yè)務(wù)問題的小模型,可能20B、30B參數(shù)的模型就夠了。關(guān)鍵是要將企業(yè)內(nèi)部數(shù)據(jù)存下來,整理清楚。所以,模型架構(gòu)不是阻礙AI落地的關(guān)鍵,阻礙AI在業(yè)務(wù)上落地的主要瓶頸是數(shù)據(jù)、機(jī)制、企業(yè)文化和管理迭代的過程。

企業(yè)需要設(shè)計(jì)一個(gè)機(jī)制,讓數(shù)據(jù)能夠迭代起來,就像今年紅杉AI大會(huì)上,有的合伙人就說:我們投AI公司最大的邏輯是看這個(gè)公司有沒有數(shù)據(jù)護(hù)城河,因?yàn)锳I技術(shù)本身沒有護(hù)城河,只有數(shù)據(jù)才有護(hù)城河。

所謂數(shù)據(jù)護(hù)城河,一種是,你的數(shù)據(jù)是不是別的企業(yè)沒有的數(shù)據(jù)?并且你還能持續(xù)地通過這些數(shù)據(jù)賺錢;另一種是,打造一種業(yè)務(wù)模式,可以讓數(shù)據(jù)在這種模式下,越滾越大。

對(duì)于企業(yè)而言,走到最后企業(yè)的核心競(jìng)爭(zhēng)力就是:企業(yè)能不能通過AI提升業(yè)務(wù)能力,AI能力越滾越大的背后,不是模型越來越強(qiáng),而是數(shù)據(jù)越滾越大。

萬寧:在行業(yè)Know-How等數(shù)據(jù)越來越重要的背景下,創(chuàng)業(yè)企業(yè)的機(jī)會(huì)還多嗎?

丁昳婷:這不是一個(gè)很好回答的問題,我結(jié)合自己的理解來解答一下。

首先,我很贊同章總的觀點(diǎn)——數(shù)據(jù)肯定是最重要的護(hù)城河,尤其是一些垂直行業(yè)落地應(yīng)用的過程。而什么樣的數(shù)據(jù)才能形成一個(gè)高效的解決方案,對(duì)于整個(gè)團(tuán)隊(duì)來說是一個(gè)非常大的挑戰(zhàn)。有些傳統(tǒng)行業(yè)企業(yè),雖然有豐富的數(shù)據(jù),但對(duì)于AI沒有深度的理解,并不清楚AI的工作流是如何進(jìn)行的,并且在數(shù)據(jù)結(jié)合模型的時(shí)候,通過什么樣的方式,能夠?qū)⑦@些行業(yè)Know-How更好地“喂”給AI。這些過程都具有很強(qiáng)的專業(yè)性。但從另一個(gè)維度上看,這個(gè)過程中本身還是依賴于數(shù)據(jù)。

這兩個(gè)方面缺一不可:一方面,企業(yè)需要擁有大量的原始的、高質(zhì)量的數(shù)據(jù),另一方面,企業(yè)需要知道如何將這些組織在一起。

很多時(shí)候,行業(yè)模型并不是垂直大模型,加一些行業(yè)數(shù)據(jù)的微調(diào)就能解決的。而是需要在模型架構(gòu)上,進(jìn)行針對(duì)性的設(shè)計(jì),核心要求是:最適合業(yè)務(wù)場(chǎng)景的模型,這就需要很多Know-How。

所以,我認(rèn)為初創(chuàng)企業(yè)與傳統(tǒng)企業(yè)的協(xié)同缺一不可。一方面,傳統(tǒng)企業(yè)有大量原始數(shù)據(jù),但是僅憑這些原始數(shù)據(jù)也不足以支撐在AI落地方面走得更快;另一方面,初創(chuàng)企業(yè)對(duì)于如何利用好這些數(shù)據(jù),有著更充分的理解,結(jié)合在一起才能走得更好。

包括在企業(yè)組織架構(gòu)問題方面,我也覺得是一個(gè)非常關(guān)鍵的問題。因?yàn)槿司哂幸欢ǖ亩鄻有?,允許在業(yè)務(wù)中存在模糊空間,但AI需要有一個(gè)非常精準(zhǔn)的定位。所以,原先一個(gè)人的工作,需要拆分成幾個(gè)不同的業(yè)務(wù)流,專門干某一項(xiàng)工作。然后再用比較高效的方式,將這些工作流組織起來。這就需要企業(yè)管理層對(duì)業(yè)務(wù)流程有著清晰的認(rèn)知,并不是有一個(gè)AI應(yīng)用,就能將原先的員工取代了。從這個(gè)維度上看,就需要企業(yè)創(chuàng)新組織形式,適應(yīng)AI的能力。

我們也觀察到,有一些行業(yè),行業(yè)的組織方式在AI的影響下,正在發(fā)生變化。比如醫(yī)療行業(yè)。AI加入到醫(yī)療行業(yè)中,與原先的醫(yī)生、醫(yī)護(hù)是一個(gè)什么樣的協(xié)同方式,甚至是收費(fèi)方式,可能都需要進(jìn)行一些調(diào)整。從這個(gè)角度出發(fā),有一些業(yè)態(tài)需要改變,并不是基于原來的模式,能實(shí)現(xiàn)AI的原位替代。

從組織形式上講,我認(rèn)為傳統(tǒng)行業(yè)的行業(yè)Know-How與對(duì)AI有深度理解的團(tuán)隊(duì)人員都是必要的。只有這兩種員工組合在一起,才能在AI落地這件事上,走的比較快。

章磊:我補(bǔ)充一下。在硅谷有一家專門賣“專家”的公司發(fā)展得非常快。他們擁有醫(yī)療、法務(wù)、制造、工程等在內(nèi)的多個(gè)行業(yè)的專家,然后同時(shí)還具備一個(gè)特點(diǎn)——這些專家又同時(shí)懂一些基礎(chǔ)算法知識(shí)。這些專家知道如何能將業(yè)務(wù)知識(shí)轉(zhuǎn)化為可訓(xùn)練的數(shù)據(jù),進(jìn)而在企業(yè)內(nèi)部打造AI能力。

基于此,我覺得,未來,無論是星塵,還是企業(yè)側(cè),AI的發(fā)展需要“雙料冠軍”,這種人才既非常懂業(yè)務(wù),又知道如何將行業(yè)Know-How轉(zhuǎn)化成AI能吸收的知識(shí)和數(shù)據(jù)。星塵數(shù)據(jù)也已經(jīng)開始搭建專家人才網(wǎng)絡(luò),其中不乏一些行業(yè)資深的專家。

因?yàn)槲覀兛吹?,越來越多的客戶,核心業(yè)務(wù)人員十分忙碌,在這個(gè)過程中,我們?nèi)绾文軌蚩焖俚赝ㄟ^我們自己的專家了解到企業(yè)業(yè)務(wù)方向,并且能快速地將這個(gè)方向翻譯成AI的訓(xùn)練數(shù)據(jù),就相當(dāng)于我們給客戶搭建了一個(gè)專家團(tuán)隊(duì),快速地抽取出企業(yè)業(yè)務(wù)知識(shí),轉(zhuǎn)化為搭建AI模型需要的。這個(gè)過程就能看到數(shù)據(jù)公司在其中的價(jià)值。

當(dāng)然,光有懂算法的老師傅還不夠,企業(yè)還需要工具鏈,以及一套完整的工具流,推動(dòng)AI應(yīng)用落地。這也是我們搭建MorningStar平臺(tái)的原因,也是我們面向未來AI和AI數(shù)據(jù)機(jī)遇的一個(gè)布局。

萬寧:企業(yè)在落地AI應(yīng)用過程中,最值得關(guān)注的問題有哪些?(面向企業(yè)CIO管理層)

章磊:第一個(gè)是,企業(yè)管理層真的準(zhǔn)備好了么?真的搭建了一個(gè)AI First的企業(yè)文化了么?如果只是嘴上喊口號(hào)說“我們要用AI”,那永遠(yuǎn)不會(huì)成功。AI First的企業(yè)文化意味著,企業(yè)的保障制度、激勵(lì)措施、資源分配,還有基礎(chǔ)設(shè)施等方面的準(zhǔn)備都需要到位。

第二個(gè)是,企業(yè)是否愿意為了“AI信仰一躍”。這句話的意思是:之前在互聯(lián)網(wǎng)時(shí)代(或者說在AI之前的所有時(shí)代),人類的商業(yè)行為依賴于計(jì)劃、執(zhí)行,然后驗(yàn)收。但在AI時(shí)代,企業(yè)不知道需要投入多少,但是得在基礎(chǔ)設(shè)施、人才、數(shù)據(jù)、訓(xùn)練成本等方面進(jìn)行投入,成本是不可忽視的一部分。企業(yè)的AI落地就像ChatGPT時(shí)代一樣,在看不見確定性成果的前提下,企業(yè)愿不愿意為了信仰而不斷前行。如果企業(yè)就抱著“我先花幾十萬試試”的態(tài)度,那是一種玩法;另外一種是——企業(yè)就抱著“背水一戰(zhàn)”的態(tài)度,一定要將AI落地,那又是一種玩法。

萬寧:丁總,如果您作為提問者,在面向數(shù)字化領(lǐng)導(dǎo)者(CIO)提問的時(shí)候,關(guān)于AI落地過程中,需要注意的方面,您會(huì)提出哪些問題?

丁昳婷:我可能更多的從對(duì)數(shù)據(jù)認(rèn)知的角度進(jìn)行提問。這其中有一個(gè)實(shí)際的挑戰(zhàn)是:像星塵數(shù)據(jù)這樣的涉及AI業(yè)務(wù)的公司,在出海的過程中,面臨著數(shù)據(jù)規(guī)范、數(shù)據(jù)安全的挑戰(zhàn)。

這就引出了一個(gè)實(shí)操的問題,比如一些大型互聯(lián)網(wǎng)公司出海的過程中,在當(dāng)?shù)氐臄?shù)據(jù),用什么的方式能夠比較合理地被一家中國(guó)的互聯(lián)網(wǎng)公司納入到模型體系中,然后再為當(dāng)?shù)氐目蛻暨M(jìn)行服務(wù)。越是像醫(yī)療、金融這種比較核心的層面的企業(yè)越會(huì)遇見類似的問題。

比如,企業(yè)將來希望具備全球化復(fù)制的能力,在國(guó)內(nèi)已經(jīng)將模型初步打磨好,在海外就需要注意如何能夠更好的完成模型、Know-How的跨境,需要注意的點(diǎn),這是出海企業(yè)面臨的共性問題。

萬寧:對(duì),AI倫理和合規(guī)的話題,已經(jīng)不是選擇題,而是必答題。未來,所有企業(yè)都希望成為全球化的企業(yè),在這個(gè)層面,就需要企業(yè)在一開始底層業(yè)務(wù)邏輯上就需要考慮這個(gè)話題。而在這個(gè)方面做好相關(guān)戰(zhàn)略的規(guī)劃,已經(jīng)是企業(yè)當(dāng)下需要考慮的問題。

 評(píng)!加入創(chuàng)新場(chǎng)景50榜單評(píng)選

2025年度「創(chuàng)新場(chǎng)景 TOP 50」榜單評(píng)選征集啟動(dòng)

申報(bào)日期:即日起~8月22日止

公開投票及專家評(píng)審:2025年8月23日起~8月31日止

申報(bào)鏈接:https://m.tmtpost.com/post/cj50(請(qǐng)使用PC端申報(bào),暫不支持手機(jī)端)

本文系作者 Leo張ToB雜談、數(shù)字價(jià)值觀察室 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請(qǐng)注明出處、作者和本文鏈接。
本內(nèi)容來源于鈦媒體鈦度號(hào),文章內(nèi)容僅供參考、交流、學(xué)習(xí),不構(gòu)成投資建議。
想和千萬鈦媒體用戶分享你的新奇觀點(diǎn)和發(fā)現(xiàn),點(diǎn)擊這里投稿 。創(chuàng)業(yè)或融資尋求報(bào)道,點(diǎn)擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評(píng)論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論

請(qǐng) 登錄后輸入評(píng)論內(nèi)容
  • 業(yè)務(wù)人員沒時(shí)間搞 AI,企業(yè)機(jī)制得改改了。

    回復(fù) 2025.08.14 · via iphone
  • 星塵數(shù)據(jù)的平臺(tái)能解決 “幻覺”,真有這么厲害?

    回復(fù) 2025.08.14 · via iphone
  • 企業(yè)落地 AI 別單打獨(dú)斗,找外部幫忙更靠譜。

    回復(fù) 2025.08.14 · via android
  • AI 還得靠人類數(shù)據(jù),幾十年內(nèi)都離不開人啊。

    回復(fù) 2025.08.14 · via pc
  • 小模型要是數(shù)據(jù)好,也能解決大問題呢。

    回復(fù) 2025.08.14 · via android
  • 企業(yè)管理層不重視,AI 落地就是空談。

    回復(fù) 2025.08.14 · via h5
  • 企業(yè)落地 AI 缺耐心可不行,得一步一步來才行。

    回復(fù) 2025.08.14 · via pc
  • 制造業(yè)多模態(tài)數(shù)據(jù),RAG 搞不定就得想新招。

    回復(fù) 2025.08.14 · via iphone
  • 傳統(tǒng)行業(yè)加 AI,機(jī)會(huì)是多,但落地不容易。

    回復(fù) 2025.08.14 · via h5
  • 法務(wù)行業(yè)用 AI 寫合同,還得慢慢迭代完善。

    回復(fù) 2025.08.14 · via android
更多評(píng)論

快報(bào)

更多

17:51

阿里通義:CoPaw 1.0正式發(fā)布

17:45

上海國(guó)際能源交易中心對(duì)部分客戶采取限制開倉監(jiān)管措施

17:45

南向資金今日凈買入約7.03億港元

17:43

玻色量子獲10億元B輪融資

17:42

平高電氣:合計(jì)中標(biāo)約12.23億元國(guó)家電網(wǎng)采購(gòu)項(xiàng)目

17:38

鄭商所發(fā)布2026年清明節(jié)休市期間風(fēng)險(xiǎn)提示的函

17:34

美以襲擊致霍爾木茲海峽一海水淡化廠受損

17:33

4月3日-7日期間香港入境處預(yù)計(jì)約有644萬人次進(jìn)出香港

17:30

神劍股份:公司商業(yè)航天業(yè)務(wù)相關(guān)收入占比較小

17:27

上海至塔什干直航航線成功首航

17:23

煌上煌:控股股東一致行動(dòng)人終止協(xié)議轉(zhuǎn)讓部分股份

17:23

國(guó)內(nèi)航線燃油附加費(fèi)4月5日起上漲5倍

17:22

建設(shè)銀行:首席財(cái)務(wù)官生柳榮因年齡原因辭任

17:21

滬深交易所公布2026年清明節(jié)休市安排

17:18

央行:外匯市場(chǎng)供求基本平衡,人民幣匯率在合理均衡水平上保持基本穩(wěn)定

17:17

央行:推動(dòng)中小銀行聚焦主責(zé)主業(yè),增強(qiáng)銀行資本實(shí)力

17:14

央行:要繼續(xù)實(shí)施適度寬松的貨幣政策,促進(jìn)經(jīng)濟(jì)穩(wěn)定增長(zhǎng)和物價(jià)合理回升

17:14

央行:建議發(fā)揮增量政策和存量政策集成效應(yīng),加強(qiáng)貨幣政策調(diào)控

17:11

貝殼省心租上海在管房源突破10萬套

17:08

盛屯礦業(yè):一季度凈利同比預(yù)增226.27%-294.95%

30

掃描下載App