英博數(shù)科總經(jīng)理周韡韡
以下是周韡韡演講實(shí)錄,略經(jīng)鈦媒體APP編輯:
各位嘉賓,各位行業(yè)大咖,大家上午好!我是英博數(shù)科CEO,也是北京AI創(chuàng)新賦能中心的負(fù)責(zé)人周韡韡。首先在這里要感謝福州市鼓樓區(qū)區(qū)委、區(qū)政府,感謝這次大會(huì)給我們新興企業(yè)這么好的展示平臺(tái)和承辦會(huì)議的機(jī)會(huì),再次感謝各位領(lǐng)導(dǎo)的支持。
我們今天的主題是算力時(shí)代,算力是最近這個(gè)階段在我們生活中高頻出現(xiàn)的一個(gè)詞語(yǔ)。究竟什么是算力?算力能給我們普通人的生產(chǎn)生活帶來(lái)什么改變?我想并不是那么多人都能像展院長(zhǎng)那樣講得如此清楚。于是帶著這樣的疑問(wèn),我希望今天借福州有福之州這塊寶地,與英博數(shù)科的虛擬管培生小e聊一聊這個(gè)問(wèn)題。
小e是英博數(shù)科在與ChatGPT2.5的同源環(huán)境下、使用了Megatron訓(xùn)練框架、利用我們北京AI創(chuàng)新賦能中心的冗余算力和自行研發(fā)的語(yǔ)料,去訓(xùn)練出來(lái)的一個(gè)算是小參數(shù)AIGC內(nèi)容生成式的聊天機(jī)器人。前面這一串話(huà)或許很抽象,那我們不如現(xiàn)場(chǎng)直接請(qǐng)小e來(lái)介紹一下自己:![]()
小e現(xiàn)場(chǎng)演示畫(huà)面
這看似很簡(jiǎn)單的問(wèn)題,其實(shí)是目前國(guó)內(nèi)鑒定ChatGPT真?zhèn)蔚恼昭R,因?yàn)橛泻芏嗥髽I(yè)只不過(guò)是接入了美國(guó)OpenAI的端口,就號(hào)稱(chēng)自己掌握了這個(gè)技術(shù),所以聊天機(jī)器人在面臨這樣問(wèn)題的時(shí)候,通常會(huì)回答我是OpenAI,或者來(lái)自谷歌,但還好,我們小e知道它是來(lái)自英博數(shù)科的AI助理??磥?lái)對(duì)人類(lèi)的終極問(wèn)題“我是誰(shuí)“的這個(gè)問(wèn)題,小e回答的還OK。
其實(shí)我們今天在這里,應(yīng)該說(shuō)是國(guó)內(nèi)的第一場(chǎng)以現(xiàn)場(chǎng)直播,而不是錄播的形式,來(lái)展示企業(yè)對(duì)ChatGPT研究的實(shí)際應(yīng)用。
我們?cè)賳?wèn)一下小e你怎么理解算力,怎么看待算力時(shí)代下英博數(shù)科的挑戰(zhàn)與機(jī)遇。這個(gè)問(wèn)題有一點(diǎn)長(zhǎng),而且這個(gè)問(wèn)題里面有復(fù)合性以及一系列的疊加性的問(wèn)題。我們來(lái)看一下小e的回答是什么樣。![]()
小e現(xiàn)場(chǎng)演示畫(huà)面
我們稱(chēng)ChatGPT叫做AIGC生成式,就是強(qiáng)調(diào)從訓(xùn)練的開(kāi)始就使用深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò),像我們?nèi)艘粯?,?duì)同一個(gè)問(wèn)題,多次的詢(xún)問(wèn)是可以給出多個(gè)答案的,這個(gè)是非常大區(qū)別于我們常見(jiàn)的智能客服。在此我們不如就這個(gè)問(wèn)題再問(wèn)她一次,看她是給一樣還是不一樣的答案。小e,請(qǐng)問(wèn)你如何理解算力時(shí)代下英博數(shù)科的挑戰(zhàn)和機(jī)遇? ![]()
小e現(xiàn)場(chǎng)演示畫(huà)面
我們看到她給出了一個(gè)略有不同,但有很高相似度的答案,這說(shuō)明我們的小e目前已經(jīng)具備了一定的創(chuàng)造力,但肯定還存在繼續(xù)訓(xùn)練和改進(jìn)的空間的。因?yàn)闀r(shí)間關(guān)系,我們今天在這里對(duì)小e的展示就暫時(shí)到這個(gè)段落,在這次數(shù)字中國(guó)的主展區(qū)是有小e的展臺(tái)的,感興趣的朋友可以到展區(qū)與小e做更多直接的互動(dòng),我們也非常歡迎大家通過(guò)掃碼的方式關(guān)注英博數(shù)科的公眾號(hào),在里面可以在后臺(tái)去申請(qǐng)小e的免費(fèi)測(cè)試帳號(hào)。
相信通過(guò)簡(jiǎn)單的展示大家就可以感受到為什么ChatGPT在當(dāng)下如此的火爆。在過(guò)去二十年里,互聯(lián)網(wǎng)從端到端的時(shí)代進(jìn)入到移動(dòng)互聯(lián)網(wǎng)時(shí)代,再到現(xiàn)在元宇宙的時(shí)代,是涌現(xiàn)了大量?jī)?yōu)秀應(yīng)用的,可是為什么這些應(yīng)用不能像ChatGPT一樣給我們帶來(lái)如此高的關(guān)注度和震撼感?我覺(jué)得這里可以借用合作伙伴的一個(gè)描述:這個(gè)技術(shù)從出生之后到現(xiàn)在的100多天的時(shí)間里,幾乎每天都在帶來(lái)一個(gè)對(duì)自己革命性、顛覆性的升級(jí)提升,從來(lái)沒(méi)有過(guò)任何一款應(yīng)用能夠像ChatGPT一樣,給每個(gè)C端用戶(hù)帶來(lái)如此鋪面而來(lái)的、直觀的沖擊力和震撼感受。
看過(guò)剛才小e的回答之后,我在這里也給大家分享下,小e已經(jīng)是參與到英博數(shù)科目前很多的內(nèi)容文案創(chuàng)作工作中,比如兩周之前我們給另外一個(gè)福建當(dāng)?shù)卣峁┑闹撬阒行慕ㄔO(shè)規(guī)劃,在一周內(nèi)1萬(wàn)多字的文案出了5個(gè)不同的版本,就是在小e的幫助下完成的,這對(duì)我們普通人類(lèi)工作人員來(lái)講的話(huà)會(huì)是一個(gè)很大的挑戰(zhàn)。我們可以看到用自然語(yǔ)言方式與我們溝通的AI已經(jīng)不再是工具屬性,而更是一個(gè)陪伴屬性。我們可以看到在不久的將來(lái),這種訪(fǎng)問(wèn)鏈接一定是會(huì)被陪伴所取代,我們常見(jiàn)免費(fèi)的廣告一定是會(huì)被優(yōu)質(zhì)的付費(fèi)內(nèi)容所取代。有了ChatGPT之后,我們每個(gè)人就等于擁有了一個(gè)無(wú)處不在,而且是無(wú)所不知的隨身助理,一個(gè)人加上一個(gè)OpenAI這樣類(lèi)型的ChatGPT,就可以完成一個(gè)項(xiàng)目,甚至可以開(kāi)辦一個(gè)公司。這樣的生產(chǎn)效率提升,可以說(shuō)是又一場(chǎng)工業(yè)革命的開(kāi)始。
當(dāng)然,這樣顛覆性技術(shù)的研發(fā)是有非常高的難度系數(shù)的,有多難?即使像臉書(shū)這樣的企業(yè),哪怕是努力再努力,投入了那么多人力和財(cái)力之后,似乎做出來(lái)的應(yīng)用也不是那么理想。是什么樣的原因能夠給英博數(shù)科這樣新型的公司有這種挑戰(zhàn)大模型、挑戰(zhàn)自然語(yǔ)言處理、挑戰(zhàn)多模態(tài)的勇氣和底氣?應(yīng)該是算力,是目前我們北京AI創(chuàng)新賦能中心是國(guó)內(nèi)少有的可以提供專(zhuān)業(yè)AI訓(xùn)練,特別是針對(duì)大模型的GPU訓(xùn)練環(huán)境的公共算力服務(wù)平臺(tái)。
其實(shí)在去年我們投建的時(shí)候是面臨一個(gè)抉擇的,究竟是選擇數(shù)字基建先行還是選擇應(yīng)用的集成先行,在做選擇過(guò)程中如果做數(shù)據(jù)基建勢(shì)必面臨非常重度的資金投資,如果是做集成則有可能是投資更輕,且?guī)?lái)的市場(chǎng)關(guān)注度也會(huì)更高。帶著這個(gè)疑問(wèn),我與我們的顧問(wèn),也是剛剛的演講嘉賓數(shù)字中國(guó)研究院的展院長(zhǎng)做了一次溝通,他一句話(huà)就點(diǎn)醒了我,他說(shuō)“如果算力不自由,則數(shù)據(jù)無(wú)意義,更多的應(yīng)用就無(wú)法落地,無(wú)法產(chǎn)生“。所以,當(dāng)時(shí)我們就毫不猶豫選擇了重度投資之路,先投建了北京AI創(chuàng)新賦能中心,現(xiàn)在不到一年時(shí)間回過(guò)頭看,再由ChatGPT和大模型引爆市場(chǎng)對(duì)算力的渴求,尤其是對(duì)高端人工智能算力渴求的市場(chǎng)的當(dāng)下,這個(gè)選擇毫無(wú)疑問(wèn)是非常的正確。而且算力的重要性也越來(lái)越被更多人所接受。在之前清華大學(xué)、浪潮,和國(guó)際上IDC研究院所推出的報(bào)告中,算力指數(shù)已經(jīng)成為繼ChatGPT指數(shù)之后另外一個(gè)全球公認(rèn)對(duì)區(qū)域經(jīng)濟(jì)發(fā)展的衡量指標(biāo),大家都認(rèn)為在區(qū)域經(jīng)濟(jì)中每一元錢(qián)對(duì)算力的投入可以帶來(lái)GDP三到四元錢(qián)的增長(zhǎng),這也是為什么在最近數(shù)字中國(guó)建設(shè)規(guī)劃中政府明確指出對(duì)于夯實(shí)算力基礎(chǔ)設(shè)施以及算力基礎(chǔ)設(shè)施建設(shè)的程度被列為各地方政府明確的業(yè)績(jī)考核的指標(biāo),因?yàn)檫@一種通過(guò)市場(chǎng)化運(yùn)營(yíng)的算力是真正能夠幫助到AI創(chuàng)新型企業(yè)的發(fā)展、真正助力到地區(qū)產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型的。根據(jù)我們這一次協(xié)辦方鈦媒體之前的媒體報(bào)道,我們國(guó)家在過(guò)去若干年,對(duì)算力和數(shù)據(jù)中心的市場(chǎng)投入超過(guò)8萬(wàn)億,可是我們市場(chǎng)仍然面臨著一個(gè)算力短缺的問(wèn)題,這究竟是什么原因?因?yàn)樵谝酝覀兊乃懔Υ蟛糠滞督ǖ臄?shù)據(jù)中心都是以溫冷數(shù)據(jù)的存調(diào)中心為主,就是我們常使用的貴州云、蘋(píng)果云這樣的平臺(tái),在這樣的平臺(tái)存儲(chǔ)型的算力對(duì)AI當(dāng)下的發(fā)展的滿(mǎn)足程度非常的有限。應(yīng)該說(shuō)市場(chǎng)上的算力短缺是一個(gè)相對(duì)的概念,其實(shí)是指在AI上的算力短缺,這種短缺情況還在逐步加劇:市場(chǎng)上的算力需求是每三到四個(gè)月可以翻一倍的情況,而根據(jù)我們AI創(chuàng)新賦能中心平臺(tái)上的實(shí)際反饋,我們的客戶(hù)模型的規(guī)模幾乎是每個(gè)月就會(huì)增長(zhǎng)3到4倍的情況。
在這樣的情況下,我們是要把之前的這些存儲(chǔ)型的算力通過(guò)數(shù)據(jù)中心的升級(jí)改造變成更多可以直接轉(zhuǎn)化成AI時(shí)代生產(chǎn)效率的算力。我們北京的100P算力在一期投建完成之后,短短的時(shí)間內(nèi)已全部售罄,目前我們正在計(jì)劃一個(gè)30到40倍的規(guī)模擴(kuò)容,而且這一部分的算力,80%以上現(xiàn)在都已經(jīng)被售出了。
講到這些的時(shí)候會(huì)有在座嘉賓好奇,算力需求如此火爆,你為什么還有冗余的算力去訓(xùn)練小e?我覺(jué)得這個(gè)問(wèn)題也是市場(chǎng)和很多調(diào)研機(jī)構(gòu)在跟我們私下溝通的時(shí)候經(jīng)常會(huì)問(wèn)到的問(wèn)題。這里可以向大家介紹我們接下來(lái)工作中的重中之重:我們即將推出的搏博云服務(wù)(BOB Cloud)的解決方案。算力需求是不會(huì)一直處于一個(gè)峰值狀態(tài)的,就像在電力系統(tǒng)中,我們會(huì)對(duì)電力進(jìn)行削峰填谷和平衡調(diào)度,這種方式在算力的服務(wù)上也同樣適用。我們?cè)谶@個(gè)階段搏博云上首先要滿(mǎn)足的是通過(guò)善用彈性計(jì)算,來(lái)進(jìn)行一個(gè)對(duì)GPU的云調(diào)度,例如在一臺(tái)5P GPU算力的服務(wù)器上,就可以實(shí)現(xiàn)56個(gè)實(shí)例同時(shí)并行訓(xùn)練。在下一個(gè)階段,根據(jù)我們了解到的大模型客戶(hù)的一些痛點(diǎn),這些大模型客戶(hù)在面對(duì)GPU計(jì)算需求的時(shí)候會(huì)把任務(wù)放在不同的云平臺(tái)上進(jìn)行,比如放在阿里云一個(gè)模型,同時(shí)另外一個(gè)是放在亞馬遜云的,這也是為了他們本身的項(xiàng)目安全。在這樣的情況下,跨云的溝通成為了一個(gè)剛性的需求,而且人工智能的算力在進(jìn)行GPU訓(xùn)練的時(shí)候也要面臨大量的CPU對(duì)數(shù)據(jù)的清洗和管理的工作。在這個(gè)時(shí)候如何協(xié)同CPU和GPU的高效協(xié)同和訓(xùn)練效果,就成為我們客戶(hù)的一個(gè)必須的剛性需求,這個(gè)也是我們接下來(lái)的搏博云需要解決的跨云溝通,和在GPU和CPU上協(xié)調(diào)訓(xùn)練的需求。
目前在北京AI創(chuàng)新賦能中心和搏博云的平臺(tái)上,已經(jīng)有包括例如自動(dòng)駕駛、量化交易訓(xùn)練等這樣的大模型訓(xùn)練,這些全球頂尖解決方案客戶(hù)的入駐已經(jīng)帶來(lái)了大量實(shí)際應(yīng)用。我們也特別期待通過(guò)我們對(duì)算力的擴(kuò)容,通過(guò)我們加強(qiáng)自己的交互的能力,能夠早日實(shí)現(xiàn)平臺(tái)用戶(hù)和更多創(chuàng)新型企業(yè)的算力自由,早日看到他們能出現(xiàn)對(duì)標(biāo)工業(yè)時(shí)代像飛機(jī)、輪船、火車(chē)這樣的跨時(shí)代的大模型應(yīng)用的出現(xiàn),早日真正實(shí)現(xiàn)我們國(guó)家企業(yè)的算力自由,也早日實(shí)現(xiàn)我們英博數(shù)科的企業(yè)夢(mèng)想:匯聚全球頂尖科技,助力中國(guó)產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型。
以上是我的分享。謝謝各位!
快報(bào)
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論
終于搶到你