NPC對話(圖片來源:鈦媒體APP作者拍攝)

“我正在尋找馬丁-萊恩先生,他告訴我正住在這間酒店,我有急事,請你幫我聯(lián)系他,謝謝!”我說到。

“非常理解您焦急的心情,但是處于對酒店客人隱私的保護(hù),我無法提供這位客人的信息給您,很抱歉。”前臺服務(wù)員表示。

“我知道馬丁-萊恩先生在這里寄存了東西,我是受到他委托來取走的,請你把它交給我吧。”我說到。

“好的,那您可以將行李寄存的寄存單給我嗎?如果沒有寄存單的話,可以讓馬丁-萊恩先生給禮賓部打電話,告知我們將東西給您。”

以上兩段對話,聽起來很像是摘取自某部小說或者是電影、游戲內(nèi)容的固定臺詞,但它們竟然出自人與電腦的語音交流。

AI讓游戲NPC“活”過來了

更準(zhǔn)確地說,上述這些對話是玩家與游戲NPC的交流,只不過游戲流程中既沒有固定邏輯腳本也沒有預(yù)設(shè)提問、回答選項(xiàng)。玩家唯一要做的就是想盡辦法與電腦“套話”獲取信息。

電腦的目標(biāo)則是確認(rèn)玩家的身份確實(shí)與目標(biāo)人物相關(guān),在此之前,它們則要盡一切可能保守秘密。換句話說,這場對決其實(shí)是人腦與電腦間的“智力與信息的攻防游戲”,而驅(qū)動(dòng)這臺電腦的背后技術(shù)正是當(dāng)下被所有行業(yè)集中討論的“生成式AI”。

ACE技術(shù)演示(圖片來源:鈦媒體APP作者拍攝)

ACE技術(shù)演示(圖片來源:鈦媒體APP作者拍攝)

早在去年的COMPUTEX展會(huì)上,英偉達(dá)就推出了ACE(Avatar Cloud Engine)技術(shù),旨在通過生成式AI為游戲中的非玩家角色(NPC)帶來智能對話和互動(dòng)功能,如今大家看到的正是最新的DEMO演示。

與過去采用固定語句、動(dòng)作與玩家交互的方式相比,利用NeMo語言模型,ACE可以創(chuàng)建能夠進(jìn)行自然語言對話的NPC。這些NPC不僅能理解玩家的輸入,還能根據(jù)特定的背景和情境生成合適的回應(yīng),比如上文提到的各個(gè)角色會(huì)進(jìn)行符合身份的回答,并且在稱謂、回答內(nèi)容上也會(huì)更加貼合真實(shí)場景。

對于ACE技術(shù)的出現(xiàn),最大的意義在于可以幫助游戲內(nèi)容制作者打破“線性”敘事的框架,也就是說,所有的游戲內(nèi)容并不需要按照固定的內(nèi)容流程完成。玩家可以充分發(fā)揮自己的想象,甚至可以顛倒任務(wù)的前后順序,只要圍繞最終目標(biāo)即可,但這僅限于推理類的游戲,因?yàn)榇祟愑螒蛑蠳PC的重要性更高。

那對于其他游戲而言,如果擁有開放式世界設(shè)定,也會(huì)在ACE技術(shù)上收益很大,因?yàn)槊恳晃籒PC都擁有了自身的“思維”而不是傳統(tǒng)的固定邏輯,每天重復(fù)一樣的事情。相比之下,過去的游戲就如同電影《楚門的世界》一樣,只有玩家一個(gè)人可以嘗試去靈活處置,而在ACE技術(shù)的加持下,玩家想出來的各種騷操作,電腦都有辦法應(yīng)對。

想象很美好,對吧?但就如同每次游戲畫質(zhì)的展示DEMO一樣,回看2012年的虛幻4引擎展示,現(xiàn)在很多3A大作可能都還無法達(dá)到它的水平,ACE技術(shù)的應(yīng)用也是如此,它的條件還是非??量痰模F(xiàn)階段對線上同時(shí)在線的玩家數(shù)量、網(wǎng)絡(luò)帶寬等都有著嚴(yán)苛的要求。

據(jù)英偉達(dá)工作人員介紹,想要獲得與NPC的實(shí)時(shí)溝通體驗(yàn),專線網(wǎng)絡(luò)是必備選項(xiàng),同時(shí)在線的玩家數(shù)量也要控制在個(gè)位數(shù),這對于一款商業(yè)游戲而言,是完全不可接受的。

那想要擴(kuò)大玩家接入量,對于游戲開發(fā)商而言,就需要更強(qiáng)的云端算力作為支撐,但在整個(gè)游戲內(nèi)容的制作過程中,是否應(yīng)該為NPC配置如此重量的資源以及它能夠帶給玩家的反饋提升,都是現(xiàn)階段面臨的問題。所以說,ACE技術(shù)確實(shí)展現(xiàn)出了一個(gè)能夠讓游戲NPC“活”過來的辦法。

AI PC成為數(shù)字時(shí)代的“神筆”

“神筆馬良”是很多人都聽過的中國童話故事,馬良在獲得神筆后,能夠把自己的畫作變成真正的物件。而在AI時(shí)代,PC反而成為了“神筆”的化身。一方面,Stable Diffusion等工具可以將文字表述變成圖像,這樣就可以將腦中的構(gòu)想通過最簡單的方式呈現(xiàn)為畫作,即便是沒有繪畫天賦的人也可以做到。

以英偉達(dá)目前的消費(fèi)級旗艦產(chǎn)品RTX 4090 D為例,作為市面上最快的Stable Diffusion計(jì)算出圖方案,它可以支持每秒8張圖的生成速度。使用當(dāng)前最快的Stable Diffusion 加速方法TensorRT,再配合開發(fā)者進(jìn)一步的性能優(yōu)化,目前RTX 4090 D GPU最高能實(shí)現(xiàn)每秒超過100張圖的生成速度。

這是什么概念呢?路邊的肖像速寫,應(yīng)該是日常能夠接觸到的比較快速的繪畫出圖方式,而畫成一幅人像作品的時(shí)間,通常在10分鐘左右。在同樣時(shí)間內(nèi),Stable Diffusion生成的圖片數(shù)量(以每秒8張計(jì)算),已經(jīng)足夠支持組合為每秒30幀的視頻播放兩分半鐘,而圖片數(shù)量則是整整的4800張。

利用本地算力實(shí)現(xiàn)圖生圖(圖片來源:鈦媒體APP作者拍攝)

利用本地算力實(shí)現(xiàn)圖生圖(圖片來源:鈦媒體APP作者拍攝)

當(dāng)然,AI PC的能力不僅僅體現(xiàn)在文生圖上,圖生圖的應(yīng)用也很有趣,比如通過人像生成控制模型InstantID,就快速通過搭載RTX 4090 D的RTX AI PC上由普通攝像頭的自拍照生成高質(zhì)量影棚級別的肖像照,別的場景不說,至少筆者認(rèn)為對很多以拍證件照作為主要盈利手段的小攝像館來說,這項(xiàng)功能絕對是“搶飯碗”的利器。

應(yīng)該說,更快的生圖速度、更廣泛的生圖應(yīng)用,其實(shí)也沒有什么稀奇的,畢竟不是每一張圖片都能符合預(yù)期。而且玩過AI生圖的人都知道,生成的圖片質(zhì)量參差不齊,總是需要不斷修改、不斷嘗試才能獲得基本滿意的效果,而繪畫則不同,往往在起筆時(shí)就已經(jīng)有了大概方向,途中也可以進(jìn)行小范圍的調(diào)整。

但鈦媒體APP認(rèn)為,AI生圖應(yīng)用出現(xiàn),最大改變在于把繪畫的門檻降低了,同時(shí)也進(jìn)一步解放了人們腦中的萬千創(chuàng)意,像“科幻元素“的作品,大眾普遍能夠輸出的目前只包括文字部分,你可以把天馬行空的想法“寫”下來。

文字表述自然有其任憑讀者想象優(yōu)勢,但在直觀性上也恰恰受到了限制。因此很多科幻小說作品,比如《三體》《沙丘》等等,文字的描寫在精妙,也會(huì)有很多超出讀者想象的畫面,而將這些作品影視化改編,其所付出的成本卻又高的離譜,那么,通過AI繪圖,是不是劉慈欣就可以簡單描繪一下他心中的《三體》了呢?這是很有可能的。

其實(shí),當(dāng)前已經(jīng)有很多設(shè)計(jì)師、藝術(shù)家,設(shè)法將生成式AI提供的“想法落地為現(xiàn)實(shí)”能力轉(zhuǎn)變?yōu)樽陨淼纳a(chǎn)力。

設(shè)計(jì)應(yīng)用(圖片來源:鈦媒體APP作者拍攝)

設(shè)計(jì)應(yīng)用(圖片來源:鈦媒體APP作者拍攝)

像在建筑設(shè)計(jì)領(lǐng)域,即時(shí)AI基于擴(kuò)散模型和蒸餾技術(shù),通過RTX GPU的加速,實(shí)現(xiàn)了AI實(shí)時(shí)繪畫,屏幕前的設(shè)計(jì)師只需要勾勒出簡單的線條,AI就能幫助根據(jù)目標(biāo)風(fēng)格繪制出具體的概念圖,設(shè)計(jì)師可以花更多時(shí)間集中在想法上,而不是如何把一個(gè)有趣的想法,一筆一筆“畫”出來。

所以說,AI PC的生產(chǎn)力屬性,真的在繪畫這件事上表現(xiàn)的淋漓盡致。一方面,它確實(shí)大大降低了繪畫的門檻,無需掌握具體的繪畫手法、色彩選擇,這些都由AI完成,人們只需要專注于“想法”。

另一方面,其在行業(yè)中的滲透和落地應(yīng)用潛力也是更加直接的,ChatGPT也許什么都能干,但通過它,很難直接創(chuàng)造商業(yè)價(jià)值,但對于藝術(shù)家、設(shè)計(jì)師來說,提升幾十上百倍的出圖效率和“想法預(yù)覽”確實(shí)能夠直接轉(zhuǎn)化為生產(chǎn)力。

視頻會(huì)議、游戲場景,AI PC無處不在

很有意思的一點(diǎn)是,目前行業(yè)內(nèi)對AI PC的定義也有著不小的分歧,如果按照英特爾的說法,2023年底AI PC才出現(xiàn),2024年是AI PC元年,而對于微軟、高通來說,似乎AI PC又是2024年剛剛推出的新物種。

英偉達(dá)對AI PC的規(guī)劃(圖片來源:鈦媒體APP作者拍攝)

英偉達(dá)對AI PC的規(guī)劃(圖片來源:鈦媒體APP作者拍攝)

但如果要追溯到更早,實(shí)際上英偉達(dá)于2018年就推出了RTX技術(shù)和首款專為 AI 打造的消費(fèi)級GPU芯片 (GeForce RTX) 。在他們看來,AI PC 是搭載專用AI加速硬件的計(jì)算機(jī),而在RTX GPU上,這些專用的 AI 加速器被稱為Tensor Core。

Tensor Core的出現(xiàn),實(shí)際上就是為了能夠加速AI性能,并為PC用戶引入以前在云端才能運(yùn)行的AI新功能。針對開發(fā)者或者深度AI用戶,英偉達(dá)也已經(jīng)上線了TensorRT開發(fā)者套件,實(shí)現(xiàn)加速深度學(xué)習(xí)推理性能。

TensorRT能加速熱門的生成式AI模型,Stable Diffusion 1.5和SDXL等,全新的 UL Procyon AI 圖像生成基準(zhǔn)測試也已支持TensorRT加速。

AI能力除了可以用在提升游戲開發(fā)、生產(chǎn)力上,它還能做很多工作,當(dāng)你覺得用自拍生成棚拍畫面已經(jīng)足夠離譜,那么1分鐘語音就能克隆聲音的AI能力,是不是會(huì)感覺AI會(huì)有點(diǎn)“恐怖”?

通過AI克隆聲音(圖片來源:鈦媒體APP作者拍攝)

通過AI克隆聲音(圖片來源:鈦媒體APP作者拍攝)

基于RTX GPU加速的聲音克隆可僅用5秒錄音來克隆聲音,實(shí)現(xiàn)無需訓(xùn)練的個(gè)性化聲音生成?;陂_源的GPT-SoVITS項(xiàng)目,聲音克隆快速使用5秒聲音樣本,根據(jù)其發(fā)音特征由文本生成個(gè)性化語音片段,這個(gè)過程僅五分鐘就能完成,而基于更多樣本(1分鐘)的微調(diào)訓(xùn)練則能實(shí)現(xiàn)更高質(zhì)量接近1:1復(fù)刻的聲音克隆。

作為消費(fèi)級GPU產(chǎn)品的供應(yīng)商之一,英偉達(dá)看中AI PC的其中一個(gè)落地場景當(dāng)然是“游戲”,并為此推出了DLSS 圖形技術(shù),其原理就是利用AI提高幀率并改善圖像質(zhì)量。最新的DLSS 3.5技術(shù)中,可以通過AI增強(qiáng)光線追蹤表現(xiàn),備受期待的《黑神話:悟空》和《永劫無間》即將支持DLSS 3.5光線重建和全景光線追蹤技術(shù)。

AI對游戲圖像進(jìn)行增強(qiáng)(圖片來源:鈦媒體APP作者拍攝)

AI對游戲圖像進(jìn)行增強(qiáng)(圖片來源:鈦媒體APP作者拍攝)

換句話說,就是讓顯卡能夠以更低的負(fù)載,輸出更高幀率的畫面以及光影質(zhì)量更加逼真的內(nèi)容,而這一切并不是通過傳統(tǒng)意義上增加圖形算力獲得的,而是通過AI能力獲得的。此外還有RTX Remix技術(shù),通過使用生成式 AI 工具自動(dòng)增強(qiáng)材質(zhì),以及借助全景光線追蹤和 DLSS 快速創(chuàng)建畫質(zhì)更好的“重制版”游戲。

其他一些方面,AI的應(yīng)用也在加速滲透當(dāng)中,比如很早前就已經(jīng)上線的NVIDIA Broadcast應(yīng)用,可以為直播提供AI增強(qiáng)型語音、視頻工具,包括噪音和回音消除、虛擬背景和AI綠幕、面部追蹤、視頻降噪和目光接觸,其實(shí)很多主播目前都已經(jīng)開始使用了,本地算力調(diào)取不占網(wǎng)絡(luò)帶寬和低延遲是它最大的優(yōu)勢。

如果討論生成式AI所能玩出的花樣和上限,英偉達(dá)無疑是現(xiàn)階段最有發(fā)言權(quán)的廠商,無論是已經(jīng)看到的各類應(yīng)用還是各個(gè)AI公司瘋搶的高算力GPU,都能代表其在AI領(lǐng)域硬件方面的領(lǐng)先地位,但想要把AI PC普及起來,或者讓普通消費(fèi)者為AI功能而添置或升級GPU,現(xiàn)階段而言并不現(xiàn)實(shí)。

可以預(yù)見的是,AI PC在各行各業(yè)的應(yīng)用會(huì)越來越廣泛,同時(shí)其對娛樂、辦公、社交等場景的滲透也會(huì)慢慢深入,但與很多此前發(fā)布的技術(shù)不同,生成式AI的加入往往是“無感”的,比如Stable Diffusion繪畫出的高質(zhì)量圖片往往能夠以假亂真,而ACE技術(shù)加持下的NPC也與真人有幾分相似,更不要說AI還能幫助實(shí)現(xiàn)聲音克隆等能力。

對于娛樂場景來說,追求高幀率和更逼真畫面的用戶可以通過更新GPU并選擇開啟AI功能來增強(qiáng)體驗(yàn),在生產(chǎn)力應(yīng)用上,GPU似乎也有望成為“隱形戰(zhàn)力”。(本文首發(fā)于鈦媒體APP 作者/鄧劍云 編輯/鐘毅)

本文系作者 鄧劍云 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請注明出處、作者和本文鏈接。
本內(nèi)容來源于鈦媒體鈦度號,文章內(nèi)容僅供參考、交流、學(xué)習(xí),不構(gòu)成投資建議。
想和千萬鈦媒體用戶分享你的新奇觀點(diǎn)和發(fā)現(xiàn),點(diǎn)擊這里投稿 。創(chuàng)業(yè)或融資尋求報(bào)道,點(diǎn)擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請綁定手機(jī)號后發(fā)表評論

登錄后輸入評論內(nèi)容

快報(bào)

更多

18:05

深交所:本周共對163起證券異常交易行為采取了自律監(jiān)管措施

18:05

上交所:本周對*ST巖石、*ST正平等異常波動(dòng)退市風(fēng)險(xiǎn)警示股票,以及天普股份等嚴(yán)重異常波動(dòng)股票進(jìn)行重點(diǎn)監(jiān)控

18:03

西南證券:擬定增募資不超過60億元,全部用于補(bǔ)充資本金

18:03

5連板掌閱科技:第三大股東量子躍動(dòng)2月9日至2月12日減持431.25萬股,持股比例降至5%以下

17:57

浙江證監(jiān)局:對杭州隆啟投資管理有限公司采取出具警示函措施

17:56

上海市新增8款已完成登記的生成式人工智能服務(wù)

17:56

全球最大變質(zhì)巖油田二期項(xiàng)目全部導(dǎo)管架安裝就位

17:55

兩部門:進(jìn)一步加強(qiáng)跨境電商零售進(jìn)口食品召回監(jiān)管

17:52

市場監(jiān)管總局抽查兒童及嬰幼兒服裝等41種產(chǎn)品,660批次產(chǎn)品不合格

17:50

美股太空概念股盤前反彈

17:49

證監(jiān)會(huì)對中天國富證券采取警示函措施,因其存在發(fā)行承銷不規(guī)范等違規(guī)行為

17:48

大悅城:太平人壽及太平資產(chǎn)合計(jì)持股比例降至5%以下

17:48

證監(jiān)會(huì)對財(cái)通證券采取警示函措施

17:46

先導(dǎo)基電:股東三林萬業(yè)擬減持不超2.05%股份

17:45

證監(jiān)會(huì):對太平洋證券采取警示函措施,涉?zhèn)瘍?nèi)控把關(guān)不嚴(yán)等

17:44

Rivian美股盤前大漲19%

17:43

春節(jié)前一周機(jī)器人租賃訂單增長近五成

17:42

國務(wù)院:同意河北雄安高新技術(shù)產(chǎn)業(yè)開發(fā)區(qū)升級為國家高新技術(shù)產(chǎn)業(yè)開發(fā)區(qū)

17:41

歐洲版“星鏈”布局初顯成效:半年度營收超預(yù)期,虧損收窄85%

17:40

葡萄牙議會(huì)通過法案限制16歲以下未成年人使用社交媒體

掃描下載App