有肢體動(dòng)作,說一段話,已故親人熟悉的音容笑貌展現(xiàn)在面前,這是一種精神慰藉還是往傷口上撒鹽?多位已故明星家屬并不支持粉絲們這樣的做法,不希望已故親人的肖像被任意使用。不久前,已故演員喬任梁的父親喊話“撕下‘AI復(fù)活’明星的偽善面具”話題登上熱搜。
當(dāng)生成式AI興起,“AI復(fù)活親人”已成產(chǎn)業(yè)鏈。但這一次,AI又一次站在了人類倫理與道德的邊界。
“我要給丫丫完整的一生。”在電影《流浪地球2》中,圖恒宇的這句話,或許是人們對數(shù)字生命無盡的想象。在如今AIGC浪潮下,這種想象已經(jīng)照進(jìn)現(xiàn)實(shí),甚至普通人也觸手可及。
在一些電商平臺上,《IT時(shí)報(bào)》記者發(fā)現(xiàn)不少提供此類服務(wù)的商家,“AI復(fù)活親人”“老照片動(dòng)起來”“聲音克隆,開口說話”等是這些店鋪的廣告語,價(jià)格從幾十元到幾百元不等,不少店鋪都展現(xiàn)了制作完成的視頻效果。在一家店鋪展示的30秒左右視頻中,一位白發(fā)老人面帶微笑,頭緩緩轉(zhuǎn)動(dòng),“孩子,你最近過得怎么樣,有沒有好好吃飯,晚上睡得好嗎?”她用慈祥的眼神注視著前方,仿佛在對自己的孩子說話。但從呈現(xiàn)效果來看,并沒有達(dá)到惟妙惟肖的效果,能看出制作痕跡。
![]()
需要哪些素材才能制作出這樣的視頻?《IT時(shí)報(bào)》從一些店鋪客服人員處了解到,只需要一張照片,一段本人說話的音頻以及一段文字即可。“如果只讓照片動(dòng)起來,價(jià)格是50元,需要配上聲音,價(jià)格為150元,說話字?jǐn)?shù)不超過100字,制作時(shí)間3天之內(nèi)。”一家店鋪的客服人員說,如果沒有照片上人物的音頻,也可以利用AI配音,接近真人發(fā)聲的效果。該店鋪頁面顯示,有100余人購買了這項(xiàng)服務(wù)。
據(jù)了解,目前這些“賽博復(fù)活者”說的話是固定的,只能說買家提供的語言文本,達(dá)不到“對話”的效果。就像一段錄像,無法根據(jù)場景的變化或外界的互動(dòng)做出及時(shí)的反應(yīng)和調(diào)整,雖然能夠呈現(xiàn)出一定的動(dòng)態(tài)和聲音效果,但缺乏真實(shí)對話的靈活性和互動(dòng)性。
《IT時(shí)報(bào)》記者就“購買可以實(shí)時(shí)互動(dòng)的”AI商品為由,咨詢了幾家店鋪,都表示做不了。
“僅僅通過復(fù)刻語音視頻資料來重現(xiàn)一個(gè)形象,往往只能得到外在的形似,而無法觸及內(nèi)在的精髓。雖然有著相似的聲音和外貌,但缺乏真實(shí)的情感和思考,更像是一臺機(jī)械的復(fù)讀機(jī),無法與人產(chǎn)生真正的互動(dòng)和共鳴,也讓這個(gè)行業(yè)參差不齊。”一位AI復(fù)活的從業(yè)者告訴《IT時(shí)報(bào)》記者。
2023年3月23日,在上海音樂廳的舞臺上,中國國家名譽(yù)主席宋慶齡先生用滬語講述了她生前發(fā)表的最后一篇文章《愿小樹苗健康成長》,這也是宋慶齡數(shù)字人首次出現(xiàn)在大眾視野中。宋慶齡數(shù)字人制作團(tuán)隊(duì)開天工作室相關(guān)負(fù)責(zé)人告訴《IT時(shí)報(bào)》記者,由于可供參考的照片、音頻資料非常有限,制作團(tuán)隊(duì)探訪多地,從近千張影像照片中選取出了最經(jīng)典、最清晰、形象特征最鮮明的一組照片做參考,并基于SFM(Structural From Motion)算法,還原出3D模型。
![]()
“人的面部肌肉很多,運(yùn)動(dòng)也極其復(fù)雜,很多‘自然的表情’放在數(shù)字人臉上,就會失真。當(dāng)前市面上通過面部捕捉形成的數(shù)字人視頻,表情精細(xì)度和寫實(shí)度,仍然需要結(jié)合領(lǐng)先的實(shí)時(shí)渲染技術(shù),才能達(dá)到最好的狀態(tài)。”開天工作室相關(guān)人士說。
在數(shù)字人賽道上,也有不少企業(yè)提供此類服務(wù)。
得益于深度學(xué)習(xí)、自然語言處理和計(jì)算機(jī)視覺等技術(shù)的快速發(fā)展,“AI復(fù)活”逐漸成為現(xiàn)實(shí)。
2023年,硅基智能發(fā)布了炎帝大模型,結(jié)合數(shù)據(jù)和影像資料,重建已故親人的聲音、形象乃至行為習(xí)慣,用戶可以通過DUIX智能交互平臺與數(shù)字人進(jìn)行互動(dòng)。
“我們是在為用戶做數(shù)字人業(yè)務(wù)的時(shí)候想到的,數(shù)字生命特別適合AI這個(gè)賽道,一個(gè)是出內(nèi)容,一個(gè)是表現(xiàn)內(nèi)容。去年,有不少企業(yè)進(jìn)行小范圍的嘗試。”在神馬工場創(chuàng)始人馬建軍看來,如果說2023年是數(shù)字人元年,現(xiàn)在數(shù)字人的下半場開始了。去年,神馬工場推出了成本千元以內(nèi)的數(shù)字人。
在《流浪地球2》中,圖恒宇通過將女兒的記憶、情感、性格、思維方式等資料上傳至超級計(jì)算機(jī),形成有自主獨(dú)立意識體的數(shù)字生命形態(tài)。
馬建軍告訴《IT時(shí)報(bào)》記者,通過聲音和視頻符合一個(gè)人的形象,在技術(shù)上已經(jīng)非常成熟,相似度能達(dá)到95%以上,但這只是單純地克隆形象和聲音,一兩百元就可以做到,也只需要幾個(gè)小時(shí)。
“目前,業(yè)界的難點(diǎn)在于大腦意識的復(fù)刻,這是全球都在基于大模型中一個(gè)垂直場景的探索,形象、聲音加上意識才能實(shí)現(xiàn)真正意義的數(shù)字永生。”馬建軍說,關(guān)鍵在于知識庫開放和大模型學(xué)習(xí)的問題,必須要有大量的文本,“名人可能有較多開放的知識庫,但普通老百姓是沒有的,受到素材所限,這也是現(xiàn)在整個(gè)市場沒爆發(fā)的原因之一。”
深度科技研究院院長張孝榮也向《IT時(shí)報(bào)》記者表示,目前,雖然AI能在一定程度上理解和回應(yīng)人類的話語,但理解能力和邏輯推理能力仍然有限。
AI應(yīng)用之年,市場正在以各種方式探索AI賦能產(chǎn)業(yè)的途徑,但服務(wù)質(zhì)量不穩(wěn)定、價(jià)格透明度低、個(gè)人信息泄露、AI復(fù)生內(nèi)容問題的侵權(quán)等,都是“AI復(fù)生”這門生意需要面對的問題。
“‘AI復(fù)生’涉及被復(fù)生者的肖像權(quán)、名譽(yù)權(quán)等法律問題,應(yīng)尊重逝者近親家屬的意愿和權(quán)益,未經(jīng)授權(quán)不得擅自使用其形象和聲音。‘AI復(fù)生’的應(yīng)用邊界在于尊重隱私、遵守法律、保障人權(quán)。”張孝榮說。
《互聯(lián)網(wǎng)信息服務(wù)深度合成管理規(guī)定》要求,“深度合成服務(wù)提供者和技術(shù)支持者提供人臉、人聲等生物識別信息編輯功能的,應(yīng)當(dāng)提示深度合成服務(wù)使用者依法告知被編輯的個(gè)人,并取得其單獨(dú)同意”。
由于“AI復(fù)活”的倫理門檻較高,一些企業(yè)也設(shè)置了規(guī)則。比如小冰公司推出了AI技術(shù)復(fù)生倫理原則,包括當(dāng)本人在世時(shí),AI復(fù)生項(xiàng)目應(yīng)當(dāng)僅由本人自由意志決定,而非任何其他相關(guān)第三方;本人不在世的,應(yīng)當(dāng)沿襲法律所判定的繼承人順序,應(yīng)當(dāng)遵循訓(xùn)練數(shù)據(jù)最小化原則,避免數(shù)據(jù)濫用等。
![]()
那么,提供“AI復(fù)活”服務(wù)的店鋪如何確保買家已獲得授權(quán)呢?“我們只做已故親人的視頻。”一位客服表示,但是買家如何證明照片是自己的已故親人,是否需要提供相關(guān)證明,該客服表示,并無要求。
京師律師事務(wù)所徐延軒向《IT時(shí)報(bào)》記者解釋說,法律沒有強(qiáng)制規(guī)定提供權(quán)屬證明,另外商家不是使用者,也無須舉證使用合法。但為了避免不必要的糾紛,商家建立合理的確權(quán)流程,要求買家提供必要的權(quán)屬證明,同時(shí)提供不侵犯他人肖像權(quán)、名譽(yù)權(quán)、不商業(yè)使用的承諾,確保商家不會在不知情的情況下參與侵犯他人權(quán)益的行為。
“企業(yè)主要從肖像權(quán)或者授權(quán)等等方面去做好約束和規(guī)避風(fēng)險(xiǎn),比如用戶提供肖像,必須證明是自己或者家人的,否則平臺也產(chǎn)生連帶責(zé)任。此外,企業(yè)也需要和平臺上的公模簽署肖像權(quán)授權(quán)協(xié)議等,用戶要簽不得濫用公模的協(xié)議等。”馬建華說。
![]()
快報(bào)
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請綁定手機(jī)號后發(fā)表評論