文 | 青山資本
兩年前,ChatGPT橫空出世,顛覆世界認(rèn)知。今年年初,文生視頻大模型Sora發(fā)布,全網(wǎng)刷屏。前不久,生成式AI音樂(lè)軟件Suno V3誕生,音樂(lè)創(chuàng)作迎來(lái)了“ChatGPT時(shí)刻”。
人工智能在以更快的速度闖進(jìn)人類(lèi)的世界,當(dāng)AI的風(fēng)吹向音樂(lè)圈,帶走了什么?又留下了什么?
作為投資人,同時(shí)也是音樂(lè)人,今天,來(lái)聊聊AI與音樂(lè)。
作為投資人,常被問(wèn)到“AI音樂(lè)的商業(yè)模式怎么樣?”
我的答案是,有效但也有限
AI音樂(lè)不是一個(gè)新鮮的詞,除了現(xiàn)在說(shuō)的生成式,其實(shí)還有一些輔助創(chuàng)作工具,例如人聲分離等。如果回歸到生成音樂(lè)本身,這個(gè)歷史也很久了。我上學(xué)的時(shí)候老師講現(xiàn)代音樂(lè),就提到上世紀(jì)50年代美國(guó)教授用數(shù)學(xué)的形式隨機(jī)生成音樂(lè),甚至還有貓踩鋼琴生成音樂(lè),這是一個(gè)概率問(wèn)題,所有生成技術(shù)的底層邏輯都是概率。
前幾年國(guó)內(nèi)有一個(gè)生成音樂(lè)的商業(yè)模式。公司像是一個(gè)大廠房,格子間里的工作人員,每人一臺(tái)電腦,一個(gè)小的電琴,每人每天要?jiǎng)?chuàng)作幾首新歌上傳平臺(tái),歌曲就像流水線(xiàn)上的商品按照固定的模式生產(chǎn)出來(lái)了。人工加水電,每首歌的生產(chǎn)成本幾百上千。緊接著的投放也有一套流程,例如一千首歌上傳到短視頻平臺(tái),每個(gè)投10元,挑出表現(xiàn)好的繼續(xù)再投100,再挑再投,直到某一首歌被聽(tīng)到和傳播了,獲得收益。流量倒入到音樂(lè)流媒體平臺(tái),平臺(tái)跟工廠結(jié)版稅。他們不需要去辨別一首歌質(zhì)量的高低,只要其中的某句歌詞、某個(gè)旋律觸動(dòng)聽(tīng)眾,得到傳播,不斷地循環(huán),商業(yè)模式就是有效的。在這個(gè)模式下,大量的電子垃圾被生產(chǎn)出來(lái),堆砌到互聯(lián)網(wǎng)上。AI音樂(lè)讓這類(lèi)公司的成本進(jìn)一步降低了,每首歌從幾百塊可以降到幾塊錢(qián),財(cái)務(wù)模型確實(shí)會(huì)帶來(lái)大幅優(yōu)化。
當(dāng)然,青山?jīng)]有投這樣的公司。第一,我們追求更高的天花板。從投資視角,我們希望一家企業(yè)有機(jī)會(huì)做的很大,而不僅僅是賺點(diǎn)錢(qián);第二,我們要考慮商業(yè)或投資的社會(huì)意義。投資這么多年,結(jié)果上我們不能說(shuō)沒(méi)有瑕疵,但在動(dòng)機(jī)和出發(fā)點(diǎn)上,我們一直很在乎社會(huì)意義,也一定有除了賺錢(qián)以外的考量。
有些人可能會(huì)問(wèn),上面的商業(yè)模式里,AI降低了歌曲的生產(chǎn)成本,但是收入項(xiàng)會(huì)增加嗎?也就是說(shuō)AI模仿和學(xué)習(xí)能力這么強(qiáng),會(huì)更容易產(chǎn)生爆火的神曲嗎?這個(gè)要從“歌”和“火”兩件事看。我認(rèn)為AI生成一些中國(guó)流行樂(lè)壇上的火歌是非常容易的事情,每天生成100萬(wàn)、1000萬(wàn),一定是有一些滿(mǎn)足火的條件的,甚至現(xiàn)在就有,這還是概率問(wèn)題。但是,火這個(gè)事很難做到,因?yàn)椴粫?huì)被聽(tīng)見(jiàn)。很多人擔(dān)心AI會(huì)產(chǎn)生大量的歌,其實(shí)這個(gè)事已經(jīng)持續(xù)很多年了。在流媒體平臺(tái)上,比如QQ音樂(lè)、網(wǎng)易云音樂(lè)、spotify,每天都有十萬(wàn)以上的新歌被上傳。真正被人聽(tīng)到的有幾首?可能1000首都不到,99%都被淹沒(méi)了。如果這個(gè)數(shù)字變成100萬(wàn),變成一億又怎么樣,也不會(huì)被人聽(tīng)到,不會(huì)因?yàn)楣┙o增多而拉高需求。
當(dāng)然,還有另外一種to B的音樂(lè),諸如罐頭音樂(lè)等,他們的存在不是為了吸引你的注意力,更多的是提供一種情緒氛圍。有大量的低成本的視覺(jué)內(nèi)容,以及線(xiàn)下游樂(lè)園、商場(chǎng)和餐廳等有類(lèi)似的需求,這類(lèi)型的音樂(lè)有非常穩(wěn)定的交易市場(chǎng)和商業(yè)業(yè)態(tài),它們也不需要精良的制作,我認(rèn)為AI對(duì)這類(lèi)型音樂(lè)的影響是非常直接和迅速的。
AI音樂(lè)目前來(lái)看受益最大的還是平臺(tái),很簡(jiǎn)單的道理,平臺(tái)如果不需要每年支付大額的版權(quán)費(fèi)給上游創(chuàng)作者,何樂(lè)而不為呢?平臺(tái)的邏輯簡(jiǎn)單說(shuō)是計(jì)算下游聽(tīng)眾的收聽(tīng)總時(shí)長(zhǎng),對(duì)應(yīng)上游版權(quán)支付的成本。如果一部分被平臺(tái)自產(chǎn)的AI音樂(lè)替換,就相當(dāng)于上游支付版權(quán)的成本降低了一大塊。當(dāng)然,創(chuàng)作者是一定會(huì)反對(duì)有人用他們的音樂(lè)訓(xùn)練大模型來(lái)取代他們,前提是得確切地知道。所以,在整個(gè)AI領(lǐng)域,推動(dòng)訓(xùn)練數(shù)據(jù)的公開(kāi)透明化,去溯源和監(jiān)管訓(xùn)練數(shù)據(jù)是必須要做的事。平臺(tái)也需要在這個(gè)里面扮演個(gè)歷史正面的角色。
上面提到了一些有效的商業(yè)模式,但我認(rèn)為總體來(lái)看生成式AI在音樂(lè)領(lǐng)域的發(fā)展依然是有限的。
人工智能本質(zhì)上就是輸入、計(jì)算和輸出三個(gè)環(huán)節(jié)。計(jì)算環(huán)節(jié)會(huì)隨著時(shí)間發(fā)展不斷進(jìn)步,進(jìn)步的邊界人類(lèi)不一定能夠特別清楚的掌握,但但凡是文生,輸入環(huán)節(jié)就始終會(huì)受到人類(lèi)語(yǔ)言的制約。人類(lèi)大腦皮層70%都是由視覺(jué)處理的功能覆蓋的,語(yǔ)言誕生的時(shí)候就是通過(guò)視覺(jué)的同構(gòu)來(lái)建立了人類(lèi)的交流系統(tǒng)。相比視覺(jué),人類(lèi)語(yǔ)言和聽(tīng)覺(jué)的同構(gòu)性是很差的。而創(chuàng)作音樂(lè)是嘗試對(duì)沒(méi)有邊界和沒(méi)有格式的聲學(xué)環(huán)境做一個(gè)描述,人類(lèi)語(yǔ)言很難精準(zhǔn)表達(dá)。這就導(dǎo)致在輸入環(huán)節(jié)的效率非常低,無(wú)論是創(chuàng)作時(shí)還是修改時(shí),人類(lèi)的語(yǔ)言描述都很難將內(nèi)心想要的東西正確傳達(dá)給計(jì)算機(jī)。只要是文生,這個(gè)顆粒度就無(wú)法降得很小。
所以,在計(jì)算環(huán)節(jié)同樣進(jìn)步的情況下,文生圖片、文生視頻等文生視覺(jué)的進(jìn)步速度會(huì)遠(yuǎn)遠(yuǎn)高于文生音樂(lè),甚至文生音樂(lè)的天花板是極其明顯的,因?yàn)槲膶?duì)音樂(lè)的描述能力太過(guò)粗糙。
作為音樂(lè)人,常被問(wèn)到“AI真的可以進(jìn)行藝術(shù)創(chuàng)作嗎?”
我的答案是,除非有一天AI產(chǎn)生企圖和情感
不同音樂(lè)創(chuàng)作的流程是完全不同的。
我最早開(kāi)始寫(xiě)歌是在90年代,那時(shí)候組過(guò)搖滾樂(lè)隊(duì)。樂(lè)隊(duì)寫(xiě)歌其實(shí)不是一個(gè)非常嚴(yán)謹(jǐn)?shù)膭?chuàng)作過(guò)程,更像是大家一起玩出一首歌來(lái),情緒和靈感的碰撞,每個(gè)人貢獻(xiàn)其中一部分。
后來(lái)我學(xué)習(xí)古典音樂(lè),音樂(lè)創(chuàng)作是相對(duì)嚴(yán)謹(jǐn)?shù)?。古典音?lè)的創(chuàng)作通常是由一個(gè)人來(lái)完成,創(chuàng)作過(guò)程是作曲家自己以記錄、寫(xiě)譜等視覺(jué)呈現(xiàn)出來(lái),樂(lè)團(tuán)的演奏是與其明確對(duì)應(yīng)的,一個(gè)周期下來(lái)要半年、一年甚至更長(zhǎng)。
現(xiàn)在做電子樂(lè),電子音樂(lè)的創(chuàng)作又是另外一套流程。電子樂(lè)的創(chuàng)作可以是一個(gè)人,也可以是幾個(gè)人,但基本可以完全用軟件來(lái)創(chuàng)作,當(dāng)然也可以用硬件來(lái)做輔助。整個(gè)音樂(lè)所具備的要素,無(wú)論是旋律、音色、節(jié)奏和各種樂(lè)器,都被拆解成了一個(gè)個(gè)可輸入和可編輯的最小單元。
進(jìn)入到電子音樂(lè)時(shí)代,當(dāng)音樂(lè)被拆解成一個(gè)個(gè)數(shù)字單元,智能音樂(lè)、生成音樂(lè)就具備了基礎(chǔ)。在計(jì)算編排方面的能力到了一定程度后,音樂(lè)創(chuàng)作自然就會(huì)被順勢(shì)覆蓋。
但是AI創(chuàng)作的音樂(lè)可以被稱(chēng)作藝術(shù)嗎?不止是音樂(lè),AI生成的畫(huà)作、文學(xué)、設(shè)計(jì)等等,這些能被稱(chēng)作是藝術(shù)嗎?又該怎樣定義藝術(shù)呢?
首先,藝術(shù)是人類(lèi)特有的內(nèi)容形式,其次,一切藝術(shù)都該有兩個(gè)層面,技巧層和內(nèi)核層。在這兩個(gè)層面里,內(nèi)核層是必要條件,技巧層是充分條件。
把音排列組合成旋律和和聲,編排上樂(lè)器,模擬出人的嗓音,這些是技巧層。
把線(xiàn)條、色彩排列組合成人類(lèi)喜歡的樣子,這是技巧層。
把古文的詞匯按規(guī)律組合成七言五言,這是技巧層。
內(nèi)核層是什么?是人類(lèi)的企圖與情感。任何一個(gè)藝術(shù)作品,都能找到這兩種元素。而AI目前,沒(méi)有企圖與情感。
怎樣看待AI可能帶來(lái)的大量“電子垃圾”?
創(chuàng)作者、分發(fā)者和受眾,到底誰(shuí)應(yīng)該為電子垃圾負(fù)責(zé),這是一個(gè)爭(zhēng)論不休的話(huà)題。
首先,我認(rèn)為受眾是沒(méi)有錯(cuò)的。雖然很多人批判觀眾審美差,所以?xún)?nèi)容差,但我認(rèn)為這種說(shuō)法是站不住腳的?;仡^看人類(lèi)歷史發(fā)展的各個(gè)階段,絕大部分的人都不知道自己要什么。藝術(shù)造詣或深或淺的時(shí)代、地區(qū),受眾都是一樣的結(jié)構(gòu)。
其次,我認(rèn)為分發(fā)環(huán)節(jié)只能遵從客觀。從經(jīng)銷(xiāo)商的門(mén)店到流媒體,分發(fā)渠道發(fā)生了劇烈的變化。很多人將過(guò)錯(cuò)歸于分發(fā)環(huán)節(jié),批判分發(fā)公司不負(fù)責(zé)任,什么都推。這種質(zhì)疑也是站不住腳的。試想如果分發(fā)公司設(shè)置了價(jià)值標(biāo)準(zhǔn),那是不是更加錯(cuò)誤?我們不應(yīng)該要求分發(fā)環(huán)節(jié)去判斷,而應(yīng)該要求它客觀公正。按受眾結(jié)構(gòu)匹配分發(fā)不是過(guò)錯(cuò)。
我認(rèn)為,問(wèn)題產(chǎn)生的源頭在創(chuàng)作環(huán)節(jié),這是一個(gè)非常主觀的并且有明確標(biāo)準(zhǔn)的環(huán)節(jié)。對(duì)于創(chuàng)作者,你要盡你所能,創(chuàng)作精益求精的作品,無(wú)關(guān)乎硬件和環(huán)境,你都要去精雕細(xì)琢,不斷嘗試,這也就是所謂的匠人精神。如果是這樣的創(chuàng)作生態(tài),再加上客觀公平的分配機(jī)制,我相信結(jié)果會(huì)不一樣。
歸根到底,工具是為人所用的。職業(yè)音樂(lè)人是把AI用于收集素材和靈感,還是會(huì)把AI簡(jiǎn)單生成的歌作為自己的歌發(fā)行,這是自己的選擇。
最后,聊聊AI音樂(lè)的未來(lái)。
一百多年前拍照是一個(gè)很專(zhuān)業(yè)的事情,門(mén)檻很高。甚至五十年前,拍照依然要學(xué)會(huì)使用專(zhuān)業(yè)的相機(jī),調(diào)整光圈等。后來(lái)出現(xiàn)了傻瓜相機(jī),再后來(lái)智能手機(jī)實(shí)現(xiàn)了拍照平權(quán),拍照融入了日常生活,每個(gè)人都可以隨時(shí)隨地拍照上傳社交媒體。這個(gè)世界每天產(chǎn)生幾十億甚至上百億的圖片,但結(jié)構(gòu)是非常典型的冪次結(jié)構(gòu)。極少數(shù)的明星和網(wǎng)紅花了很多時(shí)間和心思拍攝的精修圖能夠被很多人看到,絕大多數(shù)的普通人隨手一拍發(fā)在社交媒體上的被幾個(gè)幾十個(gè)熟人看到。
未來(lái)的AI內(nèi)容仍然遵循這一結(jié)構(gòu)。
未來(lái)可能每個(gè)人都可以用AI生成音樂(lè)表達(dá)自己的心情,通過(guò)終端分享到平臺(tái),但是結(jié)構(gòu)不會(huì)改變,依然是那些花費(fèi)更多時(shí)間和擁有更多額外條件的人,他們的音樂(lè)會(huì)被更多人聽(tīng)到,絕大多數(shù)人的音樂(lè)還是只會(huì)在小范圍傳播,但也挺好,AI給了我們更多選擇。
無(wú)論是投資人還是音樂(lè)人的生活,AI都在帶來(lái)翻天覆地的變化。人總還是懷舊的,看著一代人有一代人的音樂(lè),感謝音樂(lè)代替我們表達(dá)一代又一代人的叛逆。
從純自然聲響到電聲進(jìn)入音樂(lè)領(lǐng)域,再到麥克風(fēng)讓耳語(yǔ)能被聽(tīng)到,又來(lái)到數(shù)字時(shí)代的電子音樂(lè),音樂(lè)范式的變革推動(dòng)音樂(lè)核心內(nèi)容的變化,窮盡一個(gè)范式會(huì)助推下一個(gè)范式的到來(lái),電子音樂(lè)時(shí)代的AI正扮演著加速器的角色。
至于下一個(gè)范式是什么?什么時(shí)候到來(lái)?
我們無(wú)從知曉。
風(fēng)起時(shí),我們只能聽(tīng)著吹動(dòng)的響,看揚(yáng)起的沙,
期待加速到來(lái)的明天。







快報(bào)
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論