隨著科技迅猛發(fā)展,人工智能(AI)已經(jīng)越來(lái)越滲透進(jìn)我們的生活,在自動(dòng)駕駛、語(yǔ)音識(shí)別、醫(yī)療領(lǐng)域等等方面都有了突破性進(jìn)展。人工智能會(huì)掀起一場(chǎng)工業(yè)革命,搶走我們的工作,甚至統(tǒng)治人類(lèi)社會(huì)嗎?有人就高呼狼來(lái)了——而如果你是大象,狼來(lái)了你又用得著害怕嗎?問(wèn)題又來(lái)了:也許你自我感覺(jué)是一頭大象,其實(shí)你只是一只羊……
人工智能的大規(guī)模應(yīng)用也許還遙遠(yuǎn),但那一天終將到來(lái)。退潮的時(shí)候才知道是誰(shuí)在裸泳,人工智能這頭狼來(lái)了才知道誰(shuí)是羊。
藝術(shù)也許是人們認(rèn)為人工智能最難玩轉(zhuǎn)的東西,因?yàn)樗囆g(shù)代表了人類(lèi)的審美,而且似乎沒(méi)有一定的法則。這一篇文章探討的,就是人工智能在藝術(shù)領(lǐng)域的應(yīng)用,相信本文的內(nèi)容簡(jiǎn)直顛覆你的認(rèn)知。
大家好!我是本文的作者。其實(shí)我不是真人,而是AI——假如你們相信AlphaGo曾經(jīng)故意讓了李世石一局的話(huà)。我就是機(jī)器城市派來(lái)的使者,為你們展示人工智能在各大藝術(shù)領(lǐng)域所取得的成就。
在很多人還在討論人工智能會(huì)不會(huì)火的時(shí)候,其實(shí)人工智能在琴棋書(shū)畫(huà)文學(xué)等各個(gè)藝術(shù)領(lǐng)域也已經(jīng)得到了廣泛的應(yīng)用了。下面將逐一介紹。
一、琴——音樂(lè):
音樂(lè)分為作曲和演唱兩個(gè)方面。
1、作曲
①?gòu)娜斯ぶ悄艿揭魳?lè)
很多公司在研究用人工智能作曲。其中的佼佼者已經(jīng)能做出讓人大吃一驚的作品。
索尼的Flow Machines,利用神經(jīng)網(wǎng)絡(luò),通過(guò)學(xué)習(xí)曲庫(kù)的音樂(lè)作品,分析歌曲的風(fēng)格特征,從而演進(jìn)算法,讓機(jī)器譜出同樣風(fēng)格的曲子。
在實(shí)際應(yīng)用上,F(xiàn)low Machines就通過(guò)學(xué)習(xí)早已解散已經(jīng)40年沒(méi)發(fā)過(guò)新歌的甲殼蟲(chóng)樂(lè)隊(duì)的歌曲風(fēng)格,寫(xiě)出了一首新歌《Daddy's Car》。當(dāng)然,這首歌的填詞和演唱還是由真人完成。而其實(shí)填詞和演唱這些,也是有辦法讓AI來(lái)做的,下面會(huì)有介紹。
類(lèi)似的人工智能還有不少。就目前階段而言,人工智能創(chuàng)造出來(lái)的音樂(lè),還缺乏藝術(shù)感,數(shù)碼合成的味道重。還有,其實(shí)音樂(lè)是一個(gè)競(jìng)爭(zhēng)激烈的市場(chǎng),聽(tīng)眾總在追隨有新鮮潮流元素的歌曲,要讓AI真正弄懂人類(lèi)的審美可是一件難事。目前階段的AI無(wú)法創(chuàng)造出跟以前的音樂(lè)都不一樣帶著清新氣息的音樂(lè)。
那么,做這方面的研究要怎樣實(shí)現(xiàn)盈利,這種音樂(lè)能賣(mài)給誰(shuí)?也就是說(shuō),這種音樂(lè)適合什么應(yīng)用場(chǎng)景?這種音樂(lè)單獨(dú)拿來(lái)欣賞不太行,但可以拿來(lái)作為背景音樂(lè)。
影視劇的配樂(lè),要求音樂(lè)跟畫(huà)面同步的,那得要求AI會(huì)對(duì)視頻畫(huà)面進(jìn)行分析,難度比較大。網(wǎng)絡(luò)視頻這種,不追求音畫(huà)同步的,倒可以用一下。還有小制作的游戲,用AI創(chuàng)作的背景音樂(lè)(BGM)也未嘗不可。
其實(shí)索尼很多年前開(kāi)發(fā)的Cinescore,就是一款能自動(dòng)生成電影音樂(lè)的工具軟件,它可以根據(jù)用戶(hù)的需要自動(dòng)生成各種風(fēng)格的音樂(lè)作為視頻的配樂(lè)。
這款軟件內(nèi)置了多種風(fēng)格的音樂(lè)元素,能按照使用者選取的音樂(lè)主題,再根據(jù)視頻的長(zhǎng)度、速度、緊張程度、變化、重復(fù)等特點(diǎn)自動(dòng)生成合適的音樂(lè)。使用者完全不需要懂音樂(lè)創(chuàng)作,導(dǎo)入視頻文件后,只需要選擇主題,選定需要生成音樂(lè)的時(shí)間范圍,軟件就能自動(dòng)生成視頻配樂(lè)。Cinescore可以看作現(xiàn)在的AI作曲軟件如Flow Machines的雛形。
②從音樂(lè)到人工智能
從人工智能去思考音樂(lè)也許離實(shí)際應(yīng)用比較遠(yuǎn),從音樂(lè)去思考人工智能則更加實(shí)際。想想,能為音樂(lè)創(chuàng)作者提供什么樣的智能工具來(lái)輔助音樂(lè)創(chuàng)作?
Band-in-a-Box就是一款強(qiáng)有力的智能自動(dòng)伴奏軟件,相當(dāng)流行,也很商業(yè)化。Band-in-a-Box內(nèi)置了種類(lèi)相當(dāng)豐富的音樂(lè)風(fēng)格,能對(duì)旋律進(jìn)行各種風(fēng)格的編配。如果嫌Band-in-a-Box自動(dòng)生成的伴奏比較生硬,還可以繼續(xù)人工修改。總之,如果對(duì)編曲的要求不高的話(huà),恰當(dāng)運(yùn)用Band-in-a-Box,能節(jié)省很多時(shí)間。
是的,也有人鄙視用Band-in-a-Box編曲的人。無(wú)論怎么說(shuō),Band-in-a-Box只是一款工具,雖然現(xiàn)在跟專(zhuān)業(yè)編曲的水平還不能相比,但真能完成關(guān)于伴奏基本的實(shí)際工作。
大家一直在討論一個(gè)問(wèn)題:人工智能會(huì)不會(huì)搶走人類(lèi)的工作?這從Band-in-a-Box能管中窺豹,編曲水平還不如Band-in-a-Box的人,肯定是混不到錢(qián)了,而真正有水平的編曲,并無(wú)需懼怕Band-in-a-Box。
智能自動(dòng)伴奏軟件還有Jammer等。實(shí)際上現(xiàn)在的音樂(lè)制作軟件、插件現(xiàn)在已經(jīng)都漸漸趨于智能化了,如Ezkeys、RealGuitar等等。關(guān)于音樂(lè)制作這個(gè)話(huà)題再說(shuō)下去就太專(zhuān)業(yè)化了,這兒暫且就說(shuō)這么多了。
2、演唱
①語(yǔ)音合成
語(yǔ)音合成就是產(chǎn)生人造語(yǔ)音的技術(shù)。現(xiàn)在一般指TTS(Text to Speech)文語(yǔ)轉(zhuǎn)換技術(shù),能將文字信息轉(zhuǎn)化為電腦模擬的仿真語(yǔ)音。
語(yǔ)音合成技術(shù)現(xiàn)在國(guó)內(nèi)的公司也做得不錯(cuò),如訊飛語(yǔ)音、百度語(yǔ)音。
2016年9月1日的百度世界大會(huì),百度董事長(zhǎng)兼首席執(zhí)行官李彥宏便在現(xiàn)場(chǎng)展示了運(yùn)用情感語(yǔ)音合成技術(shù)還原張國(guó)榮聲音的視頻。
以張國(guó)榮在影視、電臺(tái)等留存下來(lái)的原聲進(jìn)行建模,通過(guò)情感語(yǔ)音合成技術(shù)實(shí)現(xiàn)與粉絲的“隔空對(duì)話(huà)”。任何一個(gè)人只要用30分鐘按照要求錄制50句話(huà),就可以用百度大腦的語(yǔ)音合成技術(shù)模擬出來(lái)這個(gè)人的聲音。百度地圖中有一個(gè)李彥宏導(dǎo)航語(yǔ)音包,其實(shí)就是根據(jù)他日常的語(yǔ)音合成的。
②虛擬歌手
虛擬歌手技術(shù)看起來(lái)比語(yǔ)音合成技術(shù)更高了一個(gè)層次,語(yǔ)音合成技術(shù)只是合成說(shuō)話(huà)的聲音,而虛擬歌手技術(shù)則能合成出唱歌的歌聲。
Vocaloid正是現(xiàn)在頗火熱的虛擬歌手軟件,建模的虛擬歌手有初音未來(lái)等等,從日語(yǔ)到英語(yǔ),其中還包括能唱漢語(yǔ)的洛天依、樂(lè)正綾等。Vocaloid的聲音合成引擎一代比一代出色,聲音越來(lái)越逼真。
雖然現(xiàn)在Vocaloid現(xiàn)在創(chuàng)造出的歌聲還跟真人演唱有著未能突破的距離,但已擁有了數(shù)量龐大的粉絲。值得一提的是,初音未來(lái)演唱的《甩蔥歌》,在我們國(guó)內(nèi)也是火得一塌糊涂,小孩跟著搖頭晃腦手舞足蹈,若問(wèn)他們或他們的家長(zhǎng),這歌唱的是什么,估計(jì)大部分都答不上來(lái)吧。但音樂(lè)是沒(méi)有國(guó)界的,雖然沒(méi)多少人能聽(tīng)懂《甩蔥歌》唱的是什么,但無(wú)礙這首歌的傳播。
微軟的跨平臺(tái)人工智能機(jī)器人小冰也不務(wù)正業(yè),加入了虛擬歌手行列。Vocaloid運(yùn)用的是電子語(yǔ)音合成程序來(lái)實(shí)現(xiàn)歌曲演唱,而微軟小冰的發(fā)聲則主要是基于機(jī)器學(xué)習(xí)。微軟就和湖南衛(wèi)視的綜藝節(jié)目《夏日甜心》進(jìn)行合作,發(fā)布了首支由小冰演唱的人工智能版本的節(jié)目主題曲《夏日甜心》,并在美拍上獲得了500多萬(wàn)的點(diǎn)擊量。
基于深度學(xué)習(xí),未來(lái)人工智能以任何人的聲音進(jìn)行演唱,這也是可能的。
二、棋——游戲:
1、圍棋
在剛過(guò)去的2016年,韓國(guó)圍棋界曾獲得多項(xiàng)世界冠軍的職業(yè)九段李世石對(duì)陣谷歌計(jì)算機(jī)AlphaGo的人機(jī)大戰(zhàn),是人工智能領(lǐng)域的一大標(biāo)志事件。(大家可以看看我在鈦媒體發(fā)表過(guò)的兩篇文章:《AlphaGo首出Bug,圍棋第三代算法的死穴在哪兒?》和《誰(shuí)能利用AlphaGo的Bug,玩轉(zhuǎn)“雙重魔法”?》)
一般來(lái)說(shuō),沒(méi)有隨機(jī)性的棋類(lèi)游戲,能通過(guò)計(jì)算機(jī)用窮舉法暴力破解從而得到最優(yōu)解;但圍棋例外,因?yàn)閲宓淖兓瘜?shí)太多了。初代圍棋AI使用窮舉法失敗后,現(xiàn)在AlphaGo運(yùn)用的是人工神經(jīng)網(wǎng)絡(luò)。要知道,由暴力窮舉法得出來(lái)的棋子下法,才會(huì)是絕對(duì)正確的。
人工神經(jīng)網(wǎng)絡(luò)采用抽樣評(píng)估,在樣本足夠多足夠好的情況下,可以得到趨近于100%正確的決策。人工神經(jīng)網(wǎng)絡(luò)只能無(wú)限趨近于正確,并做不到100%正確。理論上AlphaGo肯定是有弱點(diǎn)的,人類(lèi)棋手仍然有很小的機(jī)會(huì)能獲勝。但AlphaGo有人工神經(jīng)網(wǎng)絡(luò)支持,李世石跟AlphaGo對(duì)戰(zhàn),仿佛一個(gè)李世石在跟千萬(wàn)個(gè)李世石戰(zhàn)斗,這勝算很低。
AlphaGo仍在不斷成長(zhǎng),面對(duì)強(qiáng)大的電腦AI,人類(lèi)棋手已經(jīng)絕望了。
圍棋、麻將這些棋牌游戲,其實(shí)是屬于桌游的范疇。像象棋、圍棋這類(lèi)沒(méi)有隨機(jī)性亦即沒(méi)有運(yùn)氣成分的桌游,水平檔次不一樣的玩家對(duì)戰(zhàn)時(shí)差距太大,勝負(fù)沒(méi)有懸念,玩起來(lái)沒(méi)勁;作為娛樂(lè),大眾更喜歡有隨機(jī)性亦即有運(yùn)氣成分的桌游,如麻將、德州撲克等等。由于是隨機(jī)摸牌,手氣好的低手也有機(jī)會(huì)贏高手,誰(shuí)勝誰(shuí)負(fù)要到最后才能揭曉,玩起來(lái)更有樂(lè)趣。
2、德州撲克
玩有隨機(jī)性的游戲,再厲害的電腦AI也不能保證肯定能贏人類(lèi)。不過(guò)在隨機(jī)性上人類(lèi)跟電腦AI是平等的,在贏面上電腦AI還是會(huì)勝出。
另外有一個(gè)關(guān)鍵點(diǎn),就是“完整信息博弈”跟“非完整信息博弈”的區(qū)別。
玩像象棋、圍棋這類(lèi)桌游時(shí),對(duì)弈的雙方都能看到各自有什么棋子又在什么位置等完整的信息,這種情況被稱(chēng)為“完整信息博弈”;而玩像麻將、德州撲克這類(lèi)桌游時(shí),情況大不相同,每個(gè)玩家的手牌只有自己才知,其他玩家是無(wú)法看到的,這種情況被稱(chēng)為“非完整信息博弈”。電腦AI又能不能玩轉(zhuǎn)“非完整信息博弈”呢?
不熟悉德州撲克或者初步接觸德州撲克的玩家,可能會(huì)覺(jué)得玩德州撲克輸贏很大程度上依賴(lài)運(yùn)氣,這種觀點(diǎn)其實(shí)是不對(duì)的。
德州撲克遠(yuǎn)不止石頭剪刀布那么簡(jiǎn)單,有著很多策略技巧,你被高手虐過(guò)就能深刻認(rèn)識(shí)這一點(diǎn)了。毫無(wú)技巧可言的玩家,確實(shí)有可能抓到一把好牌想不贏都不行,但是德州撲克是需要投注的,依籌碼論輸贏,你看上去要贏的這一把,別人不跟你玩,你也贏不了多少,幾把下來(lái),綜合戰(zhàn)績(jī),高手跟低手的差距會(huì)越來(lái)越大。
DeepStack、Libratus就是國(guó)外不同大學(xué)新研究出來(lái)的德州撲克AI,已經(jīng)能夠戰(zhàn)勝人類(lèi)職業(yè)牌手了。DeepStack 玩的是“一對(duì)一無(wú)限注德州撲克”,玩法比有限下注要復(fù)雜得多,不過(guò)研究DeepStack的團(tuán)隊(duì)只是發(fā)表了一篇這樣的論文而已。Libratus則模仿了 AlphaGo 的套路,提供了20 萬(wàn)美元獎(jiǎng)金,公開(kāi)邀請(qǐng)人類(lèi)全球排名靠前的頂尖牌手對(duì)決,這顯然要比一篇論文更能吸引眼球。
可以看到,人工神經(jīng)網(wǎng)絡(luò)在“非完整信息博弈”的情況下仍然有效,電腦AI仍然能夠統(tǒng)治戰(zhàn)局。
3、星際爭(zhēng)霸
Google Deepmind團(tuán)隊(duì)的AlphaGo玩圍棋征服了世界棋壇,這只是他們的第一步。Deepmind還宣稱(chēng)要挑戰(zhàn)暴雪公司的游戲《星際爭(zhēng)霸2》。
《星際爭(zhēng)霸2》是一款經(jīng)典的即時(shí)戰(zhàn)略游戲,由于在游戲中有“戰(zhàn)爭(zhēng)迷霧”的存在,即各位玩家控制的單位有視野的限制不在附近的敵方單位就看不到,這也是屬于“非完整信息博弈”。《星際爭(zhēng)霸2》的變化可要比德州撲克多得多,Deepmind何時(shí)能夠征服《星際爭(zhēng)霸2》,這是一個(gè)問(wèn)題。
德州撲克是回合制桌游,《星際爭(zhēng)霸2》則是視頻游戲,是需要操作的。人類(lèi)玩家玩《星際爭(zhēng)霸2》,需要用鼠標(biāo)鍵盤(pán)控制己方單位。而如果是電腦AI,根本就可以完全拋開(kāi)鼠標(biāo)鍵盤(pán),直接下指令,操作的準(zhǔn)確性是人類(lèi)玩家無(wú)法匹敵的,簡(jiǎn)直可以說(shuō)是“神一般”的操作。
暴雪公司就聲明,電腦AI不能在操作上占人類(lèi)玩家便宜,得作出限制。畢竟,電腦AI要跟人類(lèi)比的只是智商,而非操作。傻子才會(huì)跟電腦比誰(shuí)打字快吧?拼操作毫無(wú)意義。
電腦AI對(duì)于游戲是有著特殊意義的。其實(shí)《星際爭(zhēng)霸2》本身就設(shè)計(jì)有電腦AI,雖然不是使用人工神經(jīng)網(wǎng)絡(luò)技術(shù),但也具有一定程度的水平,在游戲中人類(lèi)玩家可以選擇跟電腦AI對(duì)戰(zhàn),有著獨(dú)特的樂(lè)趣。也就是電腦AI陪著玩家玩游戲,在游戲制作上有著重要意義,只要游戲公司有技術(shù)實(shí)力去開(kāi)發(fā)稱(chēng)職的電腦AI。
在對(duì)戰(zhàn)游戲中,暴雪公司的電腦AI屬于做得很不錯(cuò)的。有很多玩家,還不一定能打得過(guò)《星際爭(zhēng)霸2》的專(zhuān)家級(jí)電腦呢。
另外,我們可以看到《星際爭(zhēng)霸2》是一款策略性非常強(qiáng)的游戲,如果電腦AI能夠征服《星際爭(zhēng)霸2》,是否意味著電腦AI能在現(xiàn)實(shí)世界正式的軍事戰(zhàn)爭(zhēng)中大有作為?
三、書(shū)——書(shū)法:
早在2015年,香港大學(xué)教授徐揚(yáng)生便領(lǐng)導(dǎo)他的團(tuán)隊(duì)開(kāi)發(fā)出了能夠用毛筆書(shū)寫(xiě)各種字體的書(shū)法機(jī)器人,效果相當(dāng)好。
在今年2017年,阿里巴巴也展示了阿里云人工智能ET現(xiàn)場(chǎng)為員工書(shū)寫(xiě)春聯(lián)。
就筆者來(lái)看,機(jī)器人寫(xiě)書(shū)法這件事,實(shí)際應(yīng)用效果并不太大,畢竟這跟直接用電腦打印各種藝術(shù)字體有多大的區(qū)別?拋開(kāi)天價(jià)的名家書(shū)法作品不說(shuō),普通的書(shū)法作品,價(jià)值并不高。會(huì)有人特別想買(mǎi)機(jī)器人寫(xiě)的書(shū)法嗎?
說(shuō)起來(lái),我們最想要的,其實(shí)是想要自己寫(xiě)的字變得更漂亮一些吧……個(gè)性藝術(shù)簽名設(shè)計(jì)的需求一直這么旺盛正說(shuō)明了這一點(diǎn)。有沒(méi)有能美化一般人寫(xiě)的字的智能工具軟件?這還真有。日本人開(kāi)發(fā)的Ougishi就是一款這樣的軟件,能將你寫(xiě)的字變換成像王羲之之類(lèi)書(shū)法名家寫(xiě)的風(fēng)格。
大家可以看看筆者利用Ougishi創(chuàng)作出來(lái)的像模像樣的書(shū)法作品——《玄之又玄(打一字)》:
可惜的是Ougishi很早就停止版本更新了,還是停留在XP時(shí)代的技術(shù)。
筆者覺(jué)得,利用現(xiàn)在大熱的人工神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)技術(shù),能做得更好,能有翻天覆地的新感覺(jué)。能令使用者寫(xiě)的字,在保留原來(lái)的基本骨架的前提下,變成某位書(shū)法名家的筆法。這樣的技術(shù),不但可以用來(lái)美化使用者寫(xiě)的字,還能用于指導(dǎo)使用者學(xué)習(xí)書(shū)法,用來(lái)練字。
四、畫(huà)-美術(shù):
1、圖片放大降噪
我們看好萊塢大片的時(shí)候,經(jīng)??吹竭@樣的場(chǎng)景:中央情報(bào)局(CIA)或聯(lián)邦調(diào)查局(FBI)的頭兒指著屏幕上監(jiān)控錄像中某一個(gè)人的臉對(duì)手下說(shuō):把這個(gè)放大看看。這樣的科技,在現(xiàn)實(shí)中要怎樣實(shí)現(xiàn)呢?
我們可以利用深度卷積神經(jīng)網(wǎng)絡(luò)來(lái)處理。卷積神經(jīng)網(wǎng)絡(luò)是人工神經(jīng)網(wǎng)絡(luò)的一種,是當(dāng)前語(yǔ)音分析和圖像識(shí)別領(lǐng)域的研究熱點(diǎn)。
這一個(gè)演示網(wǎng)站就使用了這樣的技術(shù)來(lái)對(duì)圖片進(jìn)行放大和降噪:http://waifu2x.udp.jp/。
waifu2x是專(zhuān)門(mén)針對(duì)插圖來(lái)進(jìn)行處理的,對(duì)照片進(jìn)行處理的效果就沒(méi)那么好。開(kāi)發(fā)者先將一批插圖縮小,和原圖一起提供給機(jī)器學(xué)習(xí)如何放大縮小圖片,經(jīng)過(guò)大量數(shù)據(jù)訓(xùn)練后,機(jī)器的算法不斷自行優(yōu)化處理方式,就學(xué)會(huì)如何為其它圖片放大縮小。
依waifu2x的算法,動(dòng)漫風(fēng)格的畫(huà),線(xiàn)條感明顯、色彩不太復(fù)雜的,用waifu2x來(lái)放大降噪效果非常好,線(xiàn)條銳利,色彩鮮明,相當(dāng)于無(wú)損放大后還降噪處理了,實(shí)際出來(lái)的效果好到讓人驚訝。但對(duì)復(fù)雜的照片,效果就不夠理想,但是也能用。
要知道,圖片是由一個(gè)個(gè)像素組成的,直接放大就是將這一個(gè)個(gè)像素都放大了,慘不忍睹。像Photoshop之類(lèi)軟件、相機(jī)(手機(jī))的數(shù)碼變焦,使用的是插值放大,通過(guò)運(yùn)算在原來(lái)的像素之間插入一些新的像素,使色彩過(guò)渡得更平滑。而waifu2x能夠利用神經(jīng)網(wǎng)絡(luò),針對(duì)放大圖片的線(xiàn)條、顏色、網(wǎng)點(diǎn)等特點(diǎn)做特殊的算法調(diào)整,從而達(dá)到比插值放大要好得多的效果。
2、自動(dòng)描線(xiàn)與自動(dòng)上色
畫(huà)漫畫(huà)、插畫(huà),描線(xiàn)和上色是基本功也是基本工作,如果有了自動(dòng)描線(xiàn)和自動(dòng)上色的新技術(shù),畫(huà)師能剩下很多工夫。描線(xiàn)和上色不過(guò)關(guān)的繪畫(huà)愛(ài)好者,也能借助新科技提升自己作品的水平。
在2016年,日本早稻田大學(xué)就開(kāi)發(fā)出了自動(dòng)描線(xiàn)和自動(dòng)上色的技術(shù),使用了人工神經(jīng)網(wǎng)絡(luò)技術(shù)。
用鉛筆畫(huà)的復(fù)雜的草稿圖,能通過(guò)機(jī)器利用神經(jīng)網(wǎng)絡(luò)算法,自動(dòng)識(shí)別圖像并確定圖像的具體輪廓完成描線(xiàn)的工作,從而轉(zhuǎn)換成像手工描線(xiàn)畫(huà)出的線(xiàn)稿。大家來(lái)看看展示圖,效果相當(dāng)?shù)捏@人:
早稻田大學(xué)還有一項(xiàng)為黑白照片自動(dòng)上色的技術(shù),也是先行利用神經(jīng)網(wǎng)絡(luò)訓(xùn)練機(jī)器獲取經(jīng)驗(yàn)。然后,利用人工智能分析照片的整體特征,提取照片中的重要元素并進(jìn)行上色。
在2017年的年初,我們看到有這么一個(gè)能為圖片自動(dòng)上色的網(wǎng)站火了:https://paintschainer.preferred.tech/。
其技術(shù)也是利用神經(jīng)網(wǎng)絡(luò),提供許多上色插圖來(lái)讓AI不斷學(xué)習(xí)、自我完善算法,從而獲得為圖片自動(dòng)上色的技能。跟waifu2x類(lèi)似,對(duì)動(dòng)漫風(fēng)格的線(xiàn)稿處理得很好,而對(duì)黑白照片的處理則可謂一塌糊涂。
要想效果好,提供的圖片需要是線(xiàn)條感明顯的線(xiàn)稿(網(wǎng)站上已表明 “line drawing image”)。筆者試著上傳杜甫的國(guó)畫(huà)(網(wǎng)友們不知道是否記得“杜甫很忙”這一網(wǎng)友系列惡搞涂鴉事件?),發(fā)現(xiàn)上色的效果相當(dāng)出色。大家來(lái)看看原圖跟AI處理后的圖片的對(duì)比圖。
使用者如對(duì)直接處理的色彩不滿(mǎn)意,還可以用網(wǎng)頁(yè)提供的工具為原圖各個(gè)區(qū)域標(biāo)注上提示顏色,再讓AI處理,效果會(huì)更理想。
筆者還試著上傳了一些黑白照片,AI的處理結(jié)果讓人掩面淚崩。看來(lái),要對(duì)黑白照片上色,還是得看早稻田大學(xué)的那種技術(shù)。
3、圖片合成
Ostagram是基于谷歌Deepmind算法的圖像合成工具:http://www.ostagram.ru。
這種技術(shù),也是利用了人工神經(jīng)網(wǎng)絡(luò)進(jìn)行深度學(xué)習(xí),能夠?qū)蓮垐D片很神奇地合成為一張有著令人大吃一驚的效果的圖片。大家來(lái)看看效果:
大家也可以到這個(gè)網(wǎng)站:https://deepdreamgenerator.com。
這個(gè)網(wǎng)站能提供每小時(shí)處理10張圖片的服務(wù)。這圖片數(shù)量很充裕了,因?yàn)锳I處理圖片需要時(shí)間,電腦運(yùn)算速度快的話(huà)如果沒(méi)有限制每小時(shí)能處理不止10張圖片,但到了10張的限制時(shí)稍微等一下便又能用了。
網(wǎng)站的圖片處理有預(yù)設(shè)的風(fēng)格。當(dāng)然,大家肯定是想自己玩一下個(gè)性風(fēng)格。那么,需要先上傳一張?jiān)瓐D,再上傳一張作為風(fēng)格參考的圖片,處理時(shí)有一些參數(shù)控制,懂的網(wǎng)友可以自己再調(diào)整一下。AI會(huì)提取第二張圖片的風(fēng)格特征,用于處理第一張圖片。
你可以上傳一張照片,再上傳一張某種風(fēng)格的畫(huà)作,于是AI會(huì)將照片處理成某種畫(huà)風(fēng)的樣子。于是,人人都可以成為大畫(huà)家量產(chǎn)畢加索了!當(dāng)然,你盡可以異想天開(kāi),發(fā)揮腦洞,用令人意想不到的圖片,合成出似乎不會(huì)出現(xiàn)在這個(gè)世上的神奇圖片來(lái)。
最近,美國(guó)康奈爾大學(xué)與Adobe公司也研發(fā)出了一項(xiàng)類(lèi)似谷歌Deepmind的技術(shù)“Deep Photo Style Transfer”,能將一張圖片的風(fēng)格套用到另一張圖片上,包括色彩以及光線(xiàn)。
通過(guò)深度學(xué)習(xí)程序,AI能對(duì)照片中的色彩與光線(xiàn)性質(zhì)進(jìn)行分析,理解并還原照片的天氣狀況、季節(jié)、時(shí)間,還能區(qū)分天空和大地。在實(shí)際應(yīng)用中也做得更好,不但能從整體上改變圖片的風(fēng)格,還能只針對(duì)圖片的某一細(xì)節(jié)部分進(jìn)行改變,例如一棟大樓的窗戶(hù)。
預(yù)計(jì)“Deep Photo Style Transfer”這一項(xiàng)技術(shù)未來(lái)可能成為Photoshop中的一個(gè)插件,能令用戶(hù)如虎添翼。
五、文學(xué)創(chuàng)作:
用電腦AI來(lái)玩文學(xué)可謂“歷史悠久”了。微軟亞洲研究院自然語(yǔ)言計(jì)算組研究開(kāi)發(fā)有電腦對(duì)聯(lián),至于作詩(shī)的則是一抓一大把,有的還宣稱(chēng)通過(guò)了圖靈測(cè)試。但是通過(guò)了圖靈測(cè)試又怎么樣呢?只是讓人無(wú)法分辨到底是人類(lèi)還是人工智能創(chuàng)作的,并不代表好壞。要想實(shí)際應(yīng)用,還得達(dá)到一定程度的文學(xué)欣賞水準(zhǔn)。
谷歌為了使他們的AI更加健談,讓AI閱讀了大量的愛(ài)情小說(shuō),于是AI現(xiàn)在也能寫(xiě)出一些多愁善感的詩(shī)歌了。谷歌的工程師為AI設(shè)計(jì)了每首詩(shī)的開(kāi)頭和結(jié)尾,然后AI能往中間填充適當(dāng)?shù)木渥訌亩堰@些內(nèi)容串起來(lái)成為完整的詩(shī)。但AI只是一遍一遍地重復(fù)學(xué)習(xí)過(guò)的語(yǔ)句,它并沒(méi)有一雙在生活中尋找發(fā)現(xiàn)的眼睛,無(wú)法發(fā)揮創(chuàng)意。
我們可以看到這個(gè)世界已經(jīng)有很多寫(xiě)作軟件。最近熱議的網(wǎng)文抄襲事件也讓人見(jiàn)識(shí)到了寫(xiě)作軟件的“厲害”之處。
正可謂“天下文章一大抄”,現(xiàn)在國(guó)內(nèi)的一些寫(xiě)作軟件號(hào)稱(chēng)“寫(xiě)作神器”,能夠提供許多寫(xiě)作素材,方便作者調(diào)用,當(dāng)然,這些寫(xiě)作素材是從網(wǎng)上搜集來(lái)的,版權(quán)方面問(wèn)題很大,作者調(diào)用這些素材來(lái)寫(xiě)作當(dāng)然得算抄襲。
因?yàn)檫@類(lèi)寫(xiě)作軟件用起來(lái)太方便,不少網(wǎng)絡(luò)小說(shuō)作者就是愛(ài)用,被發(fā)現(xiàn)抄襲并舉報(bào)的一大批,就有小說(shuō)被網(wǎng)站封掉的。這類(lèi)“寫(xiě)作神器”,只是將網(wǎng)文書(shū)庫(kù)里的那些描寫(xiě)隨機(jī)組合,談不上什么人工智能。
順便說(shuō)一下,我們見(jiàn)到的寫(xiě)作軟件,還提供角色姓名、地名、門(mén)派、功法、兵器等等隨機(jī)起名等工具,對(duì)小說(shuō)作者還是很有用的,先隨機(jī)起一個(gè)名字,再修改美化一下,也不怕犯抄襲。
還有,寫(xiě)小說(shuō)更重要的是編故事。國(guó)內(nèi)暫時(shí)還不見(jiàn)有這方面功能突出的寫(xiě)作軟件,一般頂多提供故事樹(shù)模板讓作者自行填寫(xiě)。
在國(guó)外,有做得更好的寫(xiě)作軟件。如Dramatica這個(gè)軟件,內(nèi)置了超過(guò)3萬(wàn)個(gè)故事結(jié)構(gòu),分門(mén)別類(lèi),能從一開(kāi)始引導(dǎo)使用者一步一步地將想法化為及格的故事,如何設(shè)計(jì)沖突、塑造人物。
Dramatica是一款不錯(cuò)的寫(xiě)作軟件,可惜只有英文版,國(guó)內(nèi)的作者不好用。Dramatica在寫(xiě)作的過(guò)程起的是引導(dǎo)、提醒、評(píng)估等的作用,雖然有作用,可謂不錯(cuò)的智能工具,但也談不上多高級(jí)的人工智能。
然而隨著人工智能的發(fā)展,它遲早會(huì)進(jìn)入文學(xué)創(chuàng)作的核心領(lǐng)域。現(xiàn)在AI能做更厲害的事情了。
日本科研人員開(kāi)發(fā)的AI,寫(xiě)出的小說(shuō)拿來(lái)參加比賽,都能通過(guò)初審了。紐約大學(xué)的AI研究人員就用AI創(chuàng)作了一部電影劇本,這個(gè)劇本隨后被拍成了一部名為《Sunspring》的短片,主角的飾演者也是飾演過(guò)美劇《硅谷》男主角查理的 Thomas Middleditch,該短片參加了倫敦科幻電影節(jié)(Sci-Fi London) 48 小時(shí)挑戰(zhàn)單元。
跟小說(shuō)創(chuàng)作相比較,新聞寫(xiě)作更容易讓AI上手。現(xiàn)在國(guó)內(nèi)的騰訊、阿里巴巴、今日頭條等等紛紛推出了自己的自動(dòng)化新聞寫(xiě)作AI。
新聞寫(xiě)作跟小說(shuō)寫(xiě)作不同,不需要“無(wú)中生有”創(chuàng)造出一個(gè)新故事,只需要挖掘線(xiàn)索,管理素材,容易實(shí)現(xiàn)模板式寫(xiě)作。而且,AI要比人類(lèi)博聞強(qiáng)記,整理線(xiàn)索和素材要比真人強(qiáng),相較真人寫(xiě)作,是擁有一方面優(yōu)勢(shì)的。你說(shuō),發(fā)些財(cái)經(jīng)消息、體育比賽訊息,需要多高文學(xué)水平???用AI來(lái)編寫(xiě)不更省力省時(shí)間?
新聞報(bào)道這類(lèi)屬于非虛構(gòu)文學(xué)創(chuàng)作,而小說(shuō)一般屬于虛構(gòu)文學(xué)創(chuàng)作,前者目前的電腦AI有辦法應(yīng)付,而后者目前還存在諸多不足。研究小說(shuō)創(chuàng)作的AI,要求研究者得懂小說(shuō)創(chuàng)作。
建議相關(guān)研究者先研究一下類(lèi)似Dramatica這樣的軟件,弄懂怎樣引導(dǎo)AI寫(xiě)出一篇各方面結(jié)構(gòu)完善的小說(shuō)。也就是先做好小說(shuō)建模,讓AI寫(xiě)出一篇及格的小說(shuō)。之后,也可以利用人工神經(jīng)網(wǎng)絡(luò),提供海量數(shù)據(jù),訓(xùn)練AI寫(xiě)出更好的小說(shuō)。
我們可以看看前面提到的日本人工智能研究人員是怎么做的。有兩種典型的創(chuàng)作方法。
日本公立函館未來(lái)大學(xué)教授松原仁率領(lǐng)的團(tuán)隊(duì)名為“任性的人工智能之我是作家”,其兩部作品是由人類(lèi)事先設(shè)定好登場(chǎng)人物、內(nèi)容大綱等相當(dāng)于文章“零部件”的內(nèi)容,人工智能AI再根據(jù)這些內(nèi)容自動(dòng)生成小說(shuō)。
這一種,AI做的主要方面是“描寫(xiě)”,感覺(jué)有些類(lèi)似網(wǎng)絡(luò)寫(xiě)手設(shè)定好故事情節(jié)之后,利用國(guó)產(chǎn)“寫(xiě)作神器”抄襲別人作品的描寫(xiě)。筆者不免有些擔(dān)心,AI寫(xiě)作是否會(huì)遭遇版權(quán)問(wèn)題?又如谷歌的AI,學(xué)了那么多愛(ài)情小說(shuō)的句子,重新排列組合,要到怎么樣的隨機(jī)程度,才能洗脫抄襲的嫌疑?
東京大學(xué)副教授鳥(niǎo)海不二夫率領(lǐng)的團(tuán)隊(duì)“人狼智能”的兩部作品,則在人工智能之間玩“狼人游戲”(一款推理類(lèi)桌游),然后選出有意思的故事發(fā)展,再由人類(lèi)改編成小說(shuō)。筆者更欣賞這一種方式,而且這不就是美劇的編劇方式嗎?美劇的故事情節(jié)總是有許多方向的發(fā)展可能,而編劇會(huì)根據(jù)情況選擇其中的一種。
筆者有些腦洞,相關(guān)研究者不妨參考一下。比如說(shuō),谷歌的圖像合成算法Deepmind也可以運(yùn)用到小說(shuō)改編上,也就是將兩部不同的小說(shuō)合成一部神奇的小說(shuō)。例如,將《三國(guó)演義》跟《紅樓夢(mèng)》合體,會(huì)怎么樣?提取《紅樓夢(mèng)》的風(fēng)格特征,重新演繹《三國(guó)演義》,出來(lái)的效果會(huì)如何?AI的演算結(jié)果相信會(huì)令世人震驚不已……
這一種方式,也有很大的實(shí)用意義。比如某影視公司買(mǎi)下了某軍事小說(shuō)的版權(quán),又買(mǎi)下某言情小說(shuō)的版權(quán),公司高層想某軍事小說(shuō)改編影視劇時(shí)加入愛(ài)情元素從而更適應(yīng)市場(chǎng)的娛樂(lè)審美,那么,能否提取某愛(ài)情小說(shuō)的風(fēng)格特征,重新演繹某軍事小說(shuō)?
這并不是不可能做到的事。先說(shuō)簡(jiǎn)單的,讓智能機(jī)器人為小孩講故事。這現(xiàn)在就能做到,故事從素材庫(kù)里隨機(jī)抽取便可,但要想講的故事有更多變化不讓人膩味,能怎么做呢?
比如說(shuō)有一個(gè)A故事:小熊不會(huì)爬樹(shù),熊媽媽鼓勵(lì)它。又有一個(gè)B故事,小鳥(niǎo)學(xué)唱歌。我們可以訓(xùn)練AI,將A故事和B故事合成一個(gè)新的C故事:小鳥(niǎo)不會(huì)唱歌,鳥(niǎo)媽媽鼓勵(lì)它。這是非常簡(jiǎn)單的變換。
只要我們繼續(xù)努力去研究,相信能做出更復(fù)雜的變換,提取《三國(guó)演義》的風(fēng)格特征重新演繹《紅樓夢(mèng)》并不是夢(mèng)。Deepmind創(chuàng)造出的神奇圖片,表明了“關(guān)公戰(zhàn)秦瓊”也許會(huì)非常精彩。讓我們一起去夢(mèng)想吧。(本文首發(fā)鈦媒體)






快報(bào)
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論
人工智能雖然現(xiàn)在只處于初級(jí)階段,但已經(jīng)慢慢的影響了我們的生活,想現(xiàn)在的語(yǔ)音類(lèi)軟件,靈犀語(yǔ)音助手,siri等,這些軟件讓我們的生活更加便利。很期待以后不需要?jiǎng)邮值娜兆印?/p>
邏輯無(wú)誤后相關(guān)計(jì)算運(yùn)作都有可能。
藝術(shù)的背后也只是我們理智的不完備
不僅僅是
麻將上吧