免费看在线a黄视频|99爽99操日韩毛片儿|91停婷在线无码观看|日韩三级片小视频|一级黄片免费播放|欧美成人视频网站导航|亚洲日韩欧美七区|国产视频在线观看91|人成视频免费在线播放|国产精品成人在线免费观看

百年老圖難倒谷歌AI,網(wǎng)友:是鴨是兔?連我都不能確定

谷歌AI凌亂了。

鈦媒體注:本文來(lái)源于微信公眾號(hào)量子位(ID:QbitAI),作者:岳排槐、安妮,鈦媒體經(jīng)授權(quán)發(fā)布。

上面那張圖,畫(huà)的是鴨子還是兔子?

自從1892年首次出現(xiàn)在一本德國(guó)雜志上之后,這張圖就一直持續(xù)引發(fā)爭(zhēng)議。有些人只能看到一只兔子,有些人只能看到一只鴨子,有些人兩個(gè)都能看出來(lái)。

心理學(xué)家用這張圖證明了一件事,視覺(jué)感知不僅僅是人們看到了什么,也是一種心理活動(dòng)。但是,這張圖到底應(yīng)該是什么?

上周四,有位學(xué)者決定讓沒(méi)有心理活動(dòng)的第三方看一下。然后就把這張圖片給了谷歌AI,結(jié)果AI認(rèn)為78%的概率是一只鳥(niǎo),68%的概率是一只鴨子。

所以,百年?duì)幷摽梢孕耍盔喿优蓜俪觯?/p>

不不不,新的爭(zhēng)論剛剛開(kāi)始。

這下難倒了谷歌AI

上面那個(gè)結(jié)論剛出,就有人跳出來(lái)“抬杠”。

只要把這張圖豎起來(lái)給AI看,它認(rèn)為是一只兔子,壓根就沒(méi)有鴨子的事兒。

咦?谷歌AI反水了?

為了搞清楚這件事,供職于BuzzFeed的數(shù)據(jù)科學(xué)家Max Woolf設(shè)計(jì)了一個(gè)更復(fù)雜的實(shí)驗(yàn),他干脆讓這張圖旋轉(zhuǎn)起來(lái),倒是要看看,谷歌AI什么表現(xiàn)。

就是這么一轉(zhuǎn),成了推特上的熱門(mén)。

咱們以鴨子嘴(兔子耳朵)為參考,說(shuō)下這個(gè)實(shí)驗(yàn)的結(jié)果。過(guò)程如下所示。紅色代表兔子,藍(lán)色代表鴨子。

圖片順時(shí)針旋轉(zhuǎn)。谷歌AI最初認(rèn)為是鴨子,鴨子嘴指向9點(diǎn)方向。隨著鴨子嘴向上轉(zhuǎn)到10點(diǎn)方向,很快谷歌AI就認(rèn)為畫(huà)里面是兔子了,直到鴨子嘴轉(zhuǎn)到2點(diǎn)方向之后。此后一段時(shí)間,谷歌AI認(rèn)為既不是鴨子也不是兔子。一直到7點(diǎn)方向,谷歌AI再次肯定是一只鴨子。

有人說(shuō)此刻谷歌AI的內(nèi)心,可能就像迪士尼動(dòng)畫(huà)兔八哥里的這個(gè)場(chǎng)景。

還有人給了更多類(lèi)似的挑戰(zhàn)圖片,想考驗(yàn)一下谷歌AI的水平。

比如這種:

以及這種:

等等等等……據(jù)說(shuō)能看出來(lái)鴨子,又能看出來(lái)兔子,說(shuō)明一個(gè)人的想象力更好。

大家如果有興趣,可以自己去嘗試。

這里用到的谷歌AI,實(shí)際上是谷歌的Cloud Vision。這個(gè)服務(wù)提供了預(yù)訓(xùn)練的機(jī)器學(xué)習(xí)模型,可以用來(lái)理解圖片內(nèi)容。地址在此:

https://cloud.google.com/vision/

頁(yè)面上提供了Try the API,直接傳圖就行~

鴨兔幻覺(jué)

“鴨兔同圖”問(wèn)題讓不少網(wǎng)友犯了難,這是一個(gè)比“雞兔同籠”更玄幻更有意思的問(wèn)題。還有一大波人類(lèi),正常嘗試判斷AI的心理狀態(tài)……

網(wǎng)友sangnoir認(rèn)為,糾結(jié)圖中到底是什么完全沒(méi)有意義,圖像本身中既包含了兔子又包含了鴨子,人類(lèi)尚且覺(jué)得兩者都在,何必非得讓AI去做“二選一”的定性呢?

下面這個(gè)數(shù)字大家都認(rèn)識(shí),但是旋轉(zhuǎn)起來(lái),到底是幾呢?

若旋轉(zhuǎn)起來(lái),圖片是“6”還是“9”?

談到旋轉(zhuǎn),更進(jìn)一步,之前有個(gè)“旋轉(zhuǎn)舞者”的問(wèn)題更困難,下面這個(gè)小人到底是順時(shí)針還是逆時(shí)針旋轉(zhuǎn),人類(lèi)的看法也兵分兩路↓↓↓

實(shí)際上,當(dāng)你視線(xiàn)以從左往右的方向掃過(guò)這張圖時(shí),你看到的是逆時(shí)針轉(zhuǎn)圈,反之,當(dāng)你先看到的是右邊時(shí),你眼中的她是順時(shí)針的。在計(jì)算機(jī)視覺(jué)上,還有一個(gè)專(zhuān)門(mén)的名詞解釋這個(gè)現(xiàn)象,即多穩(wěn)態(tài)/雙穩(wěn)態(tài)感知。

也有網(wǎng)友表示,這件事恰恰反映了AI識(shí)別物體的能力已經(jīng)高于人類(lèi)了。

他認(rèn)為,之所以Google Cloud Vision會(huì)連續(xù)給出不同答案,是因?yàn)锳I系統(tǒng)每隔一段時(shí)間就會(huì)基于旋轉(zhuǎn)的圖像重新判斷并實(shí)時(shí)更新。

而人類(lèi)的大腦往往就卡在第一印象了,所以才會(huì)咬定一個(gè)物種不放松。

也有人表示,這件事也啟發(fā)了視覺(jué)從業(yè)者反思AI識(shí)別物體時(shí)的方向問(wèn)題。

比如網(wǎng)友Sharlin就認(rèn)為,人類(lèi)在判斷物體時(shí)對(duì)于空間的認(rèn)識(shí)具有先驗(yàn)性,用這樣的標(biāo)注數(shù)據(jù)訓(xùn)練出的模型,在不知不覺(jué)中也將空間和方向等因素考慮在內(nèi)了。

但是,現(xiàn)在大多數(shù)視覺(jué)算法都想努力實(shí)現(xiàn)某種程度的旋轉(zhuǎn)不變性,還提出了“尺度不變特征轉(zhuǎn)化(SIFT)”等概念。“不變性”可能也反映了人類(lèi)的局限性,輸入方向也是一個(gè)重要考慮因素。

膠囊網(wǎng)絡(luò)或許可行

同一張圖片,由于位置不同,AI就產(chǎn)生了不同的判斷。也有很多人想到了更多。

傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)CNN架構(gòu)中有個(gè)弊端,就是缺乏可用的空間信息。

一般來(lái)說(shuō),CNN提取、學(xué)習(xí)圖像特征來(lái)識(shí)別物體。拿面部識(shí)別任務(wù)來(lái)說(shuō),底層網(wǎng)絡(luò)學(xué)習(xí)一般性特征(比如面部輪廓等),隨著層數(shù)的加深,提取的特征就越復(fù)雜,特征也精細(xì)到眼睛、鼻子等器官。

問(wèn)題來(lái)了,神經(jīng)網(wǎng)絡(luò)用它學(xué)習(xí)到的所有特征作出最后的輸出,但唯獨(dú)沒(méi)有考慮到可用的空間信息。人類(lèi)可以識(shí)別出下面這張有些錯(cuò)位的人臉,但CNN就不能。

其實(shí),讓神經(jīng)網(wǎng)絡(luò)自己學(xué)會(huì)判斷空間的研究已經(jīng)有了。2017年,“深度學(xué)習(xí)”三巨頭之一的AI大牛Geoffrey Hitton就提出了一種“膠囊網(wǎng)絡(luò)”(Capsule Networks)的概念。

膠囊網(wǎng)絡(luò)的解決辦法是,實(shí)現(xiàn)對(duì)空間信息進(jìn)行編碼,也就是計(jì)算物體的存在概率。這可以用向量來(lái)表示,向量的模代表特征存在的概率,向量方向表示特征姿態(tài)信息。

在論文Dynamic Routing Between Capsules中,Hinton和谷歌大腦的同事Sara Sabour、Nicholas Frosst詳細(xì)解釋了“膠囊網(wǎng)絡(luò)”的詳細(xì)情況。

Hinton等人表示,人類(lèi)視覺(jué)系統(tǒng)中,有一個(gè)“注視點(diǎn)”的概念,能讓人類(lèi)在視野范圍內(nèi)只對(duì)極小部分的圖像進(jìn)行高分辨率處理。

這篇論文假設(shè)一個(gè)注視點(diǎn)帶給我們的信息不僅僅是一個(gè)識(shí)別對(duì)象及其屬性,還假設(shè)我們的多層視覺(jué)系統(tǒng)在每個(gè)注視點(diǎn)上都創(chuàng)建了一個(gè)類(lèi)似分析樹(shù)的東西,并忽略這些分析樹(shù)在多個(gè)注視點(diǎn)之間如何協(xié)調(diào)。

分析樹(shù)通??縿?dòng)態(tài)分配內(nèi)存來(lái)構(gòu)建,但是這篇論文假設(shè)對(duì)于單個(gè)注視點(diǎn)來(lái)說(shuō),分析樹(shù)是從固定多層神經(jīng)網(wǎng)絡(luò)中“雕刻”出來(lái)的,就像用石頭刻出雕像一樣。

神經(jīng)網(wǎng)絡(luò)的每一層會(huì)被分成很多組神經(jīng)元,每一組稱(chēng)為一個(gè)capsule,而分析樹(shù)的每個(gè)節(jié)點(diǎn)對(duì)應(yīng)著一個(gè)活躍的“膠囊”。

膠囊是輸出是一個(gè)向量,這篇論文中,在保持它方向不變的情況下應(yīng)用非線(xiàn)性縮小了它的量級(jí),確保這個(gè)非線(xiàn)性輸出不大于1。

也正因?yàn)槟z囊的輸出是一個(gè)向量,確保了能使用強(qiáng)大的動(dòng)態(tài)路由機(jī)制,來(lái)確保這個(gè)輸出能夠發(fā)送到上層合適的parent處。

膠囊網(wǎng)絡(luò)現(xiàn)在的研究階段,就像本世紀(jì)初將RNN應(yīng)用于語(yǔ)音識(shí)別的階段。有非常具有代表性的理由相信這是一個(gè)更好的方法,但很多細(xì)節(jié)還需要接續(xù)觀(guān)察。

想看“膠囊網(wǎng)絡(luò)”的具體信息,請(qǐng)戳量子位此前報(bào)道:

本文系作者 量子位 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請(qǐng)注明出處、作者和本文鏈接。
本內(nèi)容來(lái)源于鈦媒體鈦度號(hào),文章內(nèi)容僅供參考、交流、學(xué)習(xí),不構(gòu)成投資建議。
想和千萬(wàn)鈦媒體用戶(hù)分享你的新奇觀(guān)點(diǎn)和發(fā)現(xiàn),點(diǎn)擊這里投稿 。創(chuàng)業(yè)或融資尋求報(bào)道,點(diǎn)擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評(píng)論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論

請(qǐng) 登錄后輸入評(píng)論內(nèi)容
  • 左轉(zhuǎn)右轉(zhuǎn),真的有趣,我已經(jīng)看半個(gè)小時(shí)了

    回復(fù) 2019.03.12 · via pc
  • 標(biāo)題黨

    回復(fù) 2019.03.10 · via android

快報(bào)

更多

14:30

3月31日全國(guó)農(nóng)產(chǎn)品批發(fā)市場(chǎng)豬肉平均價(jià)格為15.31元/公斤,比昨天下降1.0%

14:25

工信部:前2個(gè)月我國(guó)集成電路設(shè)計(jì)收入636億元,同比增長(zhǎng)15.7%

14:23

工信部:前2個(gè)月我國(guó)軟件業(yè)務(wù)收入21534億元,同比增長(zhǎng)11.7%

14:17

聯(lián)合利華與味可美就食品業(yè)務(wù)進(jìn)行深入談判,最早于今日達(dá)成協(xié)議

14:16

南向資金凈買(mǎi)入額達(dá)50億港元

14:02

英國(guó)第四季度GDP年率終值為1%

13:58

吉利旗下沃飛長(zhǎng)空增資至3.6億

13:55

瑞銀:預(yù)計(jì)到年底金價(jià)將逐漸回落,未來(lái)幾年將走低

13:54

光纖概念震蕩回升,特發(fā)信息漲停

13:51

高盛:參考1990年石油危機(jī),美聯(lián)儲(chǔ)終將降息

13:50

創(chuàng)新藥概念午后再度活躍,海創(chuàng)藥業(yè)漲超11%

13:50

支付寶發(fā)布國(guó)內(nèi)首個(gè)“支付集成Skill”

13:46

騰訊WorkBuddy小程序上線(xiàn),支持"云端+本機(jī)"雙模式運(yùn)行

13:39

寧波商業(yè)航天產(chǎn)業(yè)基地項(xiàng)目將于4月開(kāi)啟招標(biāo),預(yù)計(jì)總投資額86.6億

13:39

滬深京三市成交額超1.5萬(wàn)億元,較上日此時(shí)放量62億元

13:29

瑞銀:中國(guó)市場(chǎng)調(diào)整或已過(guò)度,優(yōu)質(zhì)AI股票迎來(lái)布局窗口

13:24

北京消費(fèi)品以舊換新政策持續(xù)落地,帶動(dòng)銷(xiāo)售額約50億元

13:23

全國(guó)新能源汽車(chē)動(dòng)力電池溯源信息平臺(tái)正式啟動(dòng)

13:22

深圳:規(guī)模建設(shè)先進(jìn)級(jí)智能工廠(chǎng)

13:20

摩托車(chē)概念異動(dòng),宏昌科技走出20cm2連板

2

掃描下載App