?Anderson, Erin M., et al. "An edge-simplicity bias in the visual input to young infants." Science Advances 10.19 (2024): eadj8571.
2024年5月10號(hào)的Science Advance論文[3]采用了相似的實(shí)驗(yàn)設(shè)計(jì),即在嬰兒頭上安裝的攝像機(jī),直接觀察和分析他們?nèi)粘-h(huán)境中的視覺(jué)刺激。研究通過(guò)比較嬰兒觀察的圖像與成人的感知,發(fā)現(xiàn)嬰兒在日常環(huán)境中經(jīng)歷了獨(dú)特的視覺(jué)體驗(yàn),這種體驗(yàn)由簡(jiǎn)單、高對(duì)比度的圖案及其邊緣組成。嬰兒天生被日常環(huán)境中的高對(duì)比度圖案所吸引,這些圖案對(duì)他們大腦中視覺(jué)模塊的發(fā)育至關(guān)重要。
![]()
?圖1:實(shí)驗(yàn)設(shè)計(jì),嬰兒在視覺(jué)發(fā)育早期,傾向于觀察b圖中那樣由幾個(gè)高對(duì)比度的邊緣組成的圖案。來(lái)源:參考文獻(xiàn)3
認(rèn)知科學(xué)傳統(tǒng)的假設(shè)是視覺(jué)輸入對(duì)每個(gè)人基本相同,無(wú)論其發(fā)育階段如何。然而,新研究根據(jù)10名3-13周嬰兒(5名男性)以及對(duì)照組(10名31-70歲成年人)頭戴相機(jī)記錄的數(shù)據(jù),發(fā)現(xiàn)視覺(jué)輸入隨著發(fā)育而變化。它對(duì)每個(gè)人來(lái)說(shuō)都不是一樣的。非常年幼嬰兒的日常生活輸入似乎是那個(gè)年齡特有的。他們更喜歡注視簡(jiǎn)單、高對(duì)比度的場(chǎng)景(圖2),如寬大的黑色條紋和棋盤格。
![]()
?圖2:嬰兒偏好對(duì)比度高,邊緣簡(jiǎn)單的視覺(jué)輸入。來(lái)源:參考文獻(xiàn)3
按照簡(jiǎn)單與否,對(duì)比度強(qiáng)烈與否,研究者劃分了4個(gè)象限。他們發(fā)現(xiàn)嬰兒最喜歡的是具有簡(jiǎn)單邊界,又明暗對(duì)比強(qiáng)烈的圖案(圖3)。這下你明白了嬰孩轉(zhuǎn)動(dòng)他們的小腦袋在找什么了吧。
![]()
?圖3:不同特征組合的圖像,嬰兒和成年人觀察比例的占比。來(lái)源:參考文獻(xiàn)3
考慮到處理視覺(jué)皮層的V1區(qū)的功能是提取局部邊緣,供給后續(xù)的皮層以夠建有意義對(duì)象和場(chǎng)景。嬰兒的視覺(jué)偏好,是否能用于指導(dǎo)視覺(jué)模型的訓(xùn)練?2023年的一項(xiàng)NIPS論文[4]發(fā)現(xiàn),相比讓視覺(jué)識(shí)別模型使用用成年人觀察到的隨機(jī)圖案進(jìn)行訓(xùn)練,如果使用類似嬰兒發(fā)育早期觀察到的圖像進(jìn)行訓(xùn)練,人工智能系統(tǒng)在學(xué)習(xí)后識(shí)別視覺(jué)圖像方面的表現(xiàn)更出色。這項(xiàng)研究同樣是利用嬰兒的頭戴相機(jī)拍下的圖像,只是那時(shí)候研究者還不清楚嬰兒的視覺(jué)偏好。而新研究則暗示,對(duì)簡(jiǎn)單性和高對(duì)比度數(shù)據(jù)的偏好,可能有利于在視覺(jué)發(fā)育的早期對(duì)視覺(jué)皮層V1區(qū)的訓(xùn)練。而用于AI識(shí)別的卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)則是模仿人類視覺(jué)皮層設(shè)計(jì)的,因此展現(xiàn)出了類似的特征。
考慮到該研究的被試,是美國(guó)印第安納伯明翰大學(xué)教職員工的子女,他們所處的是一個(gè)人工構(gòu)造的非自然環(huán)境。因此該文的結(jié)論是否只適用于生長(zhǎng)于人工環(huán)境中的嬰兒,而不具備跨文化的普適性?對(duì)此的反駁來(lái)源于23年的研究[5],該研究對(duì)比了印度西奈一個(gè)小型擁擠的漁村里嬰兒的頭戴攝像頭觀測(cè)數(shù)據(jù)。西奈電力有限,大部分日常生活都在戶外進(jìn)行。結(jié)果顯示,西奈嬰兒觀測(cè)到的數(shù)據(jù)與西方的數(shù)據(jù)并沒(méi)有統(tǒng)計(jì)學(xué)上的差異,兩地的小孩都偏愛(ài)簡(jiǎn)單,高對(duì)比度的圖案。
基于這項(xiàng)研究,我們可以根據(jù)嬰兒視覺(jué)的觀察模式,去及早識(shí)別出如白內(nèi)障、斜視、屈光不正和上瞼下垂等發(fā)育早期就會(huì)出現(xiàn)的疾病,并及早干預(yù)。這些疾病會(huì)通過(guò)干擾視覺(jué)皮層的輸入來(lái)破壞人類視覺(jué)發(fā)育,導(dǎo)致視力異常。未來(lái)可以通過(guò)讓嬰兒佩戴攝像頭,通過(guò)算法檢測(cè)嬰兒是否沒(méi)有表現(xiàn)出對(duì)簡(jiǎn)單且高對(duì)比度圖像的偏好,從而以低成本對(duì)相關(guān)疾病進(jìn)行鑒別。
像馬,羊這樣的哺乳動(dòng)物,一出生就能跑。然而,人類嬰兒需要大約三個(gè)月時(shí)間才能聽(tīng)和看,之后還需六個(gè)月才能稍微控制姿勢(shì)和頭部。為什么人類需要這么長(zhǎng)的時(shí)間來(lái)讓神經(jīng)系統(tǒng)發(fā)育成熟?該研究提供了一個(gè)可能的解釋,即視覺(jué)系統(tǒng)會(huì)先訓(xùn)練用于識(shí)別邊緣的V1區(qū)域,之后在訓(xùn)練產(chǎn)生更抽象表征的V2-V6,而這樣緩慢的、逐步的優(yōu)化方式有助于構(gòu)建一個(gè)更加智能,更為靈活的視覺(jué)系統(tǒng)。
按照上述推論,可以讓大猩猩等靈長(zhǎng)類動(dòng)物的幼崽在其視覺(jué)發(fā)育的關(guān)鍵時(shí)期帶上攝像頭,去考察其是否會(huì)具有類似人類嬰兒的視覺(jué)偏好。雖然目前尚未找到這樣的研究,但考慮到2020年一篇對(duì)包括體型最小的靈長(zhǎng)類動(dòng)物鼠狐猴等多種靈長(zhǎng)類視覺(jué)系統(tǒng)的研究[6],研究者發(fā)現(xiàn)從最大的到最小的靈長(zhǎng)類動(dòng)物,視覺(jué)處理單元在大腦中的排列方式完全相同的,遵循著同樣的數(shù)學(xué)規(guī)則。
因此有理由推斷,有可能在大猩猩等靈長(zhǎng)類中觀測(cè)相似的規(guī)律。而對(duì)諸如馬,羊這種生下來(lái)就能運(yùn)動(dòng)的生物,則可能無(wú)法在其幼崽中觀察到對(duì)簡(jiǎn)單和高對(duì)比度的偏好性,對(duì)于像貓狗這樣同樣需要一段發(fā)育時(shí)期(從睜眼到正常行走,捕獵)卻又不是靈長(zhǎng)類的動(dòng)物,則難以推測(cè)。
類似的跨物種比較研究,將揭示不同的生物其視覺(jué)系統(tǒng)如何在慢發(fā)育帶來(lái)的更高智能與先天具備能力帶來(lái)進(jìn)化優(yōu)勢(shì)間進(jìn)行權(quán)衡,而這同樣是機(jī)器智能需要應(yīng)對(duì)的核心話題,不僅局限于視覺(jué)系統(tǒng),還涉及先天vs后天的一般性討論。
參考文獻(xiàn):
快報(bào)
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論