免费看在线a黄视频|99爽99操日韩毛片儿|91停婷在线无码观看|日韩三级片小视频|一级黄片免费播放|欧美成人视频网站导航|亚洲日韩欧美七区|国产视频在线观看91|人成视频免费在线播放|国产精品成人在线免费观看

AlphaGo首出Bug,圍棋第三代算法的死穴在哪兒?

圍棋因?yàn)樽兓瘜?shí)太多,至今仍未有最優(yōu)解,所以能存活到今天。AlphaGo并沒(méi)有徹底擊敗李世石,看起來(lái)圍棋的生命力仍然很頑強(qiáng)

(本文正在參與鈦媒體最新競(jìng)拍話題【圍觀AlphaGo大戰(zhàn)世界圍棋冠軍:機(jī)器戰(zhàn)勝人到底是不是忽悠?】的競(jìng)拍,如果持有不同見(jiàn)解,鈦妹歡迎你來(lái)參與競(jìng)拍,觀點(diǎn)PK,不服來(lái)戰(zhàn)?。?/p>

再可怕的怪物也是有弱點(diǎn)的,AlphaGo為什么會(huì)下臭棋讓大家大跌眼鏡,圍棋人工智能第二代第三代的死穴是什么?

圍棋人工智能第三代的死穴在哪兒?

韓國(guó)圍棋界曾獲得多項(xiàng)世界冠軍的職業(yè)九段李世石對(duì)陣谷歌計(jì)算機(jī)AlphaGo的人機(jī)大戰(zhàn),三連敗之后,執(zhí)白棋居然扳回一局。

大眾把此場(chǎng)圍棋人機(jī)大戰(zhàn)看得太重,看作人腦跟電腦的徹底較量,其實(shí)不然,因?yàn)楸仍嚨闹皇菄逡粯訓(xùn)|西。圍棋人機(jī)大戰(zhàn)人類若輸了,不等于人腦就從此比不上電腦了。

實(shí)際上,圍棋雖然變化復(fù)雜,但理論上并非變化無(wú)窮。畢竟可以看作一道數(shù)學(xué)題目,可以用計(jì)算機(jī)來(lái)編程運(yùn)算從而得到解答。假以時(shí)日,人類在下棋這一方面遲早難以與電腦匹敵。就算李世石三連敗之后能扳回兩局,那就怎么樣呢?下圍棋這一方面人類遲早是敵不過(guò)人工智能的。

圍棋人工智能第一代算法使用的就是窮舉法,試圖把所有的下法都算出來(lái),然后選擇必勝的下法。但是因?yàn)閲宓淖兓瘜?shí)太多,暫時(shí)無(wú)法辦到。

第二代算法,是抽樣評(píng)估選擇勝率最高的算法,大大減省了運(yùn)算量,使人工智能終于能跟業(yè)余圍棋選手較量。

谷歌AlphaGo是第三代算法,利用人工智能自我學(xué)習(xí)的能力使己身棋力突飛猛進(jìn)??瓷先ニ坪跻涯茌殙菏澜珥敿饴殬I(yè)高手的AlphaGo,第四局居然爆冷下臭棋落敗,是出了什么問(wèn)題?

Alpha Go的算法是有問(wèn)題的。第三代算法的問(wèn)題實(shí)際上也是第二代算法的問(wèn)題,因?yàn)榈谌惴ㄊ腔诘诙惴ǖ某闃釉u(píng)估再加以自我學(xué)習(xí)。就算Alpha Go可以自己跟自己下棋提升棋力,它之所以能這樣下棋還是基于抽樣評(píng)估。

抽樣評(píng)估是有弱點(diǎn)的。勝率高的下法不一定就是正確的下法,畢竟這只是統(tǒng)計(jì)。有些冷門下法,也許反而能出奇制勝。

Alpha Go下臭棋時(shí)思考速度特別快恰恰說(shuō)明此時(shí)的樣本少。李世石78手是奇招,會(huì)下這一手的棋手很少,AlphaGo按照程序運(yùn)算的結(jié)果自以為李世石勝算不高,特別快地作出了反應(yīng)。這是一個(gè)天大的錯(cuò)誤。

跟圍棋程序下過(guò)棋的棋手都有這么一種感覺(jué):電腦在劣勢(shì)時(shí)應(yīng)對(duì)特別混亂。不單AlphaGo,Zen也是這樣。因?yàn)殡娔X處于勝率低的情況已經(jīng)不好思考了。按照樣本統(tǒng)計(jì),處于勝率低的情況下當(dāng)然是落敗的多,反敗為勝的樣本可不好找。勝率越低的情況,AlphaGo的思路越混亂。在極端情況下,也許找到的樣本中勝率低的一方已經(jīng)投子認(rèn)輸了,沒(méi)有后續(xù)的棋譜,AlphaGo于是不懂該怎么辦了。

Alpha Go的失敗也是人類的失敗,畢竟的程序也是人類編出來(lái)的。另一方面,也是因?yàn)樗惴ɑ谌祟惖臉颖?,?dǎo)致了AlphaGo的失敗。如果有應(yīng)對(duì)李世石那一招的樣本,AlphaGo也不至于如此判斷出錯(cuò)。

Alpha Go之父哈薩比斯說(shuō):“AlphaGo的訓(xùn)練并沒(méi)有專門針對(duì)李世石先生,而是像對(duì)普通棋手比賽前一樣,做的只是日常的準(zhǔn)備。AlphaGo備戰(zhàn)就是從網(wǎng)上下載很多業(yè)余棋手的棋譜研究,沒(méi)有什么特別之處。”隨后又說(shuō),“要針對(duì)某一個(gè)棋手備戰(zhàn)也很難,我們至少需要數(shù)百萬(wàn)甚至上億的棋譜,才能整體提供給AlphaGo,它才能接收并進(jìn)行深度學(xué)習(xí)。”

哈薩比斯的話也證實(shí)了圍棋人工智能第二代第三代的死穴,也就是樣本評(píng)估的問(wèn)題。像李世石反敗為勝這樣的奇招,能找到的樣本實(shí)在太少。AlphaGo明顯需要有大量職業(yè)棋手的優(yōu)質(zhì)且非常全面的對(duì)局作為參考,這可不好辦到。

圍棋貼目難題仍待解決

第四局,李世石執(zhí)白棋反而能獲勝,這是一件很匪夷所思的事。因?yàn)楹谄逵邢仁謨?yōu)勢(shì),勝率更高。

圍棋人機(jī)大戰(zhàn)引出了一個(gè)長(zhǎng)期困擾圍棋界的問(wèn)題,就是圍棋規(guī)則中關(guān)于貼目的規(guī)定。不玩圍棋的人可能不知道,但圍棋迷都清楚。執(zhí)黑棋的棋手是先手,享有優(yōu)勢(shì),故為了公平起見(jiàn),黑方需要向白方貼目。

1949年(昭和24年)日本棋院圍棋規(guī)則規(guī)定:黑方貼4目半。從1955年的第3期王座戰(zhàn)起,黑棋貼目從4目半改為5目半。但是根據(jù)統(tǒng)計(jì),黑方仍然占了優(yōu)勢(shì)。截止到2001年底,在日本棋院近5年來(lái)進(jìn)行的1.5萬(wàn)盤正式公開(kāi)棋賽對(duì)局中,(黑貼5目半的情況下)黑棋勝率達(dá)到了51.86%。執(zhí)黑執(zhí)白的勝率之差雖然不大,但在爭(zhēng)奪激烈的圍棋大賽上,這樣的差距足以致命。

在國(guó)際棋賽中實(shí)力明顯占優(yōu)的韓國(guó)率先在大多數(shù)棋賽中改用6目半制。中國(guó)也從2002年春天起,全部改貼3又3/4子(相當(dāng)于7目半)。日本棋院對(duì)于實(shí)行了50年的黑棋貼5目半的制度也實(shí)行了改革,將部分比賽向中韓靠攏, 2003年開(kāi)始全部采用黑棋貼6目半規(guī)則。

截止到2014年底,中國(guó)大陸主辦的貼3又3/4子(相當(dāng)于7目半)的世界大賽共有380盤對(duì)局,其中黑勝200局,勝率為52.6%(前3屆春蘭杯相當(dāng)于貼5目半,未計(jì)入)。而臺(tái)灣舉辦的應(yīng)氏杯(貼8點(diǎn),也相當(dāng)于7目半)則是黑勝100局,白勝97局。由此可見(jiàn),即便是貼7目半,黑方似乎還是略占優(yōu)勢(shì)。

那么,到底黑方要向白方貼目多少才絕對(duì)公平?目前這個(gè)數(shù)值只是根據(jù)大量人類對(duì)局作統(tǒng)計(jì)得出的,并非數(shù)學(xué)上的完美無(wú)懈的解答。

也許,讓AlphaGo學(xué)金庸武俠小說(shuō)中的周伯通和郭靖左右互搏,自己左手跟右手下棋,然后通過(guò)大量?jī)?nèi)戰(zhàn)結(jié)果統(tǒng)計(jì)出貼目的合理數(shù)值?No,這也不是完美的解答。

前面說(shuō)過(guò),AlphaGo之所以能自己跟自己下棋,還是基于對(duì)人類對(duì)局的抽樣評(píng)估。這跟直接對(duì)人類對(duì)局進(jìn)行統(tǒng)計(jì)沒(méi)什么兩樣。

完美的解答,還是要回到最初,用最原始的窮舉法,找出下圍棋的最優(yōu)解。這樣,才能徹底制訂貼目的數(shù)值。只是不知道,運(yùn)算量這么大的工程,不知道要到什么時(shí)候才能實(shí)現(xiàn)?

我們倒是可以設(shè)想一下圍棋得到徹底破解之后的情景:某國(guó)際圍棋大賽在萬(wàn)眾矚目下開(kāi)始了,執(zhí)黑棋的棋手才下了第一子,裁判當(dāng)即宣布,執(zhí)白棋的棋手不用下了,比賽結(jié)果已定,誰(shuí)勝誰(shuí)負(fù)或是打成平手已經(jīng)水落石出。觀眾一片歡呼。

AlphaGo玩麻將怎么樣兼論桌游設(shè)計(jì)的隨機(jī)性

圍棋人機(jī)大戰(zhàn)人類雖然輸了,但有些網(wǎng)友表示,人類的智慧還有中國(guó)麻將守著(詳見(jiàn)鈦媒體文章《贏了圍棋冠軍不算什么,阿爾法狗敢不敢挑戰(zhàn)麻將?|鈦搞了》)。但中搜網(wǎng)絡(luò)創(chuàng)始人、北京圍棋業(yè)余賽冠軍陳沛對(duì)采訪他的記者說(shuō):“要是麻將,人類會(huì)輸?shù)酶鼞K!麻將一共就那么多張,很容易算出來(lái)的。”

然而,陳沛的話其實(shí)是錯(cuò)的。假設(shè)有個(gè)傻大木,他都不太會(huì)玩麻將,但他就是運(yùn)氣好到爆棚,一開(kāi)局就自摸十三幺,請(qǐng)問(wèn)AlphaGo可有破解高招?

麻將這類棋牌游戲因?yàn)殡S機(jī)抽牌,是有運(yùn)氣成分的。

有網(wǎng)友就戲言:假如打麻將時(shí)三個(gè)人聯(lián)手對(duì)付AlphaGo,AlphaGo會(huì)輸?shù)煤軕K。這雖然是作弊了,但也道出了一個(gè)大問(wèn)題:在多人游戲中,局面變得異常復(fù)雜,人工智能要如何才能應(yīng)對(duì)?

比如說(shuō),三個(gè)人跟Alpha Go打麻將,雖然沒(méi)人作弊,但是甲玩家技術(shù)不行打錯(cuò)了牌導(dǎo)致乙玩家得利,這是Alpha Go所無(wú)法控制的。

說(shuō)起來(lái),AlphaGo要學(xué)習(xí)打麻將,也是得基于對(duì)大量人類對(duì)局的樣本評(píng)估。Alpha Go只能弄明白什么樣的打法勝率較高,然而打麻將并沒(méi)有所謂必勝的打法。

圍棋的棋子擺在棋盤上是明眼可見(jiàn)的。不知大家有沒(méi)有聽(tīng)說(shuō)過(guò)一種“暗棋”,就是將象棋的棋子反過(guò)來(lái)蓋上再玩的。陸戰(zhàn)棋也有暗棋的玩法。麻將其實(shí)也跟暗棋玩法類似,牌是蓋起來(lái)玩的。蓋起來(lái)的棋牌是什么,還得猜測(cè)。Alpha Go頂多是通過(guò)計(jì)算進(jìn)行評(píng)估,蓋起來(lái)的棋牌是什么的可能性比較大,不可能準(zhǔn)確推理得到唯一結(jié)果。也就是說(shuō)Alpha Go永遠(yuǎn)無(wú)法進(jìn)化到100%獲勝的地步。

圍棋沒(méi)有運(yùn)氣成分,而麻將有著運(yùn)氣成分,兩者都有自己的魅力。

廣義上,圍棋、麻將這些棋牌游戲,其實(shí)是屬于桌游的范疇。圍棋的英文是“Go”,AlphaGo的“Go”就從此而來(lái)。圍棋躋身BGG桌游排行榜前100名,是中國(guó)棋牌類游戲排名最高的。

在民間,實(shí)際上像象棋、圍棋這類沒(méi)有運(yùn)氣成分的棋牌(桌游)已漸趨沒(méi)落?,F(xiàn)在關(guān)注圍棋人機(jī)大戰(zhàn)的網(wǎng)友,又有多少人是圍棋迷呢?

因?yàn)榇蟊娤胍母菉蕵?lè),像象棋、圍棋這類沒(méi)有運(yùn)氣成分的,玩起來(lái)水平發(fā)揮比較穩(wěn)定,高手就是高手,一般人很難贏得了,除非你能找到棋力剛巧跟你一個(gè)水平檔次的,不然玩起來(lái)沒(méi)意思,強(qiáng)的太強(qiáng)弱的過(guò)弱。

故此,新興桌游的設(shè)計(jì)宗旨,都是要保證隨機(jī)性,要有運(yùn)氣成分。像萬(wàn)智牌、游戲王和爐石傳說(shuō)之類隨機(jī)抽牌,飛行棋、大富翁之類擲骰子,都是產(chǎn)生隨機(jī)數(shù),帶來(lái)運(yùn)氣成分。有了運(yùn)氣成分,所有玩家發(fā)揮出來(lái)的水平就不至于相差太遠(yuǎn),能湊到一起玩?zhèn)€痛快。

另一方面,沒(méi)有運(yùn)氣成分的棋牌(桌游),因?yàn)槔碚撋弦欢ù嬖谧顑?yōu)解,最優(yōu)解一旦出來(lái)后,肯定讓人興致大減。圍棋就是因?yàn)樽兓瘜?shí)太多,至今仍未有最優(yōu)解,所以能存活到今天?,F(xiàn)在,AlphaGo并沒(méi)有徹底擊敗李世石,看起來(lái)圍棋的生命力仍然很頑強(qiáng)。(本文首發(fā)鈦媒體)

本文系作者 superkai 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請(qǐng)注明出處、作者和本文鏈接。
本內(nèi)容來(lái)源于鈦媒體鈦度號(hào),文章內(nèi)容僅供參考、交流、學(xué)習(xí),不構(gòu)成投資建議。
想和千萬(wàn)鈦媒體用戶分享你的新奇觀點(diǎn)和發(fā)現(xiàn),點(diǎn)擊這里投稿 。創(chuàng)業(yè)或融資尋求報(bào)道,點(diǎn)擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評(píng)論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論

請(qǐng) 登錄后輸入評(píng)論內(nèi)容
  • 怎么競(jìng)拍啊。。。有木有意識(shí)到在本次人機(jī)大戰(zhàn)的報(bào)道中,你們的相關(guān)文章含金量很高?。拷^不人云亦云,視角也很犀利,多篇被各大門戶轉(zhuǎn)載,怎么客戶端上這么冷清?活動(dòng)該不是都在微信上進(jìn)行吧?

    回復(fù) 2016.03.14 · via android

快報(bào)

更多

14:20

美藥管局在全美召回近9萬(wàn)瓶?jī)和悸宸宜幬?/p>

14:01

大藤峽船閘歲修收官,廣西西江干線全線恢復(fù)通航

14:00

海南自貿(mào)港封關(guān)后首家金融租賃管理型項(xiàng)目公司落戶???/p>

13:43

鋁價(jià)飆升至四年來(lái)高位,中東沖突擾亂鋁供應(yīng)

13:37

歐盟成員國(guó)被敦促降低天然氣儲(chǔ)存目標(biāo)

13:30

盈科原掌門人梅向榮轉(zhuǎn)移資金38.7億?警方回應(yīng)

13:25

紫金礦業(yè):2025年歸母凈利潤(rùn)517.77億元,同比增長(zhǎng)61.55%

13:25

油價(jià)飆升徹底顛覆美債市場(chǎng)對(duì)2026年美聯(lián)儲(chǔ)降息押注

13:24

山姆回應(yīng)“冷鮮豬肉數(shù)月前屠宰”

13:22

瑞銀發(fā)布報(bào)告:本輪油價(jià)上漲可能對(duì)美經(jīng)濟(jì)造成更大沖擊

13:19

美國(guó)政府對(duì)哈佛發(fā)起新訴訟,尋求追回聯(lián)邦資金

13:17

斯洛伐克總理:歐盟可能面臨石油危機(jī)

13:15

阿里媽媽發(fā)布超級(jí)經(jīng)營(yíng)智能體引擎“AI萬(wàn)相”

13:12

俄總統(tǒng)新聞秘書(shū):歐盟計(jì)劃停止進(jìn)口俄天然氣損害自身利益

13:11

美國(guó)據(jù)稱正計(jì)劃奪取伊朗的“核儲(chǔ)備”

13:11

北京3月二手住宅成交量突破1萬(wàn)套,多地樓市現(xiàn)小陽(yáng)春

13:10

庫(kù)克回應(yīng)OpenClaw帶動(dòng)Mac Mini大賣

13:07

美國(guó)載人繞月任務(wù)火箭和飛船重回發(fā)射臺(tái)

13:03

廣州公安通報(bào):人販子“梅姨”落網(wǎng)

13:01

乘聯(lián)分會(huì)崔東樹(shù):全國(guó)乘用車行業(yè)2026年2月末庫(kù)存333萬(wàn)輛、庫(kù)存60天

1

掃描下載App