在2012年12月22日到來(lái)之前,許多人都認(rèn)為這個(gè)日子就是瑪雅人預(yù)言的世界末日。無(wú)論有多少離奇的事件被瑪雅人言中,但這都是通過(guò)所謂的超自然力量對(duì)未來(lái)進(jìn)行的預(yù)測(cè),是神秘學(xué)尊崇的,不能被科學(xué)技術(shù)所證實(shí)。而大多數(shù)人不相信這個(gè)世界上存在超自然的力量,他們更愿意將種種預(yù)言當(dāng)做是一種巧合,因?yàn)榍珊鲜且环N概率,屬于數(shù)學(xué)范疇,即便有億萬(wàn)分之一的幾率能被計(jì)算出來(lái),那便是科學(xué)了。如果你是科學(xué)的堅(jiān)實(shí)擁護(hù)者,那么請(qǐng)向這篇文章中的科學(xué)家致敬吧!
對(duì)預(yù)測(cè)未來(lái)這件事,人們從來(lái)都沒(méi)有喪失興趣和好奇,既然沒(méi)有超自然力量來(lái)控制,那么就苦苦尋覓其他良方。因此,科學(xué)家承擔(dān)了這份責(zé)任,他們孜孜不倦的尋找一種公式,一個(gè)定律,一種技術(shù),一種科學(xué)的方式來(lái)預(yù)測(cè)未來(lái)可能發(fā)生什么。
所以,許多科學(xué)實(shí)驗(yàn)室都在秘密地研究與預(yù)測(cè)未來(lái)相關(guān)的事情,微軟研究院就是其中一個(gè)。微軟研究院與以色列理工大學(xué)一直在合作開(kāi)發(fā)能預(yù)測(cè)未來(lái)事件的軟件,希望能通過(guò)軟件工具來(lái)提供更好更準(zhǔn)確的預(yù)測(cè)信息,這要比人類(lèi)專(zhuān)家的預(yù)言和人類(lèi)的直覺(jué)要科學(xué)的多,也比那些有理有據(jù)的推測(cè)更精確。
對(duì)于微軟研究院,大家并不陌生,許多超前先進(jìn)的技術(shù)都出自這里。但更多人并不知道,以色列理工大學(xué)也是先進(jìn)技術(shù)的發(fā)散地,是微軟實(shí)驗(yàn)室技術(shù)開(kāi)發(fā)合作伙伴之一。而這次項(xiàng)目是由兩位專(zhuān)家共同負(fù)責(zé)完成的,一位就是微軟研究院的杰出科學(xué)家Eric Horvitz,他也是微軟研究實(shí)驗(yàn)室的管理負(fù)責(zé)人,另一位則來(lái)自以色列理工大學(xué)的博士研究生Kira Radinsky。
新軟件預(yù)測(cè)世界未來(lái)的偶然事件
馬克吐溫有句名言,“歷史不會(huì)重復(fù),但歷史卻有規(guī)律可循”。受此啟發(fā),兩位研究人員從紐約時(shí)報(bào)的存檔數(shù)據(jù)庫(kù)文件中提取了1986年到2008年大約22年的新聞消息,同時(shí)還搜集了海量的互聯(lián)網(wǎng)數(shù)據(jù)源信息(主要取材于維基百科、FreeBase、OpenCyc、GeoNames),并將這些數(shù)據(jù)共同放入軟件中進(jìn)行測(cè)試。通過(guò)對(duì)過(guò)去一系列新聞事件之間的特殊過(guò)渡關(guān)系進(jìn)行概括,研究人員讓軟件從這些新聞中不斷進(jìn)行練習(xí),從中發(fā)現(xiàn)了各種各樣的規(guī)律模式,以及各種事件之間明確的相關(guān)關(guān)系,從而對(duì)未來(lái)進(jìn)行預(yù)測(cè)。比如,非洲干旱與之后暴發(fā)的霍亂病等氣候?yàn)?zāi)難之間聯(lián)系。
經(jīng)過(guò)不懈的努力,他們研究出了能預(yù)測(cè)未來(lái)偶然事件(人類(lèi)和自然事件)發(fā)生的軟件模型。
該軟件可以挖掘各方面數(shù)據(jù),提前預(yù)測(cè)出世界上何時(shí)會(huì)爆發(fā)大規(guī)模疾病,何時(shí)發(fā)生戰(zhàn)爭(zhēng)和暴力事件等這些偶然發(fā)生的人類(lèi)和自然事件。比如,在測(cè)試中該軟件發(fā)現(xiàn),發(fā)生氣候事件之后,本可以提前一年的時(shí)間發(fā)布霍亂病暴發(fā)的預(yù)警,如果能提前做出預(yù)測(cè),災(zāi)難將可以很大程度上避免或者提前做出干預(yù)措施。所以,需要建立一種能做出實(shí)時(shí)預(yù)測(cè)的好方法,可以直觀(guān)發(fā)現(xiàn)導(dǎo)致重要事件發(fā)生的導(dǎo)火索。目前,他們已經(jīng)成功的實(shí)現(xiàn)了第一步,下一步就在于如何成功應(yīng)用于現(xiàn)實(shí)狀況中。
Horvitz和Radinsky指出,當(dāng)從數(shù)據(jù)中得出的推論和專(zhuān)家的預(yù)期值背道而馳時(shí),他們的預(yù)測(cè)模型可以提供更具可靠性的指導(dǎo)意見(jiàn),對(duì)新近出現(xiàn)的狀況作出更好的決策指導(dǎo)。
在論文《挖掘網(wǎng)絡(luò),預(yù)測(cè)未來(lái)事件》中,Horvitz和Radinsky描述了他們整理并剖析紐約時(shí)報(bào)新聞資料檔案的方式,描述了該方法的實(shí)現(xiàn)過(guò)程以及相關(guān)算法公式的細(xì)節(jié),同時(shí)也用各種數(shù)學(xué)公式驗(yàn)證了新軟件的可行性,包括如何從新聞資料庫(kù)和海量網(wǎng)絡(luò)新聞源中對(duì)事件序列進(jìn)行自動(dòng)提取和概括。并且,研究人員已經(jīng)將該軟件放在現(xiàn)實(shí)世界對(duì)事件進(jìn)行預(yù)測(cè),以此評(píng)估其預(yù)測(cè)能力。
精準(zhǔn)度高,協(xié)助決策者提前做出應(yīng)急反應(yīng),也為該領(lǐng)域研究提供了技術(shù)參考
新方法以新聞事件為基礎(chǔ),通過(guò)近期新聞事件中顯露出的跡象,并從中總結(jié)規(guī)律,從而預(yù)測(cè)未來(lái)大量偶然事件發(fā)生的可能性。在他們的研究論文中,研究人員充分展示了該軟件的預(yù)測(cè)能力,它可以完成3個(gè)方面的預(yù)測(cè)挑戰(zhàn)。第一,可以對(duì)即將發(fā)生的大規(guī)模疾病提前做出預(yù)測(cè)和警報(bào)。第二,可以對(duì)死亡事件作出預(yù)警。第三,可以對(duì)暴力事件作出預(yù)測(cè)警告。這三種事件是比較典型的事件,因此,對(duì)這三種事件進(jìn)行預(yù)測(cè)也比較有代表性,可以引起決策者的注意,以便提前引導(dǎo)干預(yù),扭轉(zhuǎn)事態(tài)向好的方向發(fā)展。新軟件的預(yù)測(cè)能力與現(xiàn)有的其他預(yù)測(cè)方法進(jìn)行了對(duì)比,在這些領(lǐng)域中的預(yù)測(cè)準(zhǔn)確率要比它們高的多,精準(zhǔn)度可達(dá)到70%~90%。
這個(gè)新軟件吸引人的地方不僅在于它的預(yù)測(cè)能力,而且還包括它其中所使用的自動(dòng)提取技術(shù),因?yàn)樵摷夹g(shù)可以推動(dòng)分析技術(shù)的發(fā)展,將分析能力從對(duì)特殊字符的簡(jiǎn)單分析提升到對(duì)更大范圍的事件和觀(guān)察結(jié)果進(jìn)行分析總結(jié)。并且該軟件的學(xué)習(xí)和推理方法可以用來(lái)提供警報(bào),比如當(dāng)未來(lái)某個(gè)事件發(fā)生的可能性不斷提高時(shí),該軟件就可以及時(shí)做出預(yù)警。
Horvitz表示,這個(gè)項(xiàng)目還會(huì)繼續(xù),他們希望這項(xiàng)研究可以激發(fā)更多對(duì)人類(lèi)過(guò)去經(jīng)歷和知識(shí)的研究,以提供更多有價(jià)值的未來(lái)事件預(yù)測(cè),并提前作出重要的干預(yù)。他們將挖掘更多新聞報(bào)紙資料庫(kù)和數(shù)字圖書(shū)信息,創(chuàng)造出更精確的方法來(lái)協(xié)助政府部門(mén)對(duì)災(zāi)難性事件作出及時(shí)準(zhǔn)確的應(yīng)急反應(yīng)。他們已經(jīng)在此領(lǐng)域作出了積極的探索和嘗試。
所以,任何脫離科學(xué)的預(yù)言都是虛妄!我們的目的不僅希望知道未來(lái)會(huì)發(fā)生什么,但更希望的是,當(dāng)災(zāi)難性事件來(lái)臨之前我們已經(jīng)做好準(zhǔn)備!所謂“神明”的啟示遠(yuǎn)不如科學(xué)技術(shù)來(lái)的實(shí)在!






快報(bào)
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論
大數(shù)據(jù)時(shí)代的數(shù)據(jù)挖掘~~!good