全球最大的搜索引擎公司——Google的市值近期突破5000億美元,超過了互聯(lián)網(wǎng)公司中緊跟其后的Facebook和阿里巴巴市值的總和。然而,與其活躍的市值不相稱的是,近二十年來,搜索引擎的產(chǎn)品形態(tài)和服務(wù)方式幾乎沒有變化——通過關(guān)鍵詞匹配返回給用戶數(shù)不清的網(wǎng)頁列表。
搜索引擎真的可以“一招鮮吃遍天”嗎?
當(dāng)然不是。隨著移動終端成為人們?nèi)粘I钪蝎@得信息的主要媒介,搜索引擎在小屏幕上的使用不便已成為一大痛點(diǎn),特別是在用戶需要訪問搜索結(jié)果中多個(gè)頁面的情況下。在很多典型的應(yīng)用場景中(如汽車駕駛),手機(jī)用戶需要立刻獲得答案,現(xiàn)有的搜索引擎已經(jīng)難以勝任。
場景一:言語不通,寸步難行
2014年Google收購了一家名為Quest Visual的公司,該公司開發(fā)的手機(jī)應(yīng)用可以利用攝像頭和后臺智能技術(shù)翻譯現(xiàn)實(shí)生活中的文字,直接將拍攝到的圖片中的語言翻譯成另一種文字,并用同樣的視覺效果顯示出來。用戶在任何時(shí)候用手機(jī)攝像頭對著外文,看到的是自己所認(rèn)知的內(nèi)容,該應(yīng)用結(jié)合了成熟的圖像文字識別和機(jī)器翻譯技術(shù),實(shí)時(shí)捕獲場景中的文字并即時(shí)提供翻譯結(jié)果。
場景二:知已知彼,百戰(zhàn)百勝
此前,Google眼鏡還曾放出一個(gè)廣告片段。男孩戴著Google眼鏡赴約會,在對話過程中不時(shí)地在網(wǎng)上查找對方的相關(guān)信息,以表現(xiàn)出自己博學(xué)和體貼。
對話,是一個(gè)需要秒級響應(yīng)的應(yīng)用場景,人工智能技術(shù)可以將全網(wǎng)“變成”我們的外腦,在場景中感知用戶需求并且即刻產(chǎn)生答案,為話題的應(yīng)答和延展提供線索、依據(jù)和思路,可極大地提高人們?nèi)粘υ挼馁|(zhì)量和效率。
“外腦級對話”目前還沒有真正實(shí)現(xiàn),Google眼鏡已經(jīng)遇到了技術(shù)和用戶體驗(yàn)上的瓶頸。一方面,眼鏡的成像分辨率僅為640*480,難以提供清晰舒適的顯示效果;另一方面,在社交場合中佩戴Google眼鏡顯得另類,容易涉及個(gè)人隱私問題而招致對方的反感。此外,圖像識別的高準(zhǔn)確率和秒級響應(yīng)還需要人工智能技術(shù)上的進(jìn)一步突破。相信隨著技術(shù)性能的不斷提升,“外腦級對話”的實(shí)現(xiàn)指日可待,但可穿戴設(shè)備需要更加的低調(diào),并且消除人們保護(hù)隱私的疑慮。
場景三:失之毫厘,差之千里
這是個(gè)需要更多想象力的未來場景。與高手對決,差距在于反應(yīng)速度。圖中對手看似扣球而實(shí)為切球,球會在0.8秒后落在網(wǎng)前右側(cè),此時(shí)新手缺乏足夠的經(jīng)驗(yàn)難以及時(shí)反應(yīng)。未來可穿戴的人工智能設(shè)備可以實(shí)現(xiàn)毫秒級的運(yùn)動軌跡分析,比人類的正常反應(yīng)和判斷更快一步地提供預(yù)測結(jié)果,在運(yùn)動、駕駛、救援等需要迅速反應(yīng)的時(shí)刻有如加了“外掛”,由此帶來的商業(yè)價(jià)值將是無法估量。
在以上三個(gè)應(yīng)用場景中,用戶需求和技術(shù)難度各不相同,但有一個(gè)共同的特點(diǎn):需要在場景中感知用戶需求,并提供即時(shí)答案。所以我們有理由相信,搜索引擎的更新?lián)Q代產(chǎn)品即將能滿足上述用戶的典型需求,可以隨時(shí)隨地提供信息支持,幫助人們快速地決策和行動。早在2009年,Google的原CEO 埃里克·施密特曾對媒體說:“未來的搜索,是為用戶的問題提供準(zhǔn)確的答案,而不是數(shù)不清的網(wǎng)頁列表”。相信這是整個(gè)搜索引擎行業(yè)共同為之奮斗的目標(biāo),也就是未來的“答案引擎”。
答案引擎和問答引擎在概念上有顯著的區(qū)別——前者并不要求用戶輸入完整的問題,甚至可以不包含文字。換句話說,答案引擎能為任何形式的查詢提供答案。
答案引擎離我們還有多遠(yuǎn)?
搜索引擎返回給用戶的是一個(gè)數(shù)不清的網(wǎng)頁列表,而答案引擎能夠直接提供查詢的答案。在網(wǎng)頁中尋找答案,對人們來說都不總是一件容易的事情。就目前而言,想要獲得更好的、便攜性更強(qiáng)的答案獲取方式,答案引擎需要解決這兩個(gè)根本問題:
1、理解用戶真正想要的是什么。統(tǒng)計(jì)表明,用戶在使用語音時(shí)傾向于錄入較為完整的句子,而在使用文字輸入時(shí)平均只使用2-3個(gè)關(guān)鍵詞。當(dāng)用戶的表達(dá)不夠清晰、完整時(shí),特別是包含多義詞(如“蘋果”可以是水果或手機(jī),“焦裕祿”可以是人名或電影)的情況下,無法通過上下文準(zhǔn)確判斷用戶的真正需求,答案引擎需要進(jìn)行智能分析和預(yù)測。使用以下技術(shù)手段可以使這種預(yù)測更加準(zhǔn)確:
l? 分析共性需求。追蹤那些使用相同及類似關(guān)鍵詞查詢的用戶的操作內(nèi)容,分析他們的最終需求作為預(yù)測結(jié)果;
l? 分析個(gè)性需求??筛鶕?jù)該用戶的歷史行為進(jìn)行預(yù)測。例如用戶經(jīng)常查詢、瀏覽或關(guān)注電子產(chǎn)品,那么他查詢“蘋果”的目的是找手機(jī)而不是找水果的概率會更高;
l? 根據(jù)地理位置信息來預(yù)測。例如用戶正在逛電子市場,他找手機(jī)的概率也會更高。生活類查詢(如找餐館等)會非常依賴位置信息。
2、理解頁面內(nèi)容,匹配高質(zhì)量答案。讓計(jì)算機(jī)理解人類語言,涉及到一系列自然語言處理(NLP,Natural Language Processing)技術(shù),如語音識別、分詞、詞性分析、語法樹建立、命名實(shí)體抽取、語義消歧、語義角色分析、情感分析等。
相對文字理解,識別圖像內(nèi)容對計(jì)算機(jī)來講難度更大,一個(gè)圖像識別系統(tǒng)往往只能識別某一類物體,而識別另一類物體可能會采用完全不同的方法。因而,圖像識別技術(shù)可以在某些特定場景(如車牌或人臉識別)中得到很好的應(yīng)用,但是面對大千世界的萬物,還需要技術(shù)上巨大的突破。
可喜的是,國外一些技術(shù)領(lǐng)先的IT企業(yè)近期紛紛將研制多年的人工智能工具免費(fèi)向公眾開放,如Facebook的深度學(xué)習(xí)插件、Big Sur,Google的TensorFlow,IBM的System ML,微軟的DMTK。這些企業(yè)在造福全人類的同時(shí),也將會匯集外部人才的智慧實(shí)現(xiàn)技術(shù)上的更大突破。
在真正理解了用戶需求和網(wǎng)頁內(nèi)容的前提下,匹配高質(zhì)量答案就不再困難,但是還需要處理好兩個(gè)問題。第一,區(qū)別對待用戶的簡單查詢(如誰、哪兒、什么時(shí)候)和復(fù)雜查詢(如為什么、怎樣),就像填空題和問答題的區(qū)別;第二,對于分散在不同頁面上的答案,需要能夠整合成一個(gè)完整的內(nèi)容,并且具有較好的可讀性和邏輯連貫性。
?
答案引擎可以說是時(shí)代的必然產(chǎn)物。雖然搜索引擎二十年來幾乎一成不變,人們在PC上已經(jīng)習(xí)慣于徜徉在數(shù)不清的網(wǎng)頁列表中,但是隨著移動互聯(lián)網(wǎng)的興起,現(xiàn)有搜索引擎的服務(wù)方式日漸無法滿足人們在碎片化時(shí)間中快速尋求答案的需求。相信在人工智能技術(shù)突飛猛進(jìn)發(fā)展的今天,答案引擎時(shí)代很快就會到來。
【鈦媒體作者介紹:石忠民,加拿大西蒙弗雷澤大學(xué)計(jì)算科學(xué)博士,廣州索答信息科技有限公司董事長,摘要式答案引擎主要發(fā)明人,國際搜索引擎領(lǐng)域?qū)<液蜕虡I(yè)新星?!?/p>






快報(bào)
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請綁定手機(jī)號后發(fā)表評論
期待答案引擎的到來。。
答案引擎
這才叫偉大的公司,某度應(yīng)該掩面而逃…
現(xiàn)在的搜索引擎都是對關(guān)鍵詞簡單的處理,對干普通用戶來說,經(jīng)常是答非所問,要提高搜索引擎的體驗(yàn),在算法上應(yīng)該加入更多的因素。