關(guān)于人工智能大家都談得很多,包括剛才在群里交流的時(shí)候,大家還在談機(jī)器到底有沒(méi)有自己的意識(shí),有沒(méi)有自己的思考能力,我覺(jué)得這些問(wèn)題其實(shí)離我們?nèi)斯ぶ悄墚a(chǎn)業(yè)離得太遠(yuǎn)了,這是一個(gè)哲學(xué)問(wèn)題。今年7月,我在參加美國(guó)的IJCAI(世界人工智能聯(lián)合會(huì)議)時(shí),跟很多大拿也討論過(guò)這個(gè)問(wèn)題,其實(shí)大家的共識(shí)是當(dāng)我們?nèi)フ劦饺斯ぶ悄芎蜋C(jī)器人的時(shí)候,我們盡量避免拿人工智能和機(jī)器人去跟人做類比,因?yàn)檫@無(wú)益于技術(shù)的落地和產(chǎn)業(yè)的發(fā)展。
當(dāng)我們談到一個(gè)完整的智能機(jī)器人的時(shí)候,我們會(huì)把它抽象化出三種基本的要素,分別是感覺(jué)、運(yùn)動(dòng)還有思考。我看很多地方都提到說(shuō),感覺(jué)由感知智能來(lái)驅(qū)動(dòng),感知智能現(xiàn)在在產(chǎn)業(yè)里面做得可能會(huì)比較多,而且在某些方面已經(jīng)接近和達(dá)到人的水平。
思考方面主要是由認(rèn)知智能來(lái)驅(qū)動(dòng)的。我記得很多人說(shuō)認(rèn)知智能可能現(xiàn)在在產(chǎn)業(yè)里邊做得還不多,但其實(shí)我們小i一直是在做認(rèn)知智能,尤其是把這種能力用到一些比較垂直的領(lǐng)域里邊。當(dāng)然由于這些服務(wù),其實(shí)并不是出現(xiàn)在消費(fèi)級(jí)的產(chǎn)品當(dāng)中,可能大家注到的并不是很多。
一個(gè)智能機(jī)器人體現(xiàn)出它智能的部分,就是大腦的這個(gè)部分,就是認(rèn)知智能。它可以沒(méi)有外觀或者運(yùn)動(dòng)方面的能力,它更多的情況下是在網(wǎng)上跟別人交流,它可能是一個(gè)虛擬機(jī)器人。虛擬機(jī)器人很多的時(shí)候我們會(huì)把它擬稱為Bots,因?yàn)橥暾臋C(jī)器人的英文名詞叫robot,聽(tīng)起來(lái)會(huì)有兩三個(gè)音節(jié),Bots聽(tīng)起來(lái)比較親切。
我們可以做這樣的描述,Bots是一個(gè)虛擬機(jī)器人,它是一個(gè)在通訊平臺(tái)上的數(shù)字用戶,“通訊平臺(tái)”的定義就非常廣泛了,包括我們的即時(shí)通訊、短信、網(wǎng)頁(yè)、電話等各種各樣的通訊方式,另外Bots是基于人工智能技術(shù)的智能軟件。
那么為什么Bots需要用人工智能來(lái)驅(qū)動(dòng)呢?我們之前說(shuō)在短信上我們通過(guò)指令方式也可以做類似于交互式的機(jī)器人,但是這種沒(méi)有人工智能在后面驅(qū)動(dòng)的應(yīng)用,它的能力拓展是非常弱的。我們一般提到Bots的時(shí)候,會(huì)有幾種Bots的形態(tài):
很多人把它叫做聊天機(jī)器人,我更愿意把它叫做陪聊機(jī)器人,因?yàn)榱奶鞕C(jī)器人更多是表現(xiàn)聊天的一些手段,而我這里面描述更多的是這種虛擬機(jī)器人它的目的就是為了要去陪你聊天的。
比如說(shuō)在1960年就出現(xiàn)了伊莉莎,這應(yīng)該是全球最早的聊天機(jī)器人了,它可以去做一些字符串的匹配,讓它看起來(lái)比較像一個(gè)真的人跟你去聊天;1995年出現(xiàn)了一個(gè)艾麗斯,他有一種語(yǔ)言叫AIML,可以用這種語(yǔ)言去編寫自己的聊天機(jī)器人;中文領(lǐng)域出現(xiàn)的最早的聊天機(jī)器人就是小i機(jī)器人在MSN上的聊天機(jī)器人,在2004年就出現(xiàn)了;最近大家可能碰到的比較多的聊天機(jī)器人就是微軟小冰,應(yīng)該是在2013年還是2014年出現(xiàn)的。
其實(shí)聊天機(jī)器人沒(méi)什么真正的用途,換句話說(shuō)它很難創(chuàng)造出價(jià)值來(lái)。大家跟它聊一聊可能兩周時(shí)間就迅速的乏味了,包括我們小i機(jī)器人在內(nèi),包括siri、小冰其實(shí)都是類似的情況。但是如果我們把一個(gè)垂直的內(nèi)容,例如金融、通訊這些領(lǐng)域的知識(shí)去讓這個(gè)機(jī)器人學(xué)習(xí),讓它成為一個(gè)領(lǐng)域的專家,那么這種機(jī)器人就會(huì)有非常好的應(yīng)用。
這種為客戶服務(wù)存在的虛擬機(jī)器人在國(guó)外有個(gè)專有名詞叫Virtual Customer Assistant(VCA),就是虛擬客戶助手。一個(gè)比較典型的VCA就是招商銀行信用卡中心的在微信上的客服,名字叫做小招,在微信上面你可以問(wèn)它很多的問(wèn)題,并且這個(gè)Bots是可以跟它后面的系統(tǒng)打通起來(lái),現(xiàn)在在微信上基本上實(shí)現(xiàn)了八九十種功能。當(dāng)然不僅僅是在微信上面,在QQ上,在網(wǎng)站上,在微博上,在手機(jī)的app上,在電話的IVR里面,甚至包括實(shí)際的營(yíng)業(yè)廳當(dāng)中都有小招的存在。智能客服機(jī)器人是有非常明確的商業(yè)用途的,而且在中國(guó)做客服機(jī)器人比在國(guó)外要更加領(lǐng)先。
除了聊天機(jī)器人和這種VCA之外,當(dāng)然我們平時(shí)接觸比較多的是語(yǔ)音助手,又叫做虛擬個(gè)人助手,在國(guó)外有個(gè)名詞叫VPA。什么東西是VPA呢?比如說(shuō)蘋果的siri,微軟的Cortana,谷歌Allo,當(dāng)然還有Viv。這個(gè)Viv挺讓我失望的,因?yàn)榻衲?月份的時(shí)候Viv做了一個(gè)發(fā)布會(huì),他們說(shuō)他們智能的技術(shù)要甩siri幾條街,預(yù)期到12月份會(huì)開(kāi)產(chǎn)品發(fā)布,但是還沒(méi)發(fā)布之前他已經(jīng)被三星給收購(gòu)了?,F(xiàn)在的態(tài)勢(shì)就是像siri也好,Cortata也好,谷歌Allo也好,這些是作為單個(gè)的VPA,單個(gè)Bot的形式,他們已經(jīng)開(kāi)始去開(kāi)放里面的技術(shù),把它平臺(tái)化。
siri在IOS10里邊已經(jīng)開(kāi)放給第三方開(kāi)發(fā)者了,另外谷歌助手已經(jīng)整合到谷歌最新出的一款聊天工具當(dāng)中。比較有意思的是,當(dāng)你朋友發(fā)一句話或者是一幅圖過(guò)來(lái)的時(shí)候,這個(gè)聊天軟件會(huì)自動(dòng)給出了幾個(gè)代選的回復(fù),可以直接去敷衍你的好友。
微軟對(duì)人工智能技術(shù)是相當(dāng)重視的,尤其對(duì)于對(duì)話式的交互界面,他們專門出了一個(gè)名詞叫CUI,并且把這個(gè)能力作為一個(gè)平臺(tái)對(duì)外開(kāi)發(fā)。大家都在用IM,包括我們現(xiàn)在通過(guò)微信群的方式進(jìn)行交流。微信上個(gè)月剛剛說(shuō)它的月活躍數(shù)大概在8.46億,移動(dòng)QQ其實(shí)比微信的活躍用戶數(shù)似乎還要高,但是微信并不是全球最大的IM,全球最大的是什么呢?是facebook收購(gòu)的What’s APP,大概活躍用戶數(shù)接近12億了,另外facebook自己推出的平臺(tái)活躍用戶數(shù)也超過(guò)10億了。
大家可以看到下面這幅圖,即時(shí)通訊工具已經(jīng)把全球的用戶基本上都給覆蓋掉了,而且即時(shí)通訊工具天生就是一種會(huì)話界面,也就是說(shuō)我們?cè)谶@個(gè)界面當(dāng)中去對(duì)話的時(shí)候,我們其實(shí)可以跟人去對(duì)話,對(duì)方也可能就是一個(gè)機(jī)器人,可能代表著一個(gè)媒體,也可能代表著一個(gè)企業(yè)。
剛才說(shuō)得很多都是在互聯(lián)網(wǎng)上的Bots,這種會(huì)話技術(shù),其實(shí)不僅包括文字交互的方式,也包括語(yǔ)音交互,那么這種會(huì)話交互的方式如果用在智能硬件當(dāng)中,是會(huì)讓硬件產(chǎn)生非常多的不一樣的這種用法的。所以說(shuō)Bots for IOT是非常重要的應(yīng)用領(lǐng)域,比如說(shuō)亞馬遜的“Echo”,其實(shí)它雖然有個(gè)硬件的外觀,但是它跟你交流的方式是純會(huì)話式的交互方式,它并沒(méi)有像觸摸屏這樣的反饋。我們可以想一下,人與機(jī)器交流的時(shí)候,早期是通過(guò)這種PC互聯(lián)網(wǎng),這時(shí)候主要靠鍵盤和鼠標(biāo)這種方式,現(xiàn)在比較流行就是大家用移動(dòng)互聯(lián)網(wǎng),主要通過(guò)手機(jī)的方式進(jìn)行交互,手機(jī)主要是通過(guò)觸摸屏方式進(jìn)行交互,而且也逐漸引入了語(yǔ)音的方式,那么對(duì)于下一代,我認(rèn)為就是物聯(lián)網(wǎng),而這個(gè)物聯(lián)網(wǎng)交互的方式就是純語(yǔ)音的交互方式,或者純會(huì)話式的交互方式。
下面一張圖是Gartner在今年10月份給出的2017年十大技術(shù)趨勢(shì)預(yù)測(cè),它提到“會(huì)話+”等技術(shù),其實(shí)跟Bots是一個(gè)概念,他們認(rèn)為這些技術(shù)是十大技術(shù)趨勢(shì)的一個(gè)非常重要的一環(huán)。
小i最早是以聊天機(jī)器人的形式出現(xiàn)的,2004年1月份的時(shí)候最早出現(xiàn)在MSN上,當(dāng)時(shí)已經(jīng)把文字聊天的這種能力,包括像天氣、股票、地圖,訂票多種服務(wù)都已經(jīng)整合到當(dāng)時(shí)這個(gè)產(chǎn)品當(dāng)中,這個(gè)應(yīng)該是最早的中文聊天機(jī)器人。
當(dāng)時(shí)我們也是靠這種聊天機(jī)器人獲得了蠻多的投資,不僅是在MSN上,在QQ上,在很多的地方我們都發(fā)展了非常多的用戶,大概有超過(guò)五千萬(wàn),但是我們并沒(méi)有在這些用戶上去獲得收入。所以大概在2008年、2009年的時(shí)候我們就開(kāi)始改變我們的商業(yè)模式。其實(shí)我們底層用的技術(shù)還是一致的,只不過(guò)我們教給機(jī)器人的不是之前在通用和一些開(kāi)放域的知識(shí),而是教給它垂直性的知識(shí),商業(yè)模式改為為大企業(yè)還有政府提供這種智能交互的解決方案。
在多年的努力之下,在智能客服機(jī)器人這塊,小i機(jī)器人已經(jīng)做了相當(dāng)多的應(yīng)用,有的Bots前面并沒(méi)有小i的名字,只能說(shuō)是power by 小i。比如說(shuō)招商銀行的客服機(jī)器人就叫做小招,中國(guó)聯(lián)通在微信公眾號(hào)的客服機(jī)器人叫做沃妹,上海通用叫做小優(yōu),攜程叫做小游,另外還有順風(fēng)的叫豐小滿。不僅僅是線上的機(jī)器人,在線下我們也提供實(shí)體的服務(wù)機(jī)器人。
用智能客服機(jī)器人或者使用VCA的回報(bào)是非常明顯的,比如大家看看下圖中的數(shù)字,對(duì)于中國(guó)建設(shè)銀行來(lái)說(shuō),我們每天處理大概200萬(wàn)個(gè)會(huì)話,現(xiàn)在這個(gè)數(shù)字已經(jīng)發(fā)展到大概三四百萬(wàn)個(gè)會(huì)話,大概可以幫它節(jié)省6000個(gè)電話座席,對(duì)于交通銀行他給出了更為明確的每個(gè)月幫他節(jié)省1400萬(wàn)美金。當(dāng)然我們做的客戶絕不僅僅是這兩家銀行,中國(guó)前五十家銀行當(dāng)中四十家已經(jīng)上了我們的客服系統(tǒng)。
對(duì)于一個(gè)完整的Bots,我把它分為比較基本的四層,其實(shí)每層都有相當(dāng)多的技術(shù)需要去解決,比如說(shuō)大家看到第三層,這個(gè)是認(rèn)知智能技術(shù)和知識(shí)驅(qū)動(dòng)的智能問(wèn)答系統(tǒng),這是小i核心的能力。再往前段就是之前各種智能感知技術(shù),包括語(yǔ)音識(shí)別、圖象識(shí)別、體感識(shí)別,另外把全渠道的溝通能力都已經(jīng)集成到產(chǎn)品當(dāng)中去,所以形成了一種全渠道多模態(tài)智能人機(jī)交互的這種模式。你有了這樣的技術(shù)能力,要通過(guò)不同的方式提供給不同的客戶群,所以在前端我們是適用不同的Bots類型,提供不同的開(kāi)發(fā)框架和平臺(tái)。
我們對(duì)三類用戶有不同的框架和平臺(tái),企業(yè)級(jí)的、云服務(wù),另外我們還提供了一個(gè)操作系統(tǒng),針對(duì)于不同的硬件。多模態(tài)智能人機(jī)交互技術(shù),包括文字、語(yǔ)音、圖像還有體感的技術(shù)都已經(jīng)整合到我們的平臺(tái)和產(chǎn)品當(dāng)中。我們核心的智能對(duì)話引擎已經(jīng)發(fā)展到第十代,完全是由領(lǐng)域的知識(shí)和領(lǐng)域的模型來(lái)去驅(qū)動(dòng)的。我看到群里有人提到深度學(xué)習(xí)在這里面有什么樣應(yīng)用?我跟大家說(shuō)一下,深度學(xué)習(xí)在里邊用的當(dāng)然不是用在自然語(yǔ)言處理上面,深度學(xué)習(xí)主要用的是如何形成這樣一些知識(shí)。
大家可以看到我們獨(dú)創(chuàng)的知識(shí)模型,包括概念,本體知識(shí)圖譜還有專家系統(tǒng),在語(yǔ)義庫(kù)的層面包括詞,包括語(yǔ)義表達(dá)和抽象語(yǔ)義,以及通過(guò)深度學(xué)習(xí)方法訓(xùn)練的各種語(yǔ)言的模型。
剛才群里有人提到了人機(jī)協(xié)作,沒(méi)錯(cuò),這個(gè)詞用得非常好。因?yàn)樵谏虡I(yè)的系統(tǒng)當(dāng)中,人機(jī)協(xié)作是可以被采取的一種落地的方式,所以在小i的知識(shí)學(xué)習(xí)體系里面是一個(gè)典型的人機(jī)協(xié)作的學(xué)習(xí)體系,在里面我們是把它分為三種角色,分別是專家、運(yùn)營(yíng)人員還有機(jī)器,機(jī)器負(fù)責(zé)什么呢?機(jī)器通過(guò)機(jī)器學(xué)習(xí)、深度學(xué)習(xí)的方法,從大量非結(jié)構(gòu)化的文本當(dāng)中挖掘語(yǔ)義、實(shí)體、事實(shí)還有場(chǎng)景。那這些挖掘的結(jié)果由運(yùn)營(yíng)人員進(jìn)行審核,然后這里邊的所有的這樣一些知識(shí)的結(jié)構(gòu)還有運(yùn)營(yíng)的模式,以及規(guī)則的制定是由專家來(lái)完成的,因?yàn)閷?duì)于不同的一些應(yīng)用場(chǎng)景,不同的領(lǐng)域,對(duì)這個(gè)知識(shí)模型的要求其實(shí)是不一樣的。
我們用機(jī)器學(xué)習(xí)的方法,訓(xùn)練了很多關(guān)于語(yǔ)言的基礎(chǔ)模型,這些基礎(chǔ)模型可以通過(guò)我們上層的知識(shí)的管理軟件,通過(guò)知識(shí)工程師,輕而易舉的針對(duì)于不同的應(yīng)用場(chǎng)景設(shè)計(jì)不同的自然語(yǔ)言的理解能力,以及它的粗細(xì)的力度和它的深度。下面這張圖展示的功能現(xiàn)在是整合在我們新的產(chǎn)品當(dāng)中準(zhǔn)備要去發(fā)布,這是一個(gè)非常深度的語(yǔ)義理解,而且在知識(shí)管理后臺(tái)可以去把它的知識(shí)功能設(shè)計(jì)出來(lái)。這個(gè)設(shè)計(jì)的過(guò)程比較簡(jiǎn)單,只需要告訴機(jī)器我們要做到什么樣的程度,就可以自動(dòng)生成。
比如說(shuō)“上海明天下午五點(diǎn)比北京要高幾度”,這句話看似好像很簡(jiǎn)單,但是我們要準(zhǔn)確回答的話至少要做好幾步的操作,首先我們要完全理解這個(gè)語(yǔ)義,而且我們理解完了以后要查詢一下上海以及北京下午這個(gè)時(shí)刻的溫度,然后要做一個(gè)比較,給一個(gè)回復(fù)出來(lái)。這樣一個(gè)過(guò)程完全是自動(dòng)產(chǎn)生的,我們只要告訴機(jī)器我們要去做什么樣的事情,并且有些基本的對(duì)這里邊的一些語(yǔ)義的設(shè)計(jì)。
小i機(jī)器人面向于不同用戶的三種平臺(tái)分別是enterprise、cloud還有os。其實(shí)我們?cè)?006年就推出了基于MSN的叫IBot Platform,我們那時(shí)已經(jīng)開(kāi)始在用Bots這個(gè)詞了,但這個(gè)詞在今年初才真正的在全球火起來(lái)。
大家可以看到,這里邊所有的能力在底層完全基于知識(shí)來(lái)去驅(qū)動(dòng),知識(shí)又包括知識(shí)管理和知識(shí)學(xué)習(xí)這樣的體系,基于知識(shí)我們提供了從語(yǔ)義理解到智能語(yǔ)音、智能搜索、大數(shù)據(jù)分析和推理預(yù)測(cè)的全系列的智能引擎,base在這些知識(shí)引擎能力基礎(chǔ)之上,我們又構(gòu)建了上層的智能應(yīng)用,包括智能客服機(jī)器人,智能實(shí)體機(jī)器人,以及為企業(yè)內(nèi)部提供的諸如培訓(xùn)這方面的一些應(yīng)用。很多場(chǎng)合其實(shí)我們都提到人工智能是一種勢(shì)能技術(shù),只有跟很多行業(yè)做深度的這樣一些整合,跟這些客戶的需求,跟這些在使用過(guò)程當(dāng)中不斷的產(chǎn)生的這樣一些反饋,做深度的這樣一些整合,才有可能最大程度發(fā)揮人工智能技術(shù)這樣的一些價(jià)值。
這個(gè)平臺(tái)跟剛才諦聽(tīng)機(jī)器人的平臺(tái)就有點(diǎn)類似了。我們做Cloud平臺(tái)有一個(gè)自己的商業(yè)方向,我們不大關(guān)注公眾云服務(wù),所有服務(wù)都是免費(fèi)提供的。我們更關(guān)注于在私有云和行業(yè)云的提供,因?yàn)樵谥袊?guó),其實(shí)只有私有云和行業(yè)云才有真正的商業(yè)模式,在中國(guó)其實(shí)很多這樣一些客戶是不會(huì)為公有云去買單的,或者說(shuō)會(huì)為公有云去買單的客戶相對(duì)較少。前面提的公有云主要是saas服務(wù),而不是現(xiàn)在說(shuō)的Iaas服務(wù),Iaas服務(wù)公有云的話現(xiàn)在大家基本上已經(jīng)接受了,像阿里云的生意也越做越大。剛剛前面提到我們重點(diǎn)是做私有云和行業(yè)云,公有云的產(chǎn)品可以私有化進(jìn)行部署的,而且全面整合了語(yǔ)音、語(yǔ)義的能力。另外我們也開(kāi)放了自己的語(yǔ)義云,包括基本的自然語(yǔ)言處理和一些在文本聚類分類上的這樣一些底層公用的這樣一些技術(shù)。
它是全面兼容各種主流的硬件平臺(tái)和底層的操作系統(tǒng),實(shí)現(xiàn)我們小i機(jī)器人的從軟到硬的產(chǎn)業(yè)延伸。硬件開(kāi)發(fā)者也可以通過(guò)管理后臺(tái)去個(gè)性化定制智能硬件的交互,并且進(jìn)行業(yè)務(wù)邏輯的二次開(kāi)發(fā)。
基于這個(gè)IBot OS有豐富的云端的能力擴(kuò)展,還有base在iBot OS的解決方案,可以用在商用機(jī)器人、家用機(jī)器人、智能家居、智能電視盒子,另外我們和一些廠家做一些智能車載產(chǎn)品,當(dāng)然我們做智能車載更關(guān)注語(yǔ)義方面的理解以及后面內(nèi)容的整合。除了iBot OS可以支持像智能家居、智能電視、智能機(jī)頂盒以及智能可穿戴式設(shè)備之外,另外更重要的目的是為了驅(qū)動(dòng)各種實(shí)體機(jī)器人,包括這幅圖里面這個(gè)NAO,它的身高大概接近60厘米,大概57厘米,另外Ina是從韓國(guó)進(jìn)口的,另外我們還有跟國(guó)內(nèi)的合作伙伴比如木爺合作的智能機(jī)器人。
?最后跟大家分享一下小i機(jī)器人在人工智能產(chǎn)業(yè)的整體布局。圖里面,小i機(jī)器人畫的越大,就是我們投入資源越多,我們?cè)缴瞄L(zhǎng)的領(lǐng)域。
不好意思,我沒(méi)有提到太多的跟技術(shù)相關(guān)的部分。對(duì)于一家企業(yè)來(lái)說(shuō),更為重要的就是人工智能的技術(shù)如何在產(chǎn)業(yè)里面落地,更多的為產(chǎn)業(yè)帶來(lái)價(jià)值。其實(shí)現(xiàn)在很多人工智能的創(chuàng)業(yè)企業(yè),太多的關(guān)注于技術(shù)本身,而去忽略于這種產(chǎn)業(yè)的應(yīng)用發(fā)展,我覺(jué)得這個(gè)對(duì)公司的后續(xù)發(fā)展是不大有利的。我們小i在智能客服這個(gè)領(lǐng)域,今年整個(gè)商業(yè)收入比去年大概增長(zhǎng)了200%。(本文首發(fā)鈦媒體,根據(jù)小i機(jī)器人總裁兼CTO朱頻頻在鈦坦白上的分享整理)
………………………………………………
鈦坦白第27期,也是“AI已來(lái)”系列第一期,六位鈦客的精彩分享已經(jīng)結(jié)束,干貨會(huì)陸續(xù)發(fā)布:http://www.chcmb.cn/tag/1508094
時(shí)間:12月26日、27日19點(diǎn)-22點(diǎn)
地點(diǎn):鈦坦白|人工智能(微信群)
報(bào)名入群:在微信公號(hào)“鈦媒體”(taimeiti),發(fā)送“鈦坦白”
推薦鈦客、贊助、合作:請(qǐng)與鈦坦白負(fù)責(zé)人佳音聯(lián)系,郵箱jiayinge@tmtpost.com
快報(bào)
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論
厲害了我的歌