語句解析簡要流程
1)人基于什么進行交流?
人的所有交流都基于以下五類真實的素材:
①?視覺層面:可視化方面,素材、圖畫、動作、圖景隨時間變化……
②?味覺層面:味覺感官,如:甜、苦、澀、酸……
③?聽覺層面:聽覺感官,如:音質(zhì)連續(xù)、間斷、跳躍、清晰、模糊、洪亮、清脆……
④?觸覺層面:皮膚感官,如:柔軟、堅硬、摩擦……
⑤?嗅覺層面:嗅覺感官,如:臭、香……
2)基于語境展現(xiàn)的語句分析
人類所有的交流都是基于事實的、能夠真實感受到的事物來進行的,當機器解析自然語言時,也需要將其轉(zhuǎn)成事實的、能夠真實感受到的事物。因此,“語境解析引擎”主要是將語言還原成一幅真實的圖畫,并基于“知識圖譜”、“事物組合圖譜”對其進行深度解析的一種技術(shù)。
基于語境解析引擎的自然語言理解主要包括以下幾個部分:
①?基于事物組合圖譜尋找話語語境中的類似事物組合場景;
②?用類似事物場景的各種屬性特點去理解話語場景;
③?如果針對話語語境中的某些點需要著重分析,則調(diào)取“知識圖譜”或“事物組合圖譜”數(shù)據(jù)進行深入分析。
舉例1:“狗走進了房間,他是毛絨絨的?!?/p>
“狗走進了房間,它布滿了家具?!?/p>
毛絨絨是狗的“外形表述”,家具是一個物體,房間更多是一個空間區(qū)域,布滿則是物體擺放的位置,因此,基于人工智能技術(shù),我們很容易通過語境來理解語句的語義。
要基于事物組合圖譜進行可視化動態(tài)聯(lián)想,將一句話展現(xiàn)為一幅動態(tài)簡約語境圖畫,如下邊例子所示:
舉例2:“詠鵝”古詩用圖畫表示出來
詠鵝
鵝,鵝,鵝,曲項向天歌。
白毛浮綠水,紅掌撥清波。
基于語境解析技術(shù)將古詩語境用圖畫展示出來,如下圖所示:
任何一幅語境圖畫所展現(xiàn)的內(nèi)容都是無窮多的,這無窮多的可能會帶來成千上萬種語義可能,通過將語境所有事物按照可能性組合在一起,對這種事物組合的類似場景進行分析,來獲取最有可能表達的那種語義,并最終獲取某一語句表達的真實語義。
當然,語境中的事物可能會出現(xiàn)多種組合形式,每一種組合形式都可能會對應相應的語義。但語境具有糾錯機制,隨著語句的持續(xù),當發(fā)現(xiàn)前邊的理解有誤時,即前邊的某一語句表達的并不是概率最高的那個語義時,可以糾正前邊的語句語義理解。
其實從另一方面來講,“話語”本身是能表達多種含義的,而語境對語義具有限制作用,將一句話限制在某一確定的語義,也即話語能夠表達多種不同的含義A/B/C/D,每種含義的概率分別是35%、30%、25%、10%,語境將語義限制在其中的某一種,比如B。
語境對語義的制約有多種情況,比如,同樣一句話,不同身份的人所表達的語義不同。例如:
一位教師說:“明天上午八點我去上課?!?/p>
一個學生說:“明天上午八點我去上課?!?/p>
上面的兩個例句中,教師和學生雖然都說同樣的話,由于教師和學生的職務身份不同而決定了同樣一句話的語義不同,教師說這句話的意思是“去講課”,而學生說句話的意思是“去聽課”。
按照傳統(tǒng)的語句邏輯分析,很難解決這種語義分歧錯誤,但是在人工智能大數(shù)據(jù)統(tǒng)計分析的情況下,這個解決起來就太簡單了,通過大量的數(shù)據(jù)分析發(fā)現(xiàn),“學生”與“上課”這兩個事物組合到一起,99.9%的概率是去學生去聽課,So easy!
再比如,同樣的一句話,在不同的時間、地點、場合,就有不同的語義。
例如:“都八點了!”
按照傳統(tǒng)的語句解析技術(shù),這句話很難理解,由于缺乏語境,它的語義很難確定。但是按照人工智能技術(shù),這個問題很簡單,通過大數(shù)據(jù)分析,可以直接給出,這句話出現(xiàn)在各種場景中的概率:
①?快點走,否則飛機晚點了(0.1%)
②?快點走,否則上班時間要遲到了(15.1%)
③?快點走,否則上課要遲到了(11.1%)
④?你沒有時間概念(14%)
……
至于最終表達的是一種什么樣的含義,無所謂,隨著語境的持續(xù)而自然解決。
舉例:交通事故
一位剛學會騎自行車的姑娘,因有急事飛駛在郊外的大馬路上。這時,她發(fā)現(xiàn)前面有個老人在路邊散步,她心里很慌亂,便在背后大聲叫道:“老大爺,站一下,請站住別動!”老人隨即站住,沒有回頭,只等姑娘過去。但不幸得很,姑娘三歪兩歪一下子撞在老人身上,老人摔倒了。老人爬起來說:“我說你讓我站住干什么,原來你是要瞄準呀!”
整個段子的語言解析的字數(shù)比本文所有字數(shù)還多,簡略起見,僅對其第一句話進行解析:“一位剛學會騎自行車的姑娘,因有急事飛駛在郊外的大馬路上。”
①?“姑娘”是“女孩”的另一種稱呼,這點通過知識圖譜可以得到;
②?“自行車”是一種物體,通過知識圖譜可以查到;
③?“馬路”是“公路”或“泊油路”的另一種稱呼,是一個事物,通過知識圖譜可以查到;
④?“郊外”是一個“事物組合”,通常指麥田、道路、野草、村落等組成的場景,通過“事物組合圖譜”可以查到;
⑤?“騎自行車”是“人”與“自行車”兩種事物組合在一起的一種運動狀態(tài),在“事物組合圖譜”里邊可以
⑥?“剛學會騎自行車”是“人”與“自行車”兩種事物組合在一起的一種運動狀態(tài)的子集,這在“事物組合圖譜”里邊可以查到;
⑦?“有急事”是“人”與“事情”兩種事物組合在一的一種狀態(tài)子集,這在“事物組合圖譜”里可以查到;
⑧?“飛馳”是車輛等事物運動過程中的一種描述,這在“事物組合圖譜”里可以查到;
⑨?基于上述這些理解與數(shù)據(jù),通過“語境解析引擎”,很容易將這句話解析出來,最后給出的是一個還原的簡略過程“描述視頻”,也即為該句話的“語境”,也即理解這句話的含義。
基于“知識單元”、“知識圖譜”、“事物組合圖譜”、“視覺解析引擎”、“語境解析引擎”等技術(shù),已經(jīng)能夠完美搭建基于自然語言的龐大數(shù)據(jù)庫,并能夠以極高準確率識別自然語言,可以說,這已經(jīng)為真正實現(xiàn)人工智能搭建了良好的基礎(chǔ),但這僅僅是整個“人工智能”技術(shù)體系中的一部分,鑒于本文篇幅,剩下的那部分將在后續(xù)的文章中展現(xiàn)給大家。
最后想說一句話:中國創(chuàng)新,改變世界!
快報
根據(jù)《網(wǎng)絡安全法》實名制要求,請綁定手機號后發(fā)表評論
作為一個自然語言領(lǐng)域的研究人員,對作者作為非專業(yè)研究人員,也沒做過多年大量實驗的情況下,能把人工智能的本質(zhì)理解到這個深度,表示不可思議。這些內(nèi)容的方向與當今的人工智能研究主流并不很一致,能這樣系統(tǒng)完整地分析人工智能的主要瓶頸問題,并提出很多學界主流沒有給與足夠關(guān)注的要點,對于一個作家來講,實在是難能可貴。
這種模式的人工智能,有自我意識嗎?有創(chuàng)造力嗎?
看來我已經(jīng)和這篇文章接軌了,
很有內(nèi)涵,難得一見的好作品。