彼此相安無事幾年后,國產翻譯軟件們正在遭遇最強外敵。
近期,谷歌翻譯在微信朋友圈投放一系列廣告,用于展示谷歌翻譯Word Lens(即實時相機翻譯)的功能。
在中國市場沉寂多時后,這是谷歌久違的動靜??萍济詫τ谶@次廣告試水也顯得相當興奮,長句翻譯、專業(yè)術語甚至外延產品谷歌實時翻譯耳機,都成為了關注的焦點。
這加劇了翻譯市場的緊張氣氛。外界不斷將國產翻譯軟件與谷歌翻譯進行對比,議論哪個競品需要擔心。
對比用戶們的躍躍欲試,在國內市場扎根多年的國產翻譯軟件們正互相觀察,試圖找到一個答案:勁敵當前,誰或成為最大輸家?
一、進擊的谷歌
這不是谷歌翻譯第一次在朋友圈投放廣告。
今年3月29日,谷歌翻譯App更新至5.8版本,不僅增加了Word Lens功能(意為通過神經網(wǎng)絡識別圖像中的文字,然后再轉化成對應所需求的文字),更重要的是,其App首次對中國用戶開放。彼時,谷歌翻譯也投放了一系列廣告。
和3月的投放相比,近期的廣告依然集中推廣Word Lens、語音翻譯和手寫翻譯功能。只是將主題設定為城市探索,同時邀請今年嘻哈熱潮中的代表人物“HipHopMan” 歐陽靖進行宣傳,以吸引更多年輕用戶。
屢次投放廣告,谷歌翻譯對于中國市場的迫切由此可見。雖然在過去八年中,中國用戶可以在網(wǎng)頁端使用谷歌翻譯,但移動端應用的缺席,讓谷歌翻譯在中國市場失去了不少機會。
此次移動端應用終于落地,谷歌展開一系列攻勢也屬正常。面對谷歌的強烈攻勢,國內的翻譯軟件們應該緊張嗎?
至少以目前的功能看,每家都大同小異。從輸入法看,目前的翻譯App都提供鍵盤輸入、手寫輸入、語音輸入、攝像頭采集等多種場景下的服務;此外,提供的翻譯服務從過去的詞組、句子翻譯升級為整段翻譯、語音翻譯、實景翻譯等。不僅如此,各家翻譯App還通過語言包開啟了離線翻譯功能。
除了以上種種,谷歌翻譯還提供 “點按翻譯”(Tap to translate),意味著可以直接在其他App上使用Google翻譯而無需切換界面,升級用戶體驗。
既然功能相似度極高,“后浪”谷歌憑借什么逼近國產翻譯軟件的護城河呢?
區(qū)別各類翻譯軟件的,不是表面各項功能,而是功能背后的技術。經過PBMT(基于詞組的機器翻譯)與SMT(統(tǒng)計翻譯模型)時代的競爭,如今翻譯技術已經進入了NMT(神經網(wǎng)絡翻譯)時代。此前,PBMT的翻譯單位是詞組,無法解決詞序和語法問題,因此在長句及專業(yè)表達上顯得差強人意。
如今,NMT卻嘗試反其道行之:將整句作為翻譯單位,利用上下文信息進行多義詞的判定,最后進行邏輯性的關聯(lián)翻譯。相比之下,NMT的翻譯成果更接近日常用語習慣。
同時,NMT系統(tǒng)會收集用戶反饋訓練自身,利用大數(shù)據(jù)倒推新的規(guī)則以補充知識圖譜。目前,谷歌、微軟、有道、科大訊飛、百度等巨頭在翻譯方面均更新了NMT系統(tǒng),以期在AI時代一決勝負。
而谷歌翻譯,在數(shù)據(jù)運用方面無疑具有更多的話語權。在2006年翻譯業(yè)務上線后,谷歌以搜索引擎的身份不斷收集數(shù)據(jù),而開發(fā)的安卓系統(tǒng)更是在搜集移動數(shù)據(jù)方面助力良多。如吳軍在《智能時代》里所描述的,2005年谷歌翻譯曾憑借更多的數(shù)據(jù),在美國翻譯界大賽上秒殺老牌翻譯公司。
憑借深厚的積累,谷歌在大數(shù)據(jù)時代的競爭中給對手們帶來了更多的壓力。
二、群雄逐鹿
在龐大而充滿變數(shù)的中國市場,不斷打廣告的谷歌,并非如外界想象得信心滿滿。
將NMT運用于翻譯,谷歌并非行業(yè)第一人。早在2015年,百度就上線了世界上首個NMT系統(tǒng),而谷歌則在2016年才推出類似的系統(tǒng)。
在中國市場,姍姍來遲的谷歌面對人滿為患的競技場,需要展示更多的優(yōu)勢吸引用戶。
雖然谷歌在數(shù)據(jù)領域已是專家,但在中文數(shù)據(jù)搜集方面,由于用戶的使用習慣和頻率,谷歌并不具備優(yōu)勢。
同時,當業(yè)內的競爭者都完成技術升級后,谷歌翻譯在十年前靠海量數(shù)據(jù)形成的優(yōu)勢將逐漸消弭。
某種程度上,谷歌翻譯和國內翻譯軟件站在了同一起跑線上。復旦中國研究院副研究員余亮向筆者表示,技術上各家處于同一個層次,技術如何落地將決定下一賽程的結果。
想要跑贏翻譯競爭的后半段,硬核在于信息基礎。余亮表示,翻譯技術身后需強大的技術庫以及知識圖譜作為支撐。知識圖譜作為人工智能大腦的基礎,需要耗費大量的資源構建。同時,在海量搜索的數(shù)據(jù)間建立復雜、多維的聯(lián)系,通過對語言的分解、關聯(lián)以及數(shù)據(jù)化進行訓練后,形成龐大的知識庫,以獲得對提問自動判斷的能力。
雖然NMT潛力巨大,現(xiàn)階段牢牢把握中國用戶的是有道翻譯。在NMT出現(xiàn)之前,外界的聚光燈集中于有道翻譯。
比達咨詢(BDR)5月的監(jiān)測數(shù)據(jù)顯示,國內語言工具類APP月活躍用戶數(shù)方面,有道詞典月活躍用戶數(shù)為4312.2萬人,而第二名金山詞霸為926.5萬人,兩者之間差距不小。
在進入NMT時代之前,有道詞典憑借良好的用戶體驗以及UI設計獲得了用戶青睞。
今年5月,有道翻譯上線了NMT翻譯技術,遲到的NMT技術能幫助有道持續(xù)占領翻譯市場嗎?
恐怕很難。在未來翻譯戰(zhàn)爭中,搜索引擎扮演了關鍵角色?;谟脩舻陌賰|搜索量,搜索引擎公司相對于其他互聯(lián)網(wǎng)公司,將積累更多的數(shù)據(jù)。這將幫助神經系統(tǒng)不斷訓練與打磨,成熟度會遠高于其他的互聯(lián)網(wǎng)公司神經系統(tǒng)。
11月,在2017世界人工智能大會上,百度副總裁、AI技術平臺體系總負責人王海峰就曾表示,百度正在打磨知識圖譜。
不僅是余亮,曾在谷歌和騰訊工作過的吳軍也曾公開表示過,未來在翻譯領域前兩名將會是谷歌與百度。因為二者都以搜索引擎起家,在數(shù)據(jù)搜集上有先天的優(yōu)勢,而這一優(yōu)勢今后會發(fā)揮馬太效應,逐步擴大。
三、落地為王
長期以來,翻譯服務一直被認為是巨頭扎堆的小市場,盈利不易但技術投入巨大。除了百度、谷歌等面世許久的翻譯軟件,騰訊前不久也推出了“騰訊翻譯君”,該產品用于中英同聲傳譯服務。
今年7月,阿里巴巴披露的一份技術資料顯示,阿里翻譯團隊通過優(yōu)化阿里云機器學習平臺PAI,應用于英俄電商翻譯質量優(yōu)化項目中。
同一時段,大洋彼岸的Facebook也宣布面向全球推出NMT,用于Facebook中上百種語言的翻譯,并且達到每天45億次的翻譯量。
一時間,全球的互聯(lián)網(wǎng)巨頭都在翻譯市場發(fā)力。
巨頭的涌入不能說明翻譯市場的吸金力。2013年9月,有道詞典宣布在第三季度實現(xiàn)盈利。但除了有道,排名第二的金山詞霸至今在盈利問題上含糊其辭。
在今年5月,北京金山辦公軟件股份有限公司(以下簡稱“金山辦公”)披露了招股說明書,卻未公布WPS Office辦公軟件和金山詞霸的財務數(shù)據(jù)。
既然盈利不易,為什么巨頭對這片市場充滿了征服欲呢?其實,在翻譯技術身后,有無數(shù)的外延產品,這將為巨頭們帶來新的紅海。
在國外,谷歌正在重點推谷歌home,即谷歌智能家居,作為一個家庭互聯(lián)網(wǎng)的入口,與亞馬遜爭斗市場份額。在國內,幾家互聯(lián)網(wǎng)巨頭都已推出智能音箱。
以最近的零售大戰(zhàn)數(shù)據(jù)看,雙十一期間天貓精靈售出100萬臺,在國外黑色星期五期間,亞馬遜Echo智能音箱銷售約為800萬臺。
僅是智能音箱一項,就可以為公司帶來不小的收益。而在技術成熟后,落地產品將會越來越多。余亮表示,谷歌和百度這類搜索公司,愿意暫時燒錢在翻譯市場,其實是嘗試互聯(lián)網(wǎng)的“破壞式創(chuàng)新”,未來在數(shù)據(jù)積累達到一定程度時,百度和谷歌將通過別的業(yè)務賺錢。
而如網(wǎng)易這類在AI上沒有過多技術基礎的公司,正在嘗試教育方向的延伸,例如網(wǎng)易課堂。
在不同業(yè)務背景的加持下,未來各個翻譯公司的外延產品差距會逐漸拉大,能否回籠前期的投入資金,才能決定最后的贏家。
谷歌的入局不會宣布輸家的人選。相反,這場由NMT開始的翻譯大戰(zhàn),才剛剛開始。(本文首發(fā)鈦媒體)






快報
根據(jù)《網(wǎng)絡安全法》實名制要求,請綁定手機號后發(fā)表評論