圖片來自網(wǎng)易有道
3月10日,鈦媒體APP從網(wǎng)易有道獨家獲悉,有道翻譯大模型已經(jīng)實現(xiàn)底層技術迭代,基于自主研發(fā)的子曰翻譯大模型2.0,其中,14B小參數(shù)垂類模型,實現(xiàn)了高水準的翻譯性能,現(xiàn)在已經(jīng)全量上線。
14B小參數(shù)垂類模型推出,意味著在訓練和推理時,AI翻譯消耗的計算資源更少,部署的成本更低,更容易集成到現(xiàn)有系統(tǒng)和設備中,適合更多的實際場景。
鈦媒體APP觀察到,搭載全新大模型的翻譯技術,已在有道詞典、有道翻譯及有道翻譯官內上線,提供標準模型和高級模型兩種不同參數(shù)的選擇,用戶可直接切換使用。
與此同時,該大模型已經(jīng)上線網(wǎng)易有道旗下智能硬件產(chǎn)品,有道詞典筆X7系列已升級為最新的翻譯大模型,其余型號將陸續(xù)更新。
事實上,大語言模型的性能并非完全由參數(shù)量決定,很大程度上也依賴于數(shù)據(jù)質量、領域適配性與算法優(yōu)化的結合。
鈦媒體APP了解到,網(wǎng)易有道之所以能夠實現(xiàn)14B小參數(shù)垂類模型,是因為,在數(shù)據(jù)層面,新的模型技術收集并清洗了高質量的翻譯語料數(shù)據(jù),并由英語專業(yè)八級認證人員及職業(yè)譯員進行精細化人工標注,使得模型擁有海量的優(yōu)質數(shù)據(jù)資源庫,增強其在多樣化翻譯場景的應對能力。
而在算法層面,有道以子曰大模型為基礎,進行了二次預訓練,打造了兼具專業(yè)性與針對性的翻譯基座大模型,結合大模型蒸餾技術、大模型融合技術和Online DPO(在線直接偏好優(yōu)化)技術等手段,避免了大模型的災難性遺忘等問題,并在運行效率、準確性、流暢性等翻譯性能上實現(xiàn)大幅提升。
最后是在評估層面,借助翻譯數(shù)據(jù)沉淀,有道研發(fā)了翻譯評估模型Reward Model,為子曰翻譯大模型的性能評估,提供一個可靠的量化依據(jù),以及完善的人工評估方案,多維度對模型的翻譯結果進行評估和分析。
垂類模型通過聚焦特定領域,在特定任務的優(yōu)化上,具備相對優(yōu)勢。在垂直場景上,子曰翻譯大模型2.0,在中英文互譯領域有所突破,譯文的專業(yè)度和穩(wěn)定性較前代版本均有提升。
此外,根據(jù)有道內部測評,新的翻譯模型在人文學科、商科、生活服務、醫(yī)療、科學等19個垂直領域的多學科的專業(yè)性、準確性、語言慣例和風格等方面,展現(xiàn)出了相比之前更高的翻譯準確率和流暢度。
網(wǎng)易有道相關負責人對鈦媒體APP表示,“通用大模型比的是參數(shù)大和算力強,但翻譯靠參數(shù)堆不出專業(yè)度。當通用大模型競逐參數(shù)規(guī)模時,我們更相信垂類模型的未來價值,用專業(yè)的垂直應用真正解決專業(yè)場景的痛點,也是我們持續(xù)努力的方向。”
大模型技術浪潮之前,有道翻譯技術主要基于統(tǒng)計機器翻譯及神經(jīng)網(wǎng)絡翻譯技術(NMT)。
截至目前,有道全系翻譯產(chǎn)品擁有超10億用戶。Quest Mobile數(shù)據(jù)顯示,網(wǎng)易有道詞典月活躍用戶數(shù)已超過1億,自2019年起,已連續(xù)六年位居教育類工具領域榜首。(本文獨家首發(fā)于鈦媒體APP,作者|李程程)
![]()
快報
根據(jù)《網(wǎng)絡安全法》實名制要求,請綁定手機號后發(fā)表評論
多垂直領域提升,工作學習都方便。
有道翻譯用戶超10億,這影響力,出的模型肯定差不了。
這模型易集成,感覺好多軟件都能接入,超實用。
有道這模型,感覺能改變大家學外語的方式。
中英文翻譯提升大,和老外交流更順暢。
小參數(shù)卻有大作用,有道這模型太給力。
數(shù)據(jù)、算法助力,模型實力不容小覷。
靠多維度評估,模型質量肯定杠杠的。
從研發(fā)到上線,網(wǎng)易有道效率真高。
模型上線,趕緊去有道產(chǎn)品體驗一下