鈦媒體App 3月27日消息,3月27日凌晨,
阿里巴巴發(fā)布并開源首個端到端全模態(tài)大模型通義千問Qwen2.5-Omni-7B,可同時處理文本、圖像、音頻和視頻等多種輸入,并實時生成文本與自然語音合成輸出。在權(quán)威的多模態(tài)融合任務(wù)OmniBench等測評中,Qwen2.5-Omni刷新業(yè)界紀(jì)錄,全維度遠(yuǎn)超Google的Gemini-1.5-Pro等同類模型。Qwen2.5-Omni以接近人類的多感官方式立體認(rèn)知世界并與之實時交互,還能通過音視頻識別情緒,在復(fù)雜任務(wù)中進(jìn)行更智能、更自然的反饋與決策?,F(xiàn)在,開發(fā)者和企業(yè)可免費下載商用Qwen2.5-Omni,手機(jī)等終端智能硬件也可輕松部署運行。
根據(jù)《網(wǎng)絡(luò)安全法》實名制要求,請綁定手機(jī)號后發(fā)表評論