近期,人工智能領(lǐng)域的領(lǐng)軍企業(yè)OpenAI正與專(zhuān)業(yè)顧問(wèn)合作,推進(jìn)其代碼生成模型Codex的出售流程。作為OpenAI2021年8月推出的核心產(chǎn)品之一,Codex曾是代碼生成領(lǐng)域的標(biāo)桿技術(shù),此次出售動(dòng)作引發(fā)了行業(yè)對(duì)其戰(zhàn)略調(diào)整的密切關(guān)注。
Codex基于OpenAI的GPT-3大模型開(kāi)發(fā),參數(shù)規(guī)模達(dá)1750億,專(zhuān)門(mén)針對(duì)代碼生成任務(wù)做了優(yōu)化。它能理解自然語(yǔ)言描述的編程需求,生成Python、Java、JavaScript等超過(guò)100種編程語(yǔ)言的代碼片段或完整程序。早期測(cè)試顯示,其生成代碼的準(zhǔn)確率超過(guò)70%,曾為GitHub Copilot提供核心技術(shù)支持,幫助開(kāi)發(fā)者把編碼效率提升約40%。
技術(shù)層面上,Codex的訓(xùn)練數(shù)據(jù)包含GitHub上數(shù)十億行公開(kāi)代碼,通過(guò)監(jiān)督學(xué)習(xí)與強(qiáng)化學(xué)習(xí)技術(shù)優(yōu)化模型。它的核心優(yōu)勢(shì)在于把自然語(yǔ)言理解和代碼語(yǔ)法規(guī)則深度結(jié)合,能處理算法實(shí)現(xiàn)、API調(diào)用等復(fù)雜編程邏輯,同時(shí)支持代碼補(bǔ)全、錯(cuò)誤修復(fù)等實(shí)用功能,成為眾多開(kāi)發(fā)者的重要輔助工具。
OpenAI此次出售Codex的背后有明確的戰(zhàn)略考慮:一方面,公司希望集中資源投入GPT-4及后續(xù)更先進(jìn)的多模態(tài)模型研發(fā),這類(lèi)模型在通用AI能力上競(jìng)爭(zhēng)力更強(qiáng),能覆蓋更廣泛的應(yīng)用場(chǎng)景;另一方面,出售成熟的代碼生成技術(shù)可讓OpenAI獲得可觀的商業(yè)化收益,補(bǔ)充研發(fā)資金,進(jìn)一步鞏固自己在AI領(lǐng)域的領(lǐng)先位置。此外,Codex的轉(zhuǎn)讓也會(huì)讓更多企業(yè)獲得先進(jìn)的代碼生成工具,推動(dòng)行業(yè)在軟件開(kāi)發(fā)自動(dòng)化領(lǐng)域的競(jìng)爭(zhēng)和創(chuàng)新。
目前,OpenAI已聘請(qǐng)專(zhuān)業(yè)顧問(wèn)團(tuán)隊(duì),正在全球?qū)ふ覞撛谫I(mǎi)家,涵蓋科技巨頭、云服務(wù)提供商以及專(zhuān)注開(kāi)發(fā)者工具的企業(yè)。交易形式可能包括模型授權(quán)、技術(shù)轉(zhuǎn)讓或整體資產(chǎn)出售,具體條款還在協(xié)商,暫未對(duì)外公布估值細(xì)節(jié)。
行業(yè)近期動(dòng)態(tài)顯示,AI代碼生成領(lǐng)域的商業(yè)化步伐在加快。比如谷歌2024年3月更新的Gemini Advanced模型就強(qiáng)化了代碼生成能力,支持多語(yǔ)言代碼調(diào)試和優(yōu)化,用戶(hù)反饋它的代碼生成準(zhǔn)確率比上一代提高了15%;Meta的Llama 3模型也把代碼生成作為重點(diǎn)功能之一,向企業(yè)用戶(hù)開(kāi)放API服務(wù),進(jìn)一步降低了企業(yè)使用先進(jìn)代碼生成技術(shù)的門(mén)檻。
競(jìng)爭(zhēng)對(duì)手方面,Anthropic2024年2月推出的Claude 3模型,代碼生成能力已接近Codex,支持實(shí)時(shí)代碼解釋與重構(gòu),在部分復(fù)雜編程任務(wù)上的表現(xiàn)甚至超過(guò)Codex;亞馬遜的CodeWhisperer則通過(guò)整合AWS云服務(wù),為企業(yè)用戶(hù)提供端到端的代碼生成方案,截至2024年第一季度,它的企業(yè)用戶(hù)數(shù)已突破10萬(wàn),市場(chǎng)份額還在不斷擴(kuò)大。如果Codex順利出售,可能會(huì)改變當(dāng)前代碼生成工具市場(chǎng)的競(jìng)爭(zhēng)格局,促使更多企業(yè)加大這一領(lǐng)域的投入,加快行業(yè)技術(shù)迭代。






快報(bào)