目前所有的主流智能手機廠商中,蘋果幾乎是唯一一家,還沒有正式發(fā)布大模型應用的廠商。

過去的2023年,華為率先將大模型接入手機,使得手機可以執(zhí)行文本生成、知識查找、資料總結(jié)、智能編排、模糊/復雜意圖理解等復雜任務。之后,其他廠商迅速跟進,比如小米訓練出更為輕量級的語言大模型,參數(shù)規(guī)模為13億和60億兩種。小米內(nèi)部認為,輕量級模型也有其存在的市場空間,這是端側(cè)大模型的特殊要求,也是一家智能設備廠商入局大模型的必經(jīng)之路。

在此之后,vivo則推出了藍心大模型,同樣主打輕量化,利于進行手機本地化的數(shù)據(jù)處理;榮耀則在近日推出了自研端側(cè)70億參數(shù)平臺級AI大模型,并宣布與百度智能云達成戰(zhàn)略合作;幾乎是前后腳,OPPO也將首款70億參數(shù)大模型裝進新推出的Find X7上。三星則計劃2024年初發(fā)布的Galaxy S24系列手機中搭載大模型,旗下筆記本電腦、平板電腦也有可能集成該模型。

唯獨蘋果,對于iPhone何時將搭載大模型能力,目前還沒有確切的消息。一位業(yè)內(nèi)人士向鈦媒體App表示,“與折疊屏一樣,蘋果對于新技術(shù)的應用,傾向于做好充足的準備后,才會正式推出。”蘋果公司CEO庫克曾解釋道,蘋果有計劃在更多產(chǎn)品中加入AI,但要“深思熟慮”。

不過,蘋果已經(jīng)陸續(xù)展開了動作,比如推出了名為Ferret的多模態(tài)大語言模型,向新聞及出版機構(gòu)購買內(nèi)容版權(quán)。iPhone的“AI時刻”,正在加速到來。

追求更快的端側(cè)大語言模型

雖然蘋果還未公開詳細的大模型路線,但根據(jù)其發(fā)布的《閃存中的大型語言模型:在有限內(nèi)存下高效的大型語言模型推理》論文,外界得以窺見蘋果的技術(shù)進展。

目前,大多數(shù)大型語言模型(LLM)都在具有強大服務器硬件支持的云端運營。想要將這類模型裝進手機,讓數(shù)據(jù)分析和推理在終端設備上直接完成,就需要智能手機擁有足夠大的內(nèi)存。

但是,一個70億參數(shù)的模型就需要超過14GB的內(nèi)存來加載半精度浮點格式的參數(shù),這超過了大多數(shù)網(wǎng)絡端點的承受能力。即使通過量化壓縮模型,這對于終端設備的內(nèi)存要求依然過大,且壓縮模型通常需要修改模型甚至完全重新訓練,也會對于模型的實際應用帶來影響。

根據(jù)上述論文內(nèi)容,蘋果的研發(fā)人員似乎找到了突破方法——將模型參數(shù)存儲在閃存(手機固態(tài)硬盤)中,在需要的時候再將數(shù)據(jù)調(diào)入DRAM(手機內(nèi)存),以此解決LLM運行時,數(shù)據(jù)處理量超過DRAM可用容量的的難題,不至于壓垮系統(tǒng)內(nèi)存。

具體來說,蘋果主要運用了兩種技術(shù):“窗口化”技術(shù):重復使用此前激活過的神經(jīng)元,以此減少數(shù)據(jù)傳輸;“行列捆綁”技術(shù):針對閃存的數(shù)據(jù)特征,定制訪問數(shù)據(jù)塊的順序,從而增加從閃存讀取的數(shù)據(jù)塊大小。

研究人員表示,該方法“為在內(nèi)存有限的設備上有效推理 LLM 鋪平了道路”。與 CPU 中的傳統(tǒng)加載方法相比,該框架支持DRAM兩倍大小的模型,在CPU和GPU中推理速度可分別提升4-5倍、20-25倍。

更保守的訓練策略

與利用爬蟲技術(shù)獲取大模型訓練數(shù)據(jù)的方式不同,蘋果的策略偏向保守。這家公司希望與新聞出版機構(gòu)談判,尋求利用其內(nèi)容開發(fā)生成式 AI 系統(tǒng)。

據(jù)報道,蘋果公司近期已經(jīng)開始與主要新聞和出版機構(gòu)進行談判,提出了價值至少 5000 萬美元的多年期協(xié)議,以獲得新聞文章檔案的授權(quán)。這些機構(gòu)包括 Condé Nast(出版《Vogue》和《紐約客》)、NBC 新聞和 IAC。

不過,《紐約時報》稱,出版商可能要承擔蘋果公司使用其內(nèi)容產(chǎn)生的任何法律責任,而且蘋果公司對其新聞和生成式人工智能計劃“含糊其辭”?!都~約時報》還稱,蘋果公司高管一直在爭論如何獲取生成式人工智能產(chǎn)品所需的數(shù)據(jù)。由于注重隱私,蘋果公司一直不想從互聯(lián)網(wǎng)上獲取信息,因此與新聞出版商的交易,為其提供了一個另一種選擇方案。

蘋果保守的路線對于生成式AI的發(fā)展有利有弊,這一做法的好處是,通過在更有針對性的信息集訓練人工智能模型,蘋果最終可能會推出更可靠的產(chǎn)品;而弊端在于,蘋果大模型的推出時間會被延遲。

相較之下,OpenAI的做法則更激進。這家公司用于訓練chatgpt的數(shù)據(jù),大部分來源于網(wǎng)絡信息,但這會導致信息的不準確,甚至出現(xiàn)虛假信息。同時,OpenAI與新聞機構(gòu)的版權(quán)爭議,也是一個繞不開的問題。

比如,《紐約時報》在2023年12月就以“違法使用數(shù)據(jù)、抄襲”為由,起訴了OpenAI。《紐約時報》稱,OpenAI大模型幾乎能一字不差地輸出《紐約時報》的報道原文,而且這一輸出既沒有引用鏈接,還刪除了原文附加的返利鏈接,這直接影響了自身的流量和實際收入。

因此,《紐約時報》認為OpenAI和微軟應該為非法使用,需要對“價值數(shù)十億美元的法定和實際損失”負責。此外,兩家公司應該銷毀任何使用到《紐約時報》版權(quán)材料的模型和訓練數(shù)據(jù)。

當?shù)貢r間1月8日,OpenAI在官網(wǎng)發(fā)布一篇聲明,回擊了《紐約時報》最近提起的版權(quán)侵權(quán)訴訟。OpenAI稱,《紐約時報》的證據(jù)來自已經(jīng)在第三方網(wǎng)站流傳多年的文章:“他們似乎故意操縱了提示——要么指使模型反芻,要么從多次嘗試中精心挑選了示例”、“故意操縱我們的模型來反芻,不是對我們技術(shù)的適當使用,也違反了我們的使用條款。”

此前,OpenAI還表示,如果不使用受版權(quán)保護的內(nèi)容,就不可能訓練當今領先的人工智能模型。

事實上,對OpenAI 發(fā)起訴訟的不止有《紐約時報》 。1月5日,兩位作家在一項集體訴訟中起訴OpenAI和微軟,指控將他們的書用于訓練大模型;去年9月,包括《權(quán)力的游戲》作者在內(nèi)的數(shù)十位作家也提起了版權(quán)訴訟。

主動開源,全棧布局

與歷來封閉的iOS生態(tài)形成鮮明對比,蘋果的Ferret多模態(tài)大語言模型,是以開源方式發(fā)布的。這意味著,全球的工程師可以在 Ferret 的基礎上繼續(xù)發(fā)展,而 Apple 也可以從中獲益。

另一方面,為了讓開發(fā)者可以輕松構(gòu)建針對 Apple 芯片優(yōu)化的機器學習 (ML) 模型,蘋果還發(fā)布了名為MLX 的開發(fā)框架。它的與眾不同之處在于蘋果的靈活性,允許開發(fā)人員不受限制地選擇他們喜歡的編碼語言。

同時,MLX 可以利用蘋果 M1 和 M2 代芯片中存在的統(tǒng)一內(nèi)存系統(tǒng)。也就是說,開發(fā)者可以通過CPU 或 GPU對內(nèi)存中保存的陣列執(zhí)行操作,無需將數(shù)據(jù)從一個移動到另一個。雖然節(jié)省的時間只是以毫秒為單位,但每一次節(jié)省的時間累積起來,將讓模型迭代得更快。

英偉達高級科學家Jim Fan表示,這可能是蘋果公司迄今為止在開源人工智能方面的最大舉措。

由于蘋果公司在開源MIT 許可下發(fā)布了其 MLX 機器學習框架,Apple 芯片的一些優(yōu)勢也可以在計算量大的機器學習領域繼續(xù)保持。如同英偉達創(chuàng)建了自己的CUDA生態(tài),讓自家GPU得以大規(guī)模應用,蘋果的MLX開發(fā)框架M系列芯片加上基礎大模型底座,蘋果在大模型時代可能同時具備軟件加硬件的全棧自研體系。

據(jù)報道,蘋果公司還在開發(fā)自己的生成式人工智能模型,稱為“Ajax”,相當于OpenAI 的 GPT-n 系列的版本。擁有 2000 億個參數(shù)的 Apple 大語言模型 ( LLM ) ,將成為蘋果未來人工智能戰(zhàn)略的核心,它的性能可能與 OpenAI 最新的模型相當。

Ajax 將使蘋果能夠在其設備和應用程序生態(tài)系統(tǒng)中,支持新的 AI 集成和功能,而無需依賴Microsoft、OpenAI或Google等第三方模型提供商。

The Information 和蘋果分析師 Jeff Pu 表示,Apple在過去一年中一直在構(gòu)建 AI 服務器,并將在 2024 年加快步伐。一位分析師估計,蘋果僅 2023 年就在服務器上花費了約 6.2 億美元。隨著蘋果加大在人工智能服務器領域的投入,預計 2024 年將在人工智能服務器上花費超過 40 億美元。(本文首發(fā)鈦媒體App,作者 | 饒翔宇 編輯 | 鐘毅)

轉(zhuǎn)載請注明出處、作者和本文鏈接
聲明:文章內(nèi)容僅供參考、交流、學習、不構(gòu)成投資建議。
想和千萬鈦媒體用戶分享你的新奇觀點和發(fā)現(xiàn),點擊這里投稿 。創(chuàng)業(yè)或融資尋求報道,點擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評論
0 / 300

根據(jù)《網(wǎng)絡安全法》實名制要求,請綁定手機號后發(fā)表評論

登錄后輸入評論內(nèi)容
  • 蘋果做這玩意大概率是想上Siri的

    回復 2024.01.14 · via h5
  • 將大模型塞入設備可能會增加設備的生產(chǎn)成本,因為可能需要更強大的硬件支持,也就意味著又會漲價

    回復 2024.01.14 · via pc
  • 這太難為蘋果設備那點少得可憐的內(nèi)存了

    回復 2024.01.13 · via pc
  • 安卓中高端機普遍內(nèi)存容量比旗艦iPhone大一倍,Windows筆記本比Mac也是,這跑大模型可是相當吃虧

    回復 2024.01.13 · via iphone
  • 「百模大戰(zhàn)」已經(jīng)打響了,蘋果哪能掉隊啊

    回復 2024.01.13 · via h5

快報

更多

2026-03-31 22:59

靖因藥業(yè)遞表港交所

2026-03-31 22:54

Snap股價漲10%

2026-03-31 22:53

振江股份:擬定增募資不超10億元

2026-03-31 22:49

康美藥業(yè):擬1元轉(zhuǎn)讓全資子公司股權(quán)及相關(guān)資產(chǎn)

2026-03-31 22:49

伊朗稱將打擊中東地區(qū)與美高科技公司有關(guān)的企業(yè),包括蘋果、谷歌、特斯拉、微軟等公司

2026-03-31 22:39

LME倫銅漲1.0%,報12346.11美元/噸

2026-03-31 22:32

美股光通信、存儲板塊走高,閃迪漲超5.4%

2026-03-31 22:29

美股鋁業(yè)股續(xù)漲,世紀鋁業(yè)大漲超13%

2026-03-31 22:26

國家數(shù)據(jù)局:完善低空算力供給體系,加強低空領域算法研發(fā)

2026-03-31 22:20

國內(nèi)貴金屬期貨夜盤走高

2026-03-31 22:17

國家數(shù)據(jù)局:要加強低空數(shù)據(jù)資源體系建設,擴大公共數(shù)據(jù)資源供給

2026-03-31 22:14

奇瑞重啟 QQ 產(chǎn)品線:全新QQ3上市,起售價5.89萬元起

2026-03-31 22:11

TOP TOY國際集團有限公司遞表港交所

2026-03-31 22:07

焦點國際有限公司遞表港交所

2026-03-31 22:04

現(xiàn)貨白銀日內(nèi)漲幅擴大至5%,報73.64美元/盎司

2026-03-31 22:02

美國2月份的招聘人數(shù)降至480萬,創(chuàng)2020年4月來新低

2026-03-31 22:01

美國3月消費者信心指數(shù)91.8,預期87.9

2026-03-31 22:00

利弗莫爾中概股龍頭指數(shù)跌幅擴大至1.2%,文遠知行漲12%

2026-03-31 21:59

2025重慶公積金繳存超626億元,同比增4.28%

2026-03-31 21:59

美股高開高走,納斯達克指數(shù)漲超2%

5

掃描下載App