圖片來源@pixabay
當(dāng)下,多數(shù)云計(jì)算企業(yè)的生成式AI布局,往往局限于自家訓(xùn)練的基礎(chǔ)大模型,然后招攬生態(tài)伙伴以拓寬能力邊界。
這一舉措出于企業(yè)自身商業(yè)利益考量可以理解,但是對(duì)于客戶而言,卻并不能完全接受。顯然,能夠有更多模型的選擇對(duì)客戶而言非常重要。這一方面在于,大模型創(chuàng)新的天花板還遠(yuǎn)遠(yuǎn)沒有打開,不同模型提供商的能力自然也會(huì)有參差,另一方面也跟客戶需求場景相關(guān),沒有任何一個(gè)模型能滿足所有場景,那么針對(duì)不同的用例,客戶需要有多個(gè)選擇,可能還不是一兩家,會(huì)有多個(gè)模型同時(shí)參與,去彌補(bǔ)這種參差。
不是以O(shè)penAI為中心,也不是以其他任何一個(gè)模型為中心,而是以客戶為中心。過去,亞馬遜云科技90%以上的產(chǎn)品都是從客戶需求推導(dǎo)而來。亞馬遜云科技的生成式AI戰(zhàn)略也基本跟隨這種路徑。
當(dāng)然,亞馬遜云科技也構(gòu)建有自己的基礎(chǔ)大模型Amazon Titan,于2023年4月發(fā)布。這源自亞馬遜云科技自身在人工智能技術(shù)方面的積累,比如此前知名的語音助手Alexa、無人機(jī)Prime Air、無人零售Amazon Go等,就用到了大量語音、語義、視覺相關(guān)的機(jī)器學(xué)習(xí)技術(shù)。
亞馬遜云科技Amazon Bedrock總經(jīng)理Atul Deo指出,如果亞馬遜云科技沒有自己的一方模型,意味著必須完全依賴合作伙伴。而從頭開始構(gòu)建模型,其實(shí)也在給自己提供了“事必躬親”的問題解決思路。
為此,我們能看到一個(gè)蠻有意思的現(xiàn)象:由于Amazon Bedrock提供了企業(yè)構(gòu)建生成式AI應(yīng)用程序所需的一系列功能,能夠在實(shí)現(xiàn)簡化開發(fā)的同時(shí)確保隱私性和安全性。在Amazon Bedrock上,客戶能夠找到Amazon Titan,也能夠找到當(dāng)前業(yè)內(nèi)主流的大模型版本,包括Anthropic、Stability AI、AI21 Labs、Meta、Cohere、Mixtral的模型……這個(gè)名單仍在快速擴(kuò)充。
北京時(shí)間4月23日晚間,亞馬遜云科技公布了Amazon Bedrock的多項(xiàng)功能更新,這些能力整體上為客戶提升了開發(fā)生成式AI應(yīng)用的效率。包括:
1、全新專有模型導(dǎo)入功能推出預(yù)覽版:可將客戶的定制模型(包括使用Amazon SageMaker機(jī)器學(xué)習(xí)平臺(tái)或其他工具開發(fā)的模型)集成至Amazon Bedrock,以完全托管的API形式進(jìn)行訪問,減少運(yùn)營成本并加速應(yīng)用程序的開發(fā)。Amazon Bedrock專有模型導(dǎo)入功能現(xiàn)已推出預(yù)覽版并支持三種受歡迎的開放模型架構(gòu):Flan-T5、Llama和Mistral,并計(jì)劃未來支持更多模型。
2、模型評(píng)估功能正式可用:為客戶評(píng)估、比較和選擇適合其應(yīng)用程序的最佳模型,將評(píng)估模型的時(shí)間從幾個(gè)星期縮短到幾個(gè)小時(shí),促使客戶應(yīng)用創(chuàng)新并改善用戶體驗(yàn)。通過選擇預(yù)定義的評(píng)估標(biāo)準(zhǔn)(如準(zhǔn)確性和魯棒性)并上傳自有數(shù)據(jù)集/提示詞庫,或者從內(nèi)置的、公開可用的資源中進(jìn)行選擇。對(duì)于主觀標(biāo)準(zhǔn)或需要細(xì)致判斷的內(nèi)容,Amazon Bedrock將人工審核融入工作流程中,以根據(jù)特定應(yīng)用場景的指標(biāo)(如相關(guān)性、風(fēng)格和品牌聲音)對(duì)模型進(jìn)行評(píng)估。評(píng)估后還會(huì)提供評(píng)估報(bào)告,以為更多模型使用者提供參考。
3、Guardrails安全功能正式可用:在基礎(chǔ)模型的原生能力之上提供安全保護(hù),能夠阻止高達(dá)85%的有害內(nèi)容。允許客戶在單一服務(wù)中同時(shí)擁有內(nèi)置和定制的防護(hù)機(jī)制,并可與Amazon Bedrock中的所有大語言模型以及經(jīng)過微調(diào)的模型一起使用??蓪?shí)施防護(hù)措施,去除個(gè)人信息和敏感信息、褻瀆語言、特定詞匯并屏蔽有害內(nèi)容。
功能更新之外,亞馬遜云科技此次還在Amazon Bedrock上提供了一系列新模型,包括正式可用的Amazon Titan Image Generator圖像生成模型、Meta Llama 3(8B和70B),以及Amazon Titan Text Embeddings V2預(yù)覽版,Cohere的Command R和Command R+三款模型也即將推出。
其中,Amazon Titan Text Embeddings V2預(yù)覽版,針對(duì)使用RAG檢索增強(qiáng)生成的應(yīng)用場景進(jìn)行了優(yōu)化,非常適合如信息檢索、問答聊天機(jī)器人和個(gè)性化推薦等任務(wù)。許多企業(yè)采用RAG技術(shù),通過連接到知識(shí)源以增強(qiáng)基礎(chǔ)模型的生成結(jié)果,但問題是運(yùn)行這些操作可能會(huì)消耗大量計(jì)算和存儲(chǔ)資源。Amazon Titan Text Embeddings V2在降低了存儲(chǔ)和計(jì)算成本的同時(shí),保持了使用RAG檢索結(jié)果的準(zhǔn)確性。
生成式AI不僅僅是大模型,同樣也需要加速芯片、數(shù)據(jù)庫、數(shù)據(jù)分析、數(shù)據(jù)安全服務(wù)等服務(wù)做支撐。從底層的加速層如加速芯片、存儲(chǔ)優(yōu)化,到中間層模型構(gòu)建工具和服務(wù),再到最上層的生成式AI相關(guān)應(yīng)用,能夠看到,亞馬遜云科技試圖為客戶提供構(gòu)建生成式AI所需的端到端技術(shù)棧。
在此次發(fā)布前夕,Atul Deo與鈦媒體進(jìn)行獨(dú)家交流,Atul分享了對(duì)生成式AI的價(jià)值判斷,技術(shù)方法論,以及Amazon Bedrock助力客戶成功等看法。Atul目前負(fù)責(zé)Amazon Bedrock的產(chǎn)品管理和工程工作。在亞馬遜云科技機(jī)器學(xué)習(xí)團(tuán)隊(duì)期間,Atul負(fù)責(zé)推出和發(fā)展了多項(xiàng)云服務(wù),包括Amazon Q、Amazon CodeWhisperer、Amazon Transcribe和Amazon Connect的Contact Lens。
![]()
觀點(diǎn)摘錄:
1.“數(shù)據(jù)衛(wèi)生這項(xiàng)工作非常具有挑戰(zhàn)性”
2.“(改變的)一切都取決于客戶以及我們?cè)噲D解決的具體問題”
3.我們無法徹底消除幻覺,但會(huì)有越來越多的前沿研究涌現(xiàn)
4.“過早地指出哪些模型被廣泛應(yīng)用還為時(shí)尚早”
5.“技術(shù)所帶來的顛覆性、對(duì)客戶體驗(yàn)的改變及其可能性都是真實(shí)存在”
鈦媒體:大公司和小而精的團(tuán)隊(duì),在當(dāng)下實(shí)現(xiàn)AI技術(shù)創(chuàng)新、產(chǎn)業(yè)賦能方面,會(huì)有哪些不同優(yōu)勢(shì)?
Atul:就針對(duì)客戶應(yīng)用部署而言,我不認(rèn)為大公司和小企業(yè)之間會(huì)存在哪些明顯差異,它們之間有很多共通之處。我們都想為大公司嘗試不同模式。當(dāng)前Data Hygiene(數(shù)據(jù)衛(wèi)生)這項(xiàng)工作非常具有挑戰(zhàn)性。當(dāng)你為較小的公司部署應(yīng)用時(shí),管理并確保模型訓(xùn)練所需的私域數(shù)據(jù)實(shí)現(xiàn)高質(zhì)量和一致性相對(duì)容易。但對(duì)于規(guī)模較大的公司,有大量差異化數(shù)據(jù),且數(shù)據(jù)更加分散,管理數(shù)據(jù)會(huì)更具挑戰(zhàn)性。另一方面,初創(chuàng)企業(yè)可以通過承擔(dān)更多的風(fēng)險(xiǎn)更快地行動(dòng),它們沒有像大型客戶這樣的現(xiàn)有客戶群,可能會(huì)出錯(cuò),也會(huì)在試錯(cuò)中快速迭代創(chuàng)新。
鈦媒體:AWS想要做GenAI這件事情,最終希望解決什么問題?
Atul:我們正在積極探索新的可能性。無論客戶希望自主構(gòu)建模型,還是希望對(duì)現(xiàn)有模型進(jìn)行深度定制,我們希望構(gòu)建一套生成式AI堆棧,讓客戶使用到豐富且一流的工具,除此之外,還有Amazon SageMaker,基于NVIDIA提供的豐富實(shí)例類型,我們還積極研發(fā)定制芯片,涵蓋訓(xùn)練和推理兩大領(lǐng)域,以滿足更精細(xì)化的需求。
通過這一系列從底層到中間層的創(chuàng)新,我們的目標(biāo)是:讓企業(yè)內(nèi)的任何開發(fā)人員都能夠自由構(gòu)建生成式AI應(yīng)用,而無需關(guān)注復(fù)雜的機(jī)器學(xué)習(xí)或底層基礎(chǔ)設(shè)施。我們堅(jiān)信,所提供的工具將達(dá)到行業(yè)最高水準(zhǔn),幫助他們實(shí)現(xiàn)應(yīng)用的創(chuàng)新突破。
目前,我們推出了Amazon Q business和Amazon Q developer兩個(gè)版本。Amazon Q business旨在為企業(yè)中的每位員工配備一位專業(yè)顧問,確保他們能夠快速獲得解答并高效完成任務(wù);而Amazon Q developer則專注于提升開發(fā)人員的工作效率,為之提供即時(shí)的解答,以順利完成手頭的具體工作。這正是Amazon Q的最終目標(biāo),也是我們不懈追求的方向。
鈦媒體:對(duì)AWS自身的產(chǎn)品和業(yè)務(wù)結(jié)構(gòu)真正意義上帶來改變,可能需要多久?如何在這個(gè)領(lǐng)域建立我們的領(lǐng)導(dǎo)力?
Atul:實(shí)際上,一切都取決于客戶以及我們?cè)噲D解決的具體問題。我們已經(jīng)看到數(shù)以萬計(jì)的客戶正在使用SageMaker來改變其客戶體驗(yàn)。這些變化有的已經(jīng)發(fā)生,有的則需要一些時(shí)間。因此,對(duì)于何時(shí)能夠期待顯著變化,確實(shí)沒有一個(gè)固定的答案。
舉例來說,紐約證券交易所正在利用Bedrock來分析處理眾多監(jiān)管文件,并將復(fù)雜的法規(guī)內(nèi)容轉(zhuǎn)化為易于理解的語言,這一舉措將對(duì)最終用戶產(chǎn)生深遠(yuǎn)影響;同時(shí),電子健康記錄技術(shù)供應(yīng)商N(yùn)etsmart通過應(yīng)用相關(guān)技術(shù),成功將患者健康管理記錄的時(shí)間縮短了50%,這無疑為醫(yī)生騰出了更多時(shí)間,使他們能夠照顧到更多的病人。
今天我們已經(jīng)看到了對(duì)最終用戶的一些積極影響,但我相信這仍然是一個(gè)需要時(shí)間來逐步發(fā)展和普及的過程。然而,這一進(jìn)程的進(jìn)展速度是相對(duì)較快的,已經(jīng)形成了不可小覷的勢(shì)頭。因此,我無法確切預(yù)測是在今年年底還是明年,生成式人工智能將變得非常普遍。不過,可以肯定的是,它正在逐步改變我們的世界,為我們帶來更多的便利和可能性。
鈦媒體:像RAG用于解決幻覺問題,但有些論文里提了幻覺僅靠RAG也無法解決,在企業(yè)級(jí)應(yīng)用中,如何測評(píng)幻覺存在程度,以及在具體應(yīng)用時(shí)的影響?
Atul:盡管我們無法徹底消除這個(gè)問題,但隨著時(shí)間的推移,我相信會(huì)有越來越多的前沿研究涌現(xiàn)。你將看到客戶在處理幻覺方面取得了更多的進(jìn)步與改進(jìn)。我可以明確地告訴你,這個(gè)問題雖然無法完全解決,但作為我們行動(dòng)的一部分,它確實(shí)有助于減少其影響,只是無法徹底消除。隨著時(shí)間的推移,無論是模型內(nèi)部還是外部,都將出現(xiàn)創(chuàng)新,從而幫助客戶更好地應(yīng)對(duì)這種模式。
鈦媒體:模型間的協(xié)作問題,客戶在多個(gè)模型使用時(shí),AWS目前有哪些比較好的解決思路?
Atul:對(duì)于客戶而言,這個(gè)問題顯而易見。因此,我們特別推出了一項(xiàng)名為模型評(píng)估的功能,該功能已于去年12月發(fā)布,并計(jì)劃于明天全面上線。從本質(zhì)上來說,這一功能旨在幫助客戶在給定的一組提示上比較不同模型的性能,以便它們能夠選擇更符合自身特定用例的模型。
要實(shí)現(xiàn)這一目標(biāo),客戶有三種方式可供選擇。首先,他們可以在控制臺(tái)中根據(jù)給定的提示比較不同模型的性能;其次,客戶可以利用自動(dòng)化評(píng)估功能,在不同數(shù)據(jù)集上運(yùn)行不同的模型或使用標(biāo)準(zhǔn)行業(yè)數(shù)據(jù)集,從而查看哪些模型表現(xiàn)優(yōu)異;最后,客戶還可以借助公司內(nèi)部的專業(yè)團(tuán)隊(duì),以不同的方式評(píng)估模型,確定哪種模型符合他們的期望。最終,客戶將從Bedrock獲得一份詳盡的報(bào)告,根據(jù)他們?cè)O(shè)定的標(biāo)準(zhǔn),報(bào)告將展示模型的表現(xiàn)以及如何決定哪些模型對(duì)其有意義。
鈦媒體:AWS在AI倫理方面的舉措有哪些?
Atul:我們正與多個(gè)政府組織進(jìn)行廣泛合作。以我們推出的Titan圖像生成器為例,該工具具備水印功能,能夠添加不可見的水印,幫助客戶判斷生成的圖像是否由人工智能生成。除此之外,我們還與一些列其他組織合作,確保以負(fù)責(zé)任的方式使用人工智能。
鈦媒體:AWS在自研芯片方面的經(jīng)驗(yàn)是什么?
Atul:多年來,我們一直在芯片領(lǐng)域進(jìn)行投資,且早在2015年收購了芯片設(shè)計(jì)公司Annapurna Labs。盡管我們最初的重點(diǎn)是面向虛擬化和通用計(jì)算芯片,但隨后我們專注于開發(fā)專門用于機(jī)器學(xué)習(xí)的AI芯片。例如,用于人工智能訓(xùn)練和推理的兩款專用芯片Amazon Trainium和Amazon Inferentia。
得益于多年來對(duì)芯片開發(fā)的持續(xù)投資,我們有了更多機(jī)會(huì)對(duì)這些芯片進(jìn)行迭代和改進(jìn),以確保其性能和穩(wěn)定性。這些改進(jìn)恰逢其時(shí),因?yàn)樯墒饺斯ぶ悄軐?duì)計(jì)算能力的需求日益增長。
鈦媒體:Bedrock上有很多模型,你是否觀察到哪個(gè)模型最受客戶歡迎,比如Meta和Anthropic?
Atul:目前,我們尚不會(huì)透露各模型提供商的具體性能表現(xiàn)。但我想說的是,這些模型受到了廣大用戶的青睞。這主要是因?yàn)槟P偷倪x擇取決于具體的應(yīng)用場景,人們會(huì)根據(jù)不同的需求來選用不同的模型。因此,過早地指出哪些模型被廣泛應(yīng)用還為時(shí)尚早。(本文首發(fā)于鈦媒體APP, 作者|楊麗,編輯 | 蓋虹達(dá))
快報(bào)
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論
【繼續(xù)思考】AWS構(gòu)建的大模型基礎(chǔ)設(shè)施優(yōu)勢(shì)已經(jīng)凸顯,觀點(diǎn)摘錄4還是提到“過早指出哪些模型被廣泛應(yīng)用還為時(shí)尚早”,是因?yàn)榕艿臉I(yè)務(wù)場景還不夠多,即數(shù)據(jù)量不夠做分析,是嗎?
【內(nèi)容提煉】 AWS公布了Amazon Bedrock多項(xiàng)功能更新,包括: (1) 全新專有模型導(dǎo)入功能(預(yù)覽版) (2) 模型評(píng)估功能(正式版,正式可用);效果:將模型評(píng)估時(shí)間從幾周縮短到幾小時(shí) (3) Guardrails安全功能正式可用;效果:能夠阻85%的有害內(nèi)容 生成式AI不僅是大模型,同時(shí)需要加速芯片、數(shù)據(jù)庫、數(shù)據(jù)分析和安全等服務(wù)做支撐。從底層的加速曾如加速芯片、存儲(chǔ)優(yōu)化,到中間層模型構(gòu)建工具和服務(wù),再到最上層的生成式AI應(yīng)用,能夠看到,AWS試圖為客戶提供構(gòu)建生成式AI所需的端到端技術(shù)棧。 【繼續(xù)思考】
過去,AWS九成以上產(chǎn)品都是由客戶需求推導(dǎo)而來?,F(xiàn)在,生成式AI也遵循這條路徑。希望有機(jī)會(huì),能通過具體的案例,講講具體是怎么由客戶需求推導(dǎo)而來的。
大模型也還是在初級(jí)階段,需要完善
如同改革之初也是摸著石頭過河
大模型客戶需要有多個(gè)選擇是正常的訴求
現(xiàn)在的大模型是早期的,需要彌補(bǔ)完善
總有個(gè)過程,新車還有個(gè)磨合期呢