圖片來源@pixabay

當(dāng)下,多數(shù)云計(jì)算企業(yè)的生成式AI布局,往往局限于自家訓(xùn)練的基礎(chǔ)大模型,然后招攬生態(tài)伙伴以拓寬能力邊界。

這一舉措出于企業(yè)自身商業(yè)利益考量可以理解,但是對(duì)于客戶而言,卻并不能完全接受。顯然,能夠有更多模型的選擇對(duì)客戶而言非常重要。這一方面在于,大模型創(chuàng)新的天花板還遠(yuǎn)遠(yuǎn)沒有打開,不同模型提供商的能力自然也會(huì)有參差,另一方面也跟客戶需求場景相關(guān),沒有任何一個(gè)模型能滿足所有場景,那么針對(duì)不同的用例,客戶需要有多個(gè)選擇,可能還不是一兩家,會(huì)有多個(gè)模型同時(shí)參與,去彌補(bǔ)這種參差。

不是以O(shè)penAI為中心,也不是以其他任何一個(gè)模型為中心,而是以客戶為中心。過去,亞馬遜云科技90%以上的產(chǎn)品都是從客戶需求推導(dǎo)而來。亞馬遜云科技的生成式AI戰(zhàn)略也基本跟隨這種路徑。

當(dāng)然,亞馬遜云科技也構(gòu)建有自己的基礎(chǔ)大模型Amazon Titan,于2023年4月發(fā)布。這源自亞馬遜云科技自身在人工智能技術(shù)方面的積累,比如此前知名的語音助手Alexa、無人機(jī)Prime Air、無人零售Amazon Go等,就用到了大量語音、語義、視覺相關(guān)的機(jī)器學(xué)習(xí)技術(shù)。

亞馬遜云科技Amazon Bedrock總經(jīng)理Atul Deo指出,如果亞馬遜云科技沒有自己的一方模型,意味著必須完全依賴合作伙伴。而從頭開始構(gòu)建模型,其實(shí)也在給自己提供了“事必躬親”的問題解決思路。

為此,我們能看到一個(gè)蠻有意思的現(xiàn)象:由于Amazon Bedrock提供了企業(yè)構(gòu)建生成式AI應(yīng)用程序所需的一系列功能,能夠在實(shí)現(xiàn)簡化開發(fā)的同時(shí)確保隱私性和安全性。在Amazon Bedrock上,客戶能夠找到Amazon Titan,也能夠找到當(dāng)前業(yè)內(nèi)主流的大模型版本,包括Anthropic、Stability AI、AI21 Labs、Meta、Cohere、Mixtral的模型……這個(gè)名單仍在快速擴(kuò)充。

北京時(shí)間4月23日晚間,亞馬遜云科技公布了Amazon Bedrock的多項(xiàng)功能更新,這些能力整體上為客戶提升了開發(fā)生成式AI應(yīng)用的效率。包括:

1、全新專有模型導(dǎo)入功能推出預(yù)覽版:可將客戶的定制模型(包括使用Amazon SageMaker機(jī)器學(xué)習(xí)平臺(tái)或其他工具開發(fā)的模型)集成至Amazon Bedrock,以完全托管的API形式進(jìn)行訪問,減少運(yùn)營成本并加速應(yīng)用程序的開發(fā)。Amazon Bedrock專有模型導(dǎo)入功能現(xiàn)已推出預(yù)覽版并支持三種受歡迎的開放模型架構(gòu):Flan-T5、Llama和Mistral,并計(jì)劃未來支持更多模型。

2、模型評(píng)估功能正式可用:為客戶評(píng)估、比較和選擇適合其應(yīng)用程序的最佳模型,將評(píng)估模型的時(shí)間從幾個(gè)星期縮短到幾個(gè)小時(shí),促使客戶應(yīng)用創(chuàng)新并改善用戶體驗(yàn)。通過選擇預(yù)定義的評(píng)估標(biāo)準(zhǔn)(如準(zhǔn)確性和魯棒性)并上傳自有數(shù)據(jù)集/提示詞庫,或者從內(nèi)置的、公開可用的資源中進(jìn)行選擇。對(duì)于主觀標(biāo)準(zhǔn)或需要細(xì)致判斷的內(nèi)容,Amazon Bedrock將人工審核融入工作流程中,以根據(jù)特定應(yīng)用場景的指標(biāo)(如相關(guān)性、風(fēng)格和品牌聲音)對(duì)模型進(jìn)行評(píng)估。評(píng)估后還會(huì)提供評(píng)估報(bào)告,以為更多模型使用者提供參考。

3、Guardrails安全功能正式可用:在基礎(chǔ)模型的原生能力之上提供安全保護(hù),能夠阻止高達(dá)85%的有害內(nèi)容。允許客戶在單一服務(wù)中同時(shí)擁有內(nèi)置和定制的防護(hù)機(jī)制,并可與Amazon Bedrock中的所有大語言模型以及經(jīng)過微調(diào)的模型一起使用??蓪?shí)施防護(hù)措施,去除個(gè)人信息和敏感信息、褻瀆語言、特定詞匯并屏蔽有害內(nèi)容。

功能更新之外,亞馬遜云科技此次還在Amazon Bedrock上提供了一系列新模型,包括正式可用的Amazon Titan Image Generator圖像生成模型、Meta Llama 3(8B和70B),以及Amazon Titan Text Embeddings V2預(yù)覽版,Cohere的Command R和Command R+三款模型也即將推出。

其中,Amazon Titan Text Embeddings V2預(yù)覽版,針對(duì)使用RAG檢索增強(qiáng)生成的應(yīng)用場景進(jìn)行了優(yōu)化,非常適合如信息檢索、問答聊天機(jī)器人和個(gè)性化推薦等任務(wù)。許多企業(yè)采用RAG技術(shù),通過連接到知識(shí)源以增強(qiáng)基礎(chǔ)模型的生成結(jié)果,但問題是運(yùn)行這些操作可能會(huì)消耗大量計(jì)算和存儲(chǔ)資源。Amazon Titan Text Embeddings V2在降低了存儲(chǔ)和計(jì)算成本的同時(shí),保持了使用RAG檢索結(jié)果的準(zhǔn)確性。

生成式AI不僅僅是大模型,同樣也需要加速芯片、數(shù)據(jù)庫、數(shù)據(jù)分析、數(shù)據(jù)安全服務(wù)等服務(wù)做支撐。從底層的加速層如加速芯片、存儲(chǔ)優(yōu)化,到中間層模型構(gòu)建工具和服務(wù),再到最上層的生成式AI相關(guān)應(yīng)用,能夠看到,亞馬遜云科技試圖為客戶提供構(gòu)建生成式AI所需的端到端技術(shù)棧。

在此次發(fā)布前夕,Atul Deo與鈦媒體進(jìn)行獨(dú)家交流,Atul分享了對(duì)生成式AI的價(jià)值判斷,技術(shù)方法論,以及Amazon Bedrock助力客戶成功等看法。Atul目前負(fù)責(zé)Amazon Bedrock的產(chǎn)品管理和工程工作。在亞馬遜云科技機(jī)器學(xué)習(xí)團(tuán)隊(duì)期間,Atul負(fù)責(zé)推出和發(fā)展了多項(xiàng)云服務(wù),包括Amazon Q、Amazon CodeWhisperer、Amazon Transcribe和Amazon Connect的Contact Lens。

觀點(diǎn)摘錄:

1.“數(shù)據(jù)衛(wèi)生這項(xiàng)工作非常具有挑戰(zhàn)性”

2.“(改變的)一切都取決于客戶以及我們?cè)噲D解決的具體問題”

3.我們無法徹底消除幻覺,但會(huì)有越來越多的前沿研究涌現(xiàn)

4.“過早地指出哪些模型被廣泛應(yīng)用還為時(shí)尚早”

5.“技術(shù)所帶來的顛覆性、對(duì)客戶體驗(yàn)的改變及其可能性都是真實(shí)存在”

以下是對(duì)話實(shí)錄,經(jīng)鈦媒體編輯整理。

鈦媒體:大公司和小而精的團(tuán)隊(duì),在當(dāng)下實(shí)現(xiàn)AI技術(shù)創(chuàng)新、產(chǎn)業(yè)賦能方面,會(huì)有哪些不同優(yōu)勢(shì)?

Atul:就針對(duì)客戶應(yīng)用部署而言,我不認(rèn)為大公司和小企業(yè)之間會(huì)存在哪些明顯差異,它們之間有很多共通之處。我們都想為大公司嘗試不同模式。當(dāng)前Data Hygiene(數(shù)據(jù)衛(wèi)生)這項(xiàng)工作非常具有挑戰(zhàn)性。當(dāng)你為較小的公司部署應(yīng)用時(shí),管理并確保模型訓(xùn)練所需的私域數(shù)據(jù)實(shí)現(xiàn)高質(zhì)量和一致性相對(duì)容易。但對(duì)于規(guī)模較大的公司,有大量差異化數(shù)據(jù),且數(shù)據(jù)更加分散,管理數(shù)據(jù)會(huì)更具挑戰(zhàn)性。另一方面,初創(chuàng)企業(yè)可以通過承擔(dān)更多的風(fēng)險(xiǎn)更快地行動(dòng),它們沒有像大型客戶這樣的現(xiàn)有客戶群,可能會(huì)出錯(cuò),也會(huì)在試錯(cuò)中快速迭代創(chuàng)新。

鈦媒體:AWS想要做GenAI這件事情,最終希望解決什么問題?

Atul:我們正在積極探索新的可能性。無論客戶希望自主構(gòu)建模型,還是希望對(duì)現(xiàn)有模型進(jìn)行深度定制,我們希望構(gòu)建一套生成式AI堆棧,讓客戶使用到豐富且一流的工具,除此之外,還有Amazon SageMaker,基于NVIDIA提供的豐富實(shí)例類型,我們還積極研發(fā)定制芯片,涵蓋訓(xùn)練和推理兩大領(lǐng)域,以滿足更精細(xì)化的需求。

通過這一系列從底層到中間層的創(chuàng)新,我們的目標(biāo)是:讓企業(yè)內(nèi)的任何開發(fā)人員都能夠自由構(gòu)建生成式AI應(yīng)用,而無需關(guān)注復(fù)雜的機(jī)器學(xué)習(xí)或底層基礎(chǔ)設(shè)施。我們堅(jiān)信,所提供的工具將達(dá)到行業(yè)最高水準(zhǔn),幫助他們實(shí)現(xiàn)應(yīng)用的創(chuàng)新突破。

目前,我們推出了Amazon Q business和Amazon Q developer兩個(gè)版本。Amazon Q business旨在為企業(yè)中的每位員工配備一位專業(yè)顧問,確保他們能夠快速獲得解答并高效完成任務(wù);而Amazon Q developer則專注于提升開發(fā)人員的工作效率,為之提供即時(shí)的解答,以順利完成手頭的具體工作。這正是Amazon Q的最終目標(biāo),也是我們不懈追求的方向。

鈦媒體:對(duì)AWS自身的產(chǎn)品和業(yè)務(wù)結(jié)構(gòu)真正意義上帶來改變,可能需要多久?如何在這個(gè)領(lǐng)域建立我們的領(lǐng)導(dǎo)力?

Atul:實(shí)際上,一切都取決于客戶以及我們?cè)噲D解決的具體問題。我們已經(jīng)看到數(shù)以萬計(jì)的客戶正在使用SageMaker來改變其客戶體驗(yàn)。這些變化有的已經(jīng)發(fā)生,有的則需要一些時(shí)間。因此,對(duì)于何時(shí)能夠期待顯著變化,確實(shí)沒有一個(gè)固定的答案。

舉例來說,紐約證券交易所正在利用Bedrock來分析處理眾多監(jiān)管文件,并將復(fù)雜的法規(guī)內(nèi)容轉(zhuǎn)化為易于理解的語言,這一舉措將對(duì)最終用戶產(chǎn)生深遠(yuǎn)影響;同時(shí),電子健康記錄技術(shù)供應(yīng)商N(yùn)etsmart通過應(yīng)用相關(guān)技術(shù),成功將患者健康管理記錄的時(shí)間縮短了50%,這無疑為醫(yī)生騰出了更多時(shí)間,使他們能夠照顧到更多的病人。

今天我們已經(jīng)看到了對(duì)最終用戶的一些積極影響,但我相信這仍然是一個(gè)需要時(shí)間來逐步發(fā)展和普及的過程。然而,這一進(jìn)程的進(jìn)展速度是相對(duì)較快的,已經(jīng)形成了不可小覷的勢(shì)頭。因此,我無法確切預(yù)測是在今年年底還是明年,生成式人工智能將變得非常普遍。不過,可以肯定的是,它正在逐步改變我們的世界,為我們帶來更多的便利和可能性。

鈦媒體:像RAG用于解決幻覺問題,但有些論文里提了幻覺僅靠RAG也無法解決,在企業(yè)級(jí)應(yīng)用中,如何測評(píng)幻覺存在程度,以及在具體應(yīng)用時(shí)的影響?

Atul:盡管我們無法徹底消除這個(gè)問題,但隨著時(shí)間的推移,我相信會(huì)有越來越多的前沿研究涌現(xiàn)。你將看到客戶在處理幻覺方面取得了更多的進(jìn)步與改進(jìn)。我可以明確地告訴你,這個(gè)問題雖然無法完全解決,但作為我們行動(dòng)的一部分,它確實(shí)有助于減少其影響,只是無法徹底消除。隨著時(shí)間的推移,無論是模型內(nèi)部還是外部,都將出現(xiàn)創(chuàng)新,從而幫助客戶更好地應(yīng)對(duì)這種模式。

鈦媒體:模型間的協(xié)作問題,客戶在多個(gè)模型使用時(shí),AWS目前有哪些比較好的解決思路?

Atul:對(duì)于客戶而言,這個(gè)問題顯而易見。因此,我們特別推出了一項(xiàng)名為模型評(píng)估的功能,該功能已于去年12月發(fā)布,并計(jì)劃于明天全面上線。從本質(zhì)上來說,這一功能旨在幫助客戶在給定的一組提示上比較不同模型的性能,以便它們能夠選擇更符合自身特定用例的模型。

要實(shí)現(xiàn)這一目標(biāo),客戶有三種方式可供選擇。首先,他們可以在控制臺(tái)中根據(jù)給定的提示比較不同模型的性能;其次,客戶可以利用自動(dòng)化評(píng)估功能,在不同數(shù)據(jù)集上運(yùn)行不同的模型或使用標(biāo)準(zhǔn)行業(yè)數(shù)據(jù)集,從而查看哪些模型表現(xiàn)優(yōu)異;最后,客戶還可以借助公司內(nèi)部的專業(yè)團(tuán)隊(duì),以不同的方式評(píng)估模型,確定哪種模型符合他們的期望。最終,客戶將從Bedrock獲得一份詳盡的報(bào)告,根據(jù)他們?cè)O(shè)定的標(biāo)準(zhǔn),報(bào)告將展示模型的表現(xiàn)以及如何決定哪些模型對(duì)其有意義。

鈦媒體:AWS在AI倫理方面的舉措有哪些?

Atul:我們正與多個(gè)政府組織進(jìn)行廣泛合作。以我們推出的Titan圖像生成器為例,該工具具備水印功能,能夠添加不可見的水印,幫助客戶判斷生成的圖像是否由人工智能生成。除此之外,我們還與一些列其他組織合作,確保以負(fù)責(zé)任的方式使用人工智能。

鈦媒體:AWS在自研芯片方面的經(jīng)驗(yàn)是什么?

Atul:多年來,我們一直在芯片領(lǐng)域進(jìn)行投資,且早在2015年收購了芯片設(shè)計(jì)公司Annapurna Labs。盡管我們最初的重點(diǎn)是面向虛擬化和通用計(jì)算芯片,但隨后我們專注于開發(fā)專門用于機(jī)器學(xué)習(xí)的AI芯片。例如,用于人工智能訓(xùn)練和推理的兩款專用芯片Amazon Trainium和Amazon Inferentia。

得益于多年來對(duì)芯片開發(fā)的持續(xù)投資,我們有了更多機(jī)會(huì)對(duì)這些芯片進(jìn)行迭代和改進(jìn),以確保其性能和穩(wěn)定性。這些改進(jìn)恰逢其時(shí),因?yàn)樯墒饺斯ぶ悄軐?duì)計(jì)算能力的需求日益增長。

鈦媒體:Bedrock上有很多模型,你是否觀察到哪個(gè)模型最受客戶歡迎,比如Meta和Anthropic?

Atul:目前,我們尚不會(huì)透露各模型提供商的具體性能表現(xiàn)。但我想說的是,這些模型受到了廣大用戶的青睞。這主要是因?yàn)槟P偷倪x擇取決于具體的應(yīng)用場景,人們會(huì)根據(jù)不同的需求來選用不同的模型。因此,過早地指出哪些模型被廣泛應(yīng)用還為時(shí)尚早。(本文首發(fā)于鈦媒體APP, 作者|楊麗,編輯 | 蓋虹達(dá))  

本文系作者 TechHorizon 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請(qǐng)注明出處、作者和本文鏈接。
本內(nèi)容來源于鈦媒體鈦度號(hào),文章內(nèi)容僅供參考、交流、學(xué)習(xí),不構(gòu)成投資建議。
想和千萬鈦媒體用戶分享你的新奇觀點(diǎn)和發(fā)現(xiàn),點(diǎn)擊這里投稿 。創(chuàng)業(yè)或融資尋求報(bào)道,點(diǎn)擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評(píng)論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論

請(qǐng) 登錄后輸入評(píng)論內(nèi)容
  • 【繼續(xù)思考】AWS構(gòu)建的大模型基礎(chǔ)設(shè)施優(yōu)勢(shì)已經(jīng)凸顯,觀點(diǎn)摘錄4還是提到“過早指出哪些模型被廣泛應(yīng)用還為時(shí)尚早”,是因?yàn)榕艿臉I(yè)務(wù)場景還不夠多,即數(shù)據(jù)量不夠做分析,是嗎?

    回復(fù) 2024.04.29 · via pc
  • 【內(nèi)容提煉】 AWS公布了Amazon Bedrock多項(xiàng)功能更新,包括: (1) 全新專有模型導(dǎo)入功能(預(yù)覽版) (2) 模型評(píng)估功能(正式版,正式可用);效果:將模型評(píng)估時(shí)間從幾周縮短到幾小時(shí) (3) Guardrails安全功能正式可用;效果:能夠阻85%的有害內(nèi)容 生成式AI不僅是大模型,同時(shí)需要加速芯片、數(shù)據(jù)庫、數(shù)據(jù)分析和安全等服務(wù)做支撐。從底層的加速曾如加速芯片、存儲(chǔ)優(yōu)化,到中間層模型構(gòu)建工具和服務(wù),再到最上層的生成式AI應(yīng)用,能夠看到,AWS試圖為客戶提供構(gòu)建生成式AI所需的端到端技術(shù)棧。 【繼續(xù)思考】

    回復(fù) 2024.04.29 · via pc
  • 過去,AWS九成以上產(chǎn)品都是由客戶需求推導(dǎo)而來?,F(xiàn)在,生成式AI也遵循這條路徑。希望有機(jī)會(huì),能通過具體的案例,講講具體是怎么由客戶需求推導(dǎo)而來的。

    回復(fù) 2024.04.28 · via pc
  • 大模型也還是在初級(jí)階段,需要完善

    回復(fù) 2024.04.26 · via iphone
  • 如同改革之初也是摸著石頭過河

    回復(fù) 2024.04.26 · via iphone
  • 大模型客戶需要有多個(gè)選擇是正常的訴求

    回復(fù) 2024.04.26 · via iphone
  • 現(xiàn)在的大模型是早期的,需要彌補(bǔ)完善

    回復(fù) 2024.04.26 · via android
  • 總有個(gè)過程,新車還有個(gè)磨合期呢

    回復(fù) 2024.04.25 · via iphone

快報(bào)

更多

18:25

弘信電子:控股子公司燧弘華創(chuàng)擬引入2億元戰(zhàn)略投資

18:24

沈陽:3月15日起夫妻雙方繳存住房公積金的,最高貸款額度由85萬元調(diào)整為150萬元

18:15

美國國債跌勢(shì)擴(kuò)大,2年期收益率上漲10個(gè)基點(diǎn)至3.89%

18:14

美股期指跌幅擴(kuò)大,道瓊斯指數(shù)期貨跌0.61%

18:10

海上絲路指數(shù):本周航線運(yùn)價(jià)走勢(shì)分化,綜合指數(shù)保持穩(wěn)定

18:09

上交所:本周對(duì)中韓半導(dǎo)體ETF等溢價(jià)較高的基金,以及*ST熊貓、*ST正平等異常波動(dòng)退市風(fēng)險(xiǎn)警示股票進(jìn)行重點(diǎn)監(jiān)控

18:08

交易員已完全預(yù)期歐洲央行今年將加息三次

18:07

美國10年期國債收益率突破4.3%,日內(nèi)上行逾4bp,現(xiàn)報(bào)4.301%

18:03

飛捷科思再獲近億元融資,加速物理AI基建落地

17:59

途虎養(yǎng)車2025年?duì)I收同比增11.5%

17:56

北京:鼓勵(lì)本市CCUS企業(yè)在津冀區(qū)域火電、鋼鐵、化工、石化、水泥等重點(diǎn)行業(yè)建設(shè)大規(guī)模、全流程示范應(yīng)用工程

17:55

北京:加大CCUS關(guān)鍵核心技術(shù)研發(fā)攻關(guān)

17:49

南向資金今日凈賣出約210億港元,創(chuàng)近兩周單日賣出新高

17:45

上期所調(diào)整石油瀝青、丁二烯橡膠品種套保持倉額度自動(dòng)轉(zhuǎn)化標(biāo)準(zhǔn)

17:43

央行:境內(nèi)企業(yè)境外放款宏觀審慎調(diào)節(jié)系數(shù)由0.5上調(diào)至0.6,整體提高境外放款余額上限

17:39

美元/日元上漲0.6%至158.68,周跌幅收窄至0.7%

17:39

宇樹科技2025年度實(shí)現(xiàn)營業(yè)收入17.08億元,同比增長335.36%

17:37

兩部門:境內(nèi)企業(yè)境外放款余額上限與其所有者權(quán)益掛鉤

17:35

中國人民銀行:放款人境外放款余額不得超過其境外放款余額上限

17:29

上交所受理宇樹科技股份有限公司科創(chuàng)板IPO申請(qǐng),擬融資金額42.02億元

9

掃描下載App