谷歌更新Gemini API定價,按推理使用分檔計費
鈦媒體App 4月3日消息,谷歌近日對Gemini API的計費檔位進行更新,優(yōu)化方案與定價均基于實際推理使用需求制定。本次新增的推理服務檔位包括:標準(Standard)、彈性(Flex)、優(yōu)先(Priority)、批量(Batch)和緩存(Caching)版。其中,彈性推理檔位通過利用非高峰閑置算力資源,提供標準價格五折優(yōu)惠,目標延遲為1至15分鐘,但不提供延遲保證。批量API檔位同樣提供標準費率五折優(yōu)惠,延遲最長可達24小時。緩存檔位計費依據(jù)緩存詞元(Token)數(shù)量與存儲時長,推薦用于搭載復雜系統(tǒng)指令的對話機器人、長視頻文件重復分析,以及大規(guī)模文檔集查詢等場景。優(yōu)先檔位定價則比標準價格高出75%至100%,延遲可控制在毫秒至秒級。谷歌建議該檔位用于實時客服聊天機器人、實時欺詐檢測及業(yè)務關鍵型智能助手等場景。(廣角觀察)
本文內(nèi)容僅供參考,不構成投資建議,請謹慎對待。
根據(jù)《網(wǎng)絡安全法》實名制要求,請綁定手機號后發(fā)表評論