Google 推出了 Gemini 3.1 Flash Lite,這是一款新的人工智慧模型,旨在以更低的價格提供更快的回應速度。該模型屬於 Gemini 3 系列,定位為開發者和企業建構 AI 應用時最具成本效益和速度優化的選擇。
Gemini 3.1 Flash Lite 目前可透過 Google AI Studio 中的 Gemini API 以及企業客戶的 Vertex AI 進行預覽。
Gemini 3.1 Flash Lite 的定價如何?
Google 設定的價格為:
- 每百萬輸入 tokens 0.25 美元
- 每百萬輸出 tokens 1.50 美元
這種較低的定價結構使該模型適合高工作量的任務,如翻譯、聊天機器人系統和內容審核,這些任務中每個查詢的運營成本至關重要。
與早期的 Gemini 模型相比如何?
根據 Google 引用的基準測試結果,Gemini 3.1 Flash Lite:
- 與 Gemini 2.5 Flash 相比,「首次回答 token 時間」快 2.5 倍
- 輸出速度快 45%
- 在 Arena.ai 排行榜上的 Elo 分數為 1432
- 在 GPQA Diamond 上得分 86.9%,在 MMMU Pro 上得分 76.8%
Google 表示,該模型在推理和多模態理解(包括處理文本和圖像)方面超越了前一代的一些較大型 Gemini 模型。
其主要功能有哪些?
一個顯著特點是動態思考,這允許開發者控制模型對特定任務使用的處理量。這種靈活性支持:
- 高頻 AI 任務,如自動翻譯
- 即時內容審核
- 用戶界面生成
- 模擬創建
通過調整計算強度,組織可以在速度、成本和輸出質量之間取得平衡。
誰在使用這個模型?
早期採用者包括 Latitude、Cartwheel 和 Whering 等公司。測試者報告稱,該模型處理複雜輸入的準確性與較大型 AI 模型相當,同時保持了強大的指令遵循能力。
這對 AI 開發有何重要意義?
此次發布反映了人工智慧領域日益激烈的競爭,其中速度、可擴展性和成本效益越來越重要。隨著企業將 AI 整合到客戶服務、企業自動化和創意工作流程中,像 Gemini 3.1 Flash Lite 這樣的輕量級模型提供了實際的部署優勢。
結論
Gemini 3.1 Flash Lite 擴展了 Google 的 AI 產品組合,提供了一個專注於更低價格和更快回應速度的模型。通過支持動態處理和多模態任務,它專為尋求平衡性能和運營成本的可擴展 AI 解決方案的開發者和企業而設計。




















