谷歌推出了 Gemini 3.1 Flash Lite,这是一款新的人工智能模型,旨在以更低的价格提供更快的响应速度。该模型属于Gemini 3系列,被定位为开发者和企业构建AI应用时最具成本效益和速度优化的选择。
Gemini 3.1 Flash Lite可通过Google AI Studio中的Gemini API和面向企业客户的Vertex AI进行预览。
Gemini 3.1 Flash Lite的定价如何?
谷歌设定的价格为:
- 每百万输入token 0.25美元
- 每百万输出token 1.50美元
这种较低的定价结构使得该模型适用于高吞吐量工作负载,如翻译、聊天机器人系统和内容审核,其中每个查询的操作成本至关重要。
与早期Gemini模型相比如何?
根据谷歌引用的基准测试结果,Gemini 3.1 Flash Lite:
- 与Gemini 2.5 Flash相比,“首次回答token时间”快2.5倍
- 输出速度快45%
- 在Arena.ai排行榜上获得1432的Elo评分
- 在GPQA Diamond上得分为86.9%,在MMMU Pro上得分为76.8%
谷歌表示,该模型在推理和多模态理解(包括处理文本和图像)方面超越了一些更大规模的上一代Gemini模型。
其主要能力有哪些?
一个显著特点是动态思考,它允许开发者控制模型为特定任务使用的处理量。这种灵活性支持:
- 高频AI任务,如自动翻译
- 实时内容审核
- 用户界面生成
- 模拟创建
通过调整计算强度,组织可以平衡速度、成本和输出质量。
谁在使用该模型?
早期采用者包括Latitude、Cartwheel和Whering等公司。测试者报告称,该模型处理复杂输入的准确性与更大的AI模型相当,同时保持了强大的指令遵循能力。
这对AI开发有何意义?
此次发布反映了人工智能领域日益激烈的竞争,其中速度、可扩展性和成本效率变得越来越重要。随着企业将AI集成到客户服务、企业自动化和创意工作流程中,像Gemini 3.1 Flash Lite这样的轻量级模型提供了实用的部署优势。
结论
Gemini 3.1 Flash Lite以更低的定价和更快的响应速度扩展了谷歌的AI产品组合。凭借对动态处理和多模态任务的支持,它专为寻求平衡性能和运营成本的可扩展AI解决方案的开发者和企业而设计。



















