 

当前位置：系统极客  AI  Gemini  正文

Gemini 3.1 Flash-Lite：为大规模智能应用而生

发布日期：2026-03-04 分类：Gemini 阅读() 评论(0) 赞(0)

Gemini 3.1 Flash-Lite

Gemini 3 系列中速度最快、性价比最高的模型——Gemini 3.1 Flash-Lite 正式发布！该模型专为大规模、高频负载场景量身打造，在同级别模型中有着极高的「质价比」。

从现在开始，你就可以在 Google AI Studio 和 Vertex AI 平台，抢先体验 3.1 Flash-Lite 预览版。

兼顾性能与极致性价比

Gemini 3.1 Flash-Lite 的定价极具竞争力：

每百万输入 Token 0.25 美元
每百万输出 Token 1.50 美元

根据 Artificial Analysis 的基准测试，在保持甚至超越原有输出质量的前提下，它的首个 Token 响应时间（TTFT）比 2.5 Flash 快了 2.5 倍，输出速度提升了 45%。这一表现为高频业务流带来了极致的低延迟，能帮开发者轻松构建出丝滑、实时的交互体验。

Gemini 3.1 Flash-Lite 速度与成本效益

在权威的 Arena.ai 排行榜上，3.1 Flash-Lite 拿下了 1432 的 Elo 积分。放眼同级别模型，它在逻辑推理和多模态理解方面的综合表现都遥遥领先——不仅在 GPQA Diamond 测试中取得 86.9% 的高分，在 MMMU Pro 中也达到了 76.8%。其综合表现甚至反超了 2.5 Flash 等上一代更大尺寸的 Gemini 模型。

Gemini 3.1 Flash-Lite 基准测试

赋予开发者「弹性思考」控制权

除了硬核的性能指标，Gemini 3.1 Flash-Lite 在 AI Studio 和 Vertex AI 平台中，都标配了「思考深度」调节功能。这项设计能将控制权完全交还给用户，让你能灵活决定模型在特定任务上，要投入多少算力去「思考」——这对高效管理高频工作负载至关重要。

得益于此，3.1 Flash-Lite 既能胜任海量文本翻译、内容安全审核等成本敏感型任务，也能在自动生成 UI 界面与交互大屏、推演虚拟仿真或执行复杂操作指令等需要深度推理的重负载场景中挑起大梁。

分享到

相关推荐

评论抢沙发

快讯

System76 开放 Pop!_OS 24.04 LTS 就地升级

System76 开放从 Pop!_OS 22.04 LTS 到 Pop!_OS 24.04 LTS 的官方就地升级，现有用户可直接升级到最新的长期支持版本。

1分钟前
Chrome 将改成每 2 周发布一次

从 2026 年 9 月起，Chrome 浏览器的发布周期将从每 4 周改成每 2 周发布一次。

2小时前
Qwen3-Max-Thinking 在 Qwen Chat 上线

Qwen3-Max-Thinking 已经在 Qwen Chat 上线！选择 Qwen3-Max，启用「深度思考」功能，体验一番吧~

4个月前 (11-03)
谷歌将停用 goo.gl 短链接服务

Google 将停用短链接服务：自 2025 年 8 月 25 日起，所有 https://goo.gl/* 格式的短链接将失效，并返回 404 错误。

7个月前 (07-27)