Gemini 2.5 Flash 与 Flash-Lite 更新:质量与效率双重提升
我们发布了 Gemini 2.5 Flash 和 2.5 Flash-Lite 的更新预览版本,现已在 Google AI Studio 和 Vertex AI 上线。新版本旨在持续提升模型质量并优化运行效率。 与当前的稳定模型相比,新的预览版模型在质量和速度上均有显著改进,其中 Gemini 2.5 Flash-Lite 的输出 Token(及成本)降低了 50%,Gemini 2.5 Flash 则降低了 24%。 Gemini 2.5 Flash-Lite 更新详情 最新版本的 Gemini 2.5 Flash-Lite 主要围绕以下三个关键主题进行训练和构建: 更强的指令遵循能力:模型在理解和执行复杂指令及系统提示方面表现更佳。 更简洁的输出:模型现在能够生成更精炼的回答,这对于高吞吐量应用而言,是降低 Token 成本和延迟的关键因素。 更强的多模态与翻译能力:此更新带来了更准确的音频转录、更出色的图像理解能力以及更高质量的翻译。 您可以使用以下模型名称开始测试此预览版本: gemini-2.5-flash-lite-preview-09-2025 Gemini 2.5 Flash 更新详情 最新的 Gemini 2.5 Flash 模型主要在以下两个我们持续收到反馈的领域进行了改进: 更优的 Agent 工具使用:我们改进了模型使用工具的方式,使其在更复杂的、需要 Agent 智能体参与的多步骤应用中表现更出色。与上一版本相比,该模型在关键的 Agent 性能基准测试中取得了显著进步,例如在 SWE-Bench Verified 上的得分提升了 5%(从 48.9% 增长到 54%)。 更高的效率:在启用思考(thinking on)模式时,模型的成本效益显著提高,能够以更少的 Token 实现更高质量的输出,从而降低延迟和成本。 我们已经收到了早期测试者的积极反馈。正如自动化 AI Agent 公司 Manus 的联合创始人兼首席科学家 Yichao ‘Peak’ Ji 所说: ...