Gemini 2.5 Flash 与 Flash-Lite 更新：质量与效率双重提升

我们发布了 Gemini 2.5 Flash 和 2.5 Flash-Lite 的更新预览版本，现已在 Google AI Studio 和 Vertex AI 上线。新版本旨在持续提升模型质量并优化运行效率。

与当前的稳定模型相比，新的预览版模型在质量和速度上均有显著改进，其中 Gemini 2.5 Flash-Lite 的输出 Token（及成本）降低了 50%，Gemini 2.5 Flash 则降低了 24%。

Gemini 2.5 Flash-Lite 更新详情

最新版本的 Gemini 2.5 Flash-Lite 主要围绕以下三个关键主题进行训练和构建：

您可以使用以下模型名称开始测试此预览版本： gemini-2.5-flash-lite-preview-09-2025

最新的 Gemini 2.5 Flash 模型主要在以下两个我们持续收到反馈的领域进行了改进：

更优的 Agent 工具使用：我们改进了模型使用工具的方式，使其在更复杂的、需要 Agent 智能体参与的多步骤应用中表现更出色。与上一版本相比，该模型在关键的 Agent 性能基准测试中取得了显著进步，例如在 SWE-Bench Verified 上的得分提升了 5%（从 48.9% 增长到 54%）。
更高的效率：在启用思考（thinking on）模式时，模型的成本效益显著提高，能够以更少的 Token 实现更高质量的输出，从而降低延迟和成本。

我们已经收到了早期测试者的积极反馈。正如自动化 AI Agent 公司 Manus 的联合创始人兼首席科学家 Yichao ‘Peak’ Ji 所说：

新的 Gemini 2.5 Flash 模型完美融合了速度与智能。我们的内部基准评估显示，它在处理长周期 Agent 任务时的性能提升了 15%。其卓越的成本效益使 Manus 能够实现前所未有的规模扩展，进一步推动我们‘扩展人类能力’的使命。

您可以使用以下模型名称开始测试此预览版本： gemini-2.5-flash-preview-09-2025

我们发现，发布模型的预览版能让开发者第一时间测试最新的改进和创新，提供宝贵反馈，并基于 Gemini 的顶尖能力构建可用于生产环境的应用。本次发布的版本旨在为未来的稳定版迭代提供方向，而非直接成为新的稳定版。

为了方便您访问最新模型，同时减少记忆和追踪冗长模型名称的麻烦，我们为每个模型系列引入了 -latest 别名。该别名将始终指向我们最新的模型版本，让您无需在每次发布后更新代码即可体验新功能。

您可以使用以下别名访问新的预览版：

为确保您有充足的时间测试新模型，在更新或弃用 -latest 别名背后的特定版本之前，我们都会提前 2 周通过邮件通知。请注意，这些只是模型别名，其速率限制、成本和可用功能可能会随版本发布而变化。

对于需要更高稳定性的应用，请继续使用明确版本的模型，如 gemini-2.5-flash 和 gemini-2.5-flash-lite。

👉 如果你需要 ChatGPT 代充 / Claude / Claude Code / 镜像 / 中转 API：