我们发布了 Gemini 2.5 Flash 和 2.5 Flash-Lite 的更新预览版本,现已在 Google AI Studio 和 Vertex AI 上线。新版本旨在持续提升模型质量并优化运行效率。
与当前的稳定模型相比,新的预览版模型在质量和速度上均有显著改进,其中 Gemini 2.5 Flash-Lite 的输出 Token(及成本)降低了 50%,Gemini 2.5 Flash 则降低了 24%。
Gemini 2.5 Flash-Lite 更新详情
最新版本的 Gemini 2.5 Flash-Lite 主要围绕以下三个关键主题进行训练和构建:
- 更强的指令遵循能力:模型在理解和执行复杂指令及系统提示方面表现更佳。
- 更简洁的输出:模型现在能够生成更精炼的回答,这对于高吞吐量应用而言,是降低 Token 成本和延迟的关键因素。
- 更强的多模态与翻译能力:此更新带来了更准确的音频转录、更出色的图像理解能力以及更高质量的翻译。
您可以使用以下模型名称开始测试此预览版本:
gemini-2.5-flash-lite-preview-09-2025
Gemini 2.5 Flash 更新详情
最新的 Gemini 2.5 Flash 模型主要在以下两个我们持续收到反馈的领域进行了改进:
- 更优的 Agent 工具使用:我们改进了模型使用工具的方式,使其在更复杂的、需要 Agent 智能体参与的多步骤应用中表现更出色。与上一版本相比,该模型在关键的 Agent 性能基准测试中取得了显著进步,例如在 SWE-Bench Verified 上的得分提升了 5%(从 48.9% 增长到 54%)。
- 更高的效率:在启用思考(thinking on)模式时,模型的成本效益显著提高,能够以更少的 Token 实现更高质量的输出,从而降低延迟和成本。
我们已经收到了早期测试者的积极反馈。正如自动化 AI Agent 公司 Manus 的联合创始人兼首席科学家 Yichao ‘Peak’ Ji 所说:
新的 Gemini 2.5 Flash 模型完美融合了速度与智能。我们的内部基准评估显示,它在处理长周期 Agent 任务时的性能提升了 15%。其卓越的成本效益使 Manus 能够实现前所未有的规模扩展,进一步推动我们‘扩展人类能力’的使命。
您可以使用以下模型名称开始测试此预览版本:
gemini-2.5-flash-preview-09-2025
如何开始使用新模型
我们发现,发布模型的预览版能让开发者第一时间测试最新的改进和创新,提供宝贵反馈,并基于 Gemini 的顶尖能力构建可用于生产环境的应用。本次发布的版本旨在为未来的稳定版迭代提供方向,而非直接成为新的稳定版。
为了方便您访问最新模型,同时减少记忆和追踪冗长模型名称的麻烦,我们为每个模型系列引入了 -latest
别名。该别名将始终指向我们最新的模型版本,让您无需在每次发布后更新代码即可体验新功能。
您可以使用以下别名访问新的预览版:
gemini-flash-latest
gemini-flash-lite-latest
为确保您有充足的时间测试新模型,在更新或弃用 -latest
别名背后的特定版本之前,我们都会提前 2 周通过邮件通知。请注意,这些只是模型别名,其速率限制、成本和可用功能可能会随版本发布而变化。
对于需要更高稳定性的应用,请继续使用明确版本的模型,如 gemini-2.5-flash
和 gemini-2.5-flash-lite
。
👉 如果你需要 ChatGPT 代充 / Claude / Claude Code / 镜像 / 中转 API:
- 购买 / 了解更多:ai4.plus
- 备用入口:kk4099.com