Azure AI Foundry 直售模型概览

本文档列出了由 Azure 直接销售的部分 Azure AI Foundry 模型，详细介绍了它们的功能、部署类型和可用区域，不包括已弃用和旧版模型。

由 Azure 直售的模型涵盖了所有 Azure OpenAI 模型以及来自顶级供应商的特定精选模型。您在 Azure AI Foundry 中看到的模型系列会因项目类型而异：

基于 Azure AI Foundry 资源的项目：您会看到可用于标准部署到 Foundry 资源的模型。
基于 Azure AI Foundry 中心托管的项目：您会看到可部署到托管计算和无服务器 API 的模型。

由于许多模型支持多种部署选项，这两个模型列表经常存在重叠。

Azure OpenAI 模型

Azure OpenAI 提供了一系列功能和定价各异的模型。模型的可用性因区域和云环境而异。若要了解 Azure 政府版中的模型可用性，请参阅相关文档。

模型系列	描述
GPT-5 系列 `新`	包括 `gpt-5`, `gpt-5-mini`, `gpt-5-nano`, `gpt-5-chat`。
gpt-oss `新`	开源权重的推理模型。
codex-mini	`o4-mini` 的微调版本。
GPT-4.1 系列	包括 `gpt-4.1`, `gpt-4.1-mini`, `gpt-4.1-nano`。
model-router	该模型能智能地从一组底层聊天模型中选择最合适的模型来响应给定的提示。
computer-use-preview	一个实验性模型，专为与响应 API 的计算机使用工具配合而训练。
o-系列模型	专注于高级问题解决和推理的模型，能力得到增强。
GPT-4o, GPT-4o mini, and GPT-4 Turbo	功能强大的 Azure OpenAI 模型，其多模态版本可以同时接受文本和图像作为输入。
GPT-4	在 GPT-3.5 基础上改进的一组模型，能够理解并生成自然语言和代码。
GPT-3.5	在 GPT-3 基础上改进的一组模型，能够理解并生成自然语言和代码。
Embeddings	一组可将文本转换为数值向量形式的模型，用于文本相似度计算。
图像生成	一系列可根据自然语言生成原创图像的模型。
视频生成	一款可根据文本指令生成原创视频场景的模型。
音频	一系列用于语音转文本、翻译和文本转语音的模型。GPT-4o 音频模型支持低延迟的语音输入/输出对话交互或音频生成。

GPT-5 系列

可用区域

模型	区域
`gpt-5` (2025-08-07)	美国东部 2 (全球标准和数据区), 瑞典中部 (全球标准和数据区)
`gpt-5-mini` (2025-08-07)	美国东部 2 (全球标准和数据区), 瑞典中部 (全球标准和数据区)
`gpt-5-nano` (2025-08-07)	美国东部 2 (全球标准和数据区), 瑞典中部 (全球标准和数据区)
`gpt-5-chat` (2025-08-07)	美国东部 2 (全球标准), 瑞典中部 (全球标准)

注意：访问 gpt-5 模型需要注册，并将根据微软的资格标准进行审批。 gpt-5-mini、gpt-5-nano 和 gpt-5-chat 无需注册。之前已申请并获准访问 o3 的客户无需重新申请，其获批的订阅将在模型发布后自动获得访问权限。

模型能力

模型 ID	描述	上下文窗口	最大输出 Token	训练数据截止日期
`gpt-5` (2025-08-07)	- 推理- 聊天补全 API- 响应 API- 结构化输出- 文本和图像处理- 函数、工具和并行工具调用	400,000(输入: 272,000, 输出: 128,000)	128,000	2024年10月24日
`gpt-5-mini` (2025-08-07)	- 推理- 聊天补全 API- 响应 API- 结构化输出- 文本和图像处理- 函数、工具和并行工具调用	400,000(输入: 272,000, 输出: 128,000)	128,000	2024年6月24日
`gpt-5-nano` (2025-08-07)	- 推理- 聊天补全 API- 响应 API- 结构化输出- 文本和图像处理- 函数、工具和并行工具调用	400,000(输入: 272,000, 输出: 128,000)	128,000	2024年5月31日
`gpt-5-chat` (2025-08-07) `预览版`	- 聊天补全 API- 响应 API- 输入: 文本/图像- 输出: 仅文本	128,000	16,384	2024年10月24日

gpt-oss

可用区域

模型	区域
`gpt-oss-120b`	所有 Azure OpenAI 区域

模型能力

模型 ID	描述	上下文窗口	最大输出 Token	训练数据截止日期
`gpt-oss-120b` (预览版)	- 仅文本输入/输出- 聊天补全 API- 流式传输- 函数调用- 结构化输出- 推理- 可通过部署¹ 和托管计算使用	131,072	131,072	2024年5月31日
`gpt-oss-20b` (预览版)	- 仅文本输入/输出- 聊天补全 API- 流式传输- 函数调用- 结构化输出- 推理- 可通过托管计算和 Foundry Local 使用	131,072	131,072	2024年5月31日

¹ 与其他 Azure OpenAI 模型不同，gpt-oss-120b 需要一个 Azure AI Foundry 项目来部署模型。

代码部署示例

az cognitiveservices account deployment create \
 --name "Foundry-project-resource" \
 --resource-group "test-rg" \
 --deployment-name "gpt-oss-120b" \
 --model-name "gpt-oss-120b" \
 --model-version "1" \
 --model-format "OpenAI-OSS" \
 --sku-capacity 10 \
 --sku-name "GlobalStandard"

GPT-4.1 系列

可用区域

模型	区域
`gpt-4.1` (2025-04-14)	参见模型表
`gpt-4.1-nano` (2025-04-14)	参见模型表
`gpt-4.1-mini` (2025-04-14)	参见模型表

模型能力

重要提示：已知问题

所有 GPT-4.1 系列模型均存在一个已知问题。当大型工具或函数调用定义超过 300,000 个 Token 时，即使未达到模型的 100 万 Token 上下文限制，调用也会失败。具体的错误信息可能因 API 调用和底层负载的特性而异。

聊天补全 API 错误信息示例：

Error code: 400 - {'error': {'message': "This model's maximum context length is 300000 tokens. However, your messages resulted in 350564 tokens (100 in the messages, 350464 in the functions). Please reduce the length of the messages or functions.", ...}}

Error code: 400 - {'error': {'message': "Invalid 'tools[0].function.description': string too long. Expected a string with maximum length 1048576, but got a string with length 2778531 instead.", ...}}

响应 API 错误信息示例：

Error code: 500 - {'error': {'message': 'The server had an error processing your request. ...', 'type': 'server_error', ...}}

模型 ID	描述	上下文窗口	最大输出 Token	训练数据截止日期
`gpt-4.1` (2025-04-14)	- 文本和图像输入- 文本输出- 聊天补全 API- 响应 API- 流式传输- 函数调用- 结构化输出 (聊天补全)	- 1,047,576- 128,000 (预配的托管部署)- 300,000 (批量部署)	32,768	2024年5月31日
`gpt-4.1-nano` (2025-04-14)	- 文本和图像输入- 文本输出- 聊天补全 API- 响应 API- 流式传输- 函数调用- 结构化输出 (聊天补全)	- 1,047,576- 128,000 (预配的托管部署)- 300,000 (批量部署)	32,768	2024年5月31日
`gpt-4.1-mini` (2025-04-14)	- 文本和图像输入- 文本输出- 聊天补全 API- 响应 API- 流式传输- 函数调用- 结构化输出 (聊天补全)	- 1,047,576- 128,000 (预配的托管部署)- 300,000 (批量部署)	32,768	2024年5月31日

model-router

model-router 能智能地从一组底层聊天模型中选择最合适的模型来响应给定的提示。

可用区域

模型	区域
`model-router` (2025-08-07)	美国东部 2 (全球标准), 瑞典中部 (全球标准)
`model-router` (2025-05-19)	美国东部 2 (全球标准), 瑞典中部 (全球标准)

模型能力

模型 ID	描述	上下文窗口	最大输出 Token	训练数据截止日期
`model-router` (2025-08-07)	智能地从一组底层模型中选择模型进行响应。	200,000	- 32,768 (GPT-4.1 系列)- 100,000 (`o4-mini`)- 128,000 (`gpt-5` 推理模型)- 16,384 (`gpt-5-chat`)	-
`model-router` (2025-05-19)	智能地从一组底层聊天模型中选择模型进行响应。	200,000	- 32,768 (GPT-4.1 系列)- 100,000 (`o4-mini`)	2024年5月31日

注意：部分底层模型兼容更大的上下文窗口。这意味着，只有当提示恰好被路由到支持该上下文大小的模型时，使用较大上下文的 API 调用才会成功，否则将失败。

computer-use-preview

这是一个实验性模型，专为与响应 API 的计算机使用工具配合而训练。它可以与第三方库结合使用，允许模型控制鼠标和键盘输入，同时从当前环境的屏幕截图中获取上下文。

警告

我们不建议在生产环境中使用预览版模型。所有预览版模型的部署都将升级到未来的预览版本或最新的稳定正式版。标记为预览版的模型不遵循标准的 Azure OpenAI 模型生命周期。

访问 computer-use-preview 需要注册，并将根据微软的资格标准进行审批。即使已获得其他受限访问模型权限的客户，也需要单独申请此模型的访问权限。

可用区域

模型	区域
`computer-use-preview`	参见模型表

模型能力

模型 ID	描述	上下文窗口	最大输出 Token	训练数据截止日期
`computer-use-preview` (2025-03-11)	专为响应 API 的计算机使用工具设计的模型。- 工具- 流式传输- 文本 (输入/输出)- 图像 (输入)	8,192	1,024	2023年10月

o-系列模型

Azure OpenAI o-系列模型旨在以更高的专注度和能力解决推理和问题解决任务。与之前的版本相比，这些模型会花费更多时间处理和理解用户请求，因此在科学、编码和数学等领域表现尤为出色。

模型 ID	描述	最大请求 (Token)	训练数据截止日期
`codex-mini` (2025-05-16)	`o4-mini` 的微调版本。- 响应 API- 结构化输出- 文本和图像处理- 函数和工具	输入: 200,000输出: 100,000	2024年5月31日
`o3-pro` (2025-06-10)	- 响应 API- 结构化输出- 文本和图像处理- 函数和工具	输入: 200,000输出: 100,000	2024年5月31日
`o4-mini` (2025-04-16)	全新推理模型，提供增强的推理能力。- 聊天补全 API- 响应 API- 结构化输出- 文本和图像处理- 函数和工具	输入: 200,000输出: 100,000	2024年5月31日
`o3` (2025-04-16)	全新推理模型，提供增强的推理能力。	-	-

👉 如果你需要 ChatGPT 代充 / Claude / Claude Code / 镜像 / 中转 API：

购买 / 了解更多：ai4.plus
备用入口：kk4099.com

Azure OpenAI 模型#

GPT-5 系列#

可用区域#

模型能力#

gpt-oss#

可用区域#

模型能力#

代码部署示例#

GPT-4.1 系列#

可用区域#

模型能力#

model-router#

可用区域#

模型能力#

computer-use-preview#

可用区域#

模型能力#

o-系列模型#

Azure OpenAI 模型

GPT-5 系列

可用区域

模型能力

gpt-oss

可用区域

模型能力

代码部署示例

GPT-4.1 系列

可用区域

模型能力

model-router

可用区域

模型能力

computer-use-preview

可用区域

模型能力

o-系列模型