Claude 代码解释器深度评测：对标 ChatGPT，功能与短板并存

Anthropic 近日为其 AI 模型 Claude 推出了一项强大的新功能，允许模型在服务器端沙箱环境中执行代码、分析数据并创建文件。尽管官方将其命名为拗口的“升级版文件创建与分析”（Upgraded file creation and analysis），但其实质就是对标 OpenAI 广受欢迎的 ChatGPT 代码解释器（Code Interpreter）。

这项新功能目前已向 Max、Team 和 Enterprise 订阅用户开放预览，Pro 用户也将在未来几周内获得访问权限。

新旧功能对比

值得注意的是，这项新功能与 Claude 在 2024 年 10 月推出的“分析工具”（Analysis tool）截然不同。旧版工具通过在用户浏览器中生成并执行 JavaScript 来工作，而新功能则在服务器端容器中运行，实现方式更接近 OpenAI 的代码解释器。

在设置中启用新的“升级版文件创建与分析”后，旧的“分析工具”选项会自动关闭，二者无法同时使用。

环境探索

为了解其运行环境，我们首先让 Claude 自我剖析其 Shell 和 Python 环境。

系统配置

通过一系列命令查询，我们得到了其运行环境的关键信息：

操作系统: Ubuntu 24.04.2 LTS (Noble)，Linux 内核 4.4.0
架构: x86_64
Shell: GNU Bash 5.2.21
当前用户: root
工作目录: /home/claude
内存: 9.0 GB
可用磁盘空间: 约 4.6 GB（总共 4.9 GB）
Python 版本: 3.12.3
Node.js 版本: 18.19.1

这是一个配备了 9GB 内存和约 5GB 磁盘空间的 Ubuntu 24.04.2 容器，预装了 Python 3.12.3 和 Node.js 18.19.1。

网络访问与依赖安装

尝试直接访问互联网，如使用 curl 或 Python 的 http 库请求外部 JSON 文件，均返回了 403 Forbidden 错误。这表明其网络访问受到了严格限制。

通过检查环境变量，发现系统配置了 HTTP 代理：

HTTPS_PROXY=http://21.0.0.167:15001
https_proxy=http://21.0.0.167:15001
http_proxy=http://21.0.0.167:15001

这证实了所有出站网络请求都通过一个 Envoy 代理，该代理实施了严格的白名单策略。根据官方文档，允许访问的域名包括：

Anthropic 服务: api.anthropic.com, statsig.anthropic.com
版本控制: github.com
包管理器:
- NPM: registry.npmjs.org, npmjs.com, npmjs.org
- Yarn: yarnpkg.com, registry.yarnpkg.com
- Python: pypi.org, files.pythonhosted.org, pythonhosted.org

一个令人惊喜的发现是，Claude 可以在其环境中动态安装 PyPI 包。执行 pip install sqlite-utils 命令成功完成。这是 Claude 代码解释器相较于 ChatGPT 的一个显著优势。

关键限制

尽管功能强大，但 Claude 的代码解释器有一个重要限制：上传和下载的最大文件大小为 30MB。相比之下，ChatGPT 的限制是 512MB。对于需要处理上百兆数据库文件的用户来说，这无疑是一个明显的短板。

实战测试

基础任务：分析数据库并生成图表

上传一个 21.9MB 的 SQLite 数据库文件，并要求 Claude 探索该数据库，生成一个包含所有表连接关系图的 PDF 文件。

模型成功完成了任务，不仅生成了 PDF，还提供了一个 PNG 格式的等效图片。虽然生成的连接图线条有些杂乱，难以追踪，但证明了该系统具备分析 SQLite 文件并生成可视化结果的能力。通过进一步的提示词优化，相信可以获得更理想的输出。

进阶挑战：复现复杂数据图表

为了测试其处理复杂任务的能力，我们尝试复现一张关于 AI 技术采用率的图表。任务提供了原始图表的截图和一份 XLSX 数据文件。

第一步：初步生成

Claude 编写并运行了一系列 Python 代码，生成了图表的初版。结果不错，但线条呈锯齿状，不够平滑。

第二步：平滑曲线

尝试让其绘制“六个调查周期的滚动平均值”，并要求“让线条不那么锯齿状”。模型最初误解了意图，尝试使用 scipy 进行数据处理，导致结果不符合预期。

第三-步：精确引导

通过更明确的提示：“我不是指渲染平滑，而是希望点与点之间是平滑的曲线，就像原始截图中那样”，模型最终理解了需求，并成功生成了平滑的曲线图。

第四步：细节修复

与之前在 ChatGPT 上遇到的问题类似，图表标题出现了重叠。通过提供带有问题的截图并给出修复指令，Claude 最终解决了这个问题，成功复现了目标图表。

整个过程虽然需要多次引导和修正，但最终证明了 Claude 代码解释器在数据可视化方面具备强大的实力。

安全风险分析

与完全无法访问互联网的 ChatGPT 代码解释器不同，Claude 的环境可以访问 GitHub、PyPI 等特定网站。这带来了潜在的提示词注入（Prompt Injection）风险。

Anthropic 在其帮助文档中也明确指出了这一点：

恶意行为者可能通过外部文件或网站暗中添加指令，诱使 Claude：

在沙箱环境中下载并运行不受信任的恶意代码。

从连接的知识源中读取敏感数据，并利用沙箱环境通过外部网络请求泄露这些数据。

这意味着 Claude 可能被诱骗，将其上下文中的信息（如提示、项目数据等）发送给恶意的第三方。

Anthropic 给出的缓解建议是“在使用该功能时密切监控 Claude 的行为”，这种将安全责任转移给用户的做法略显不足。尽管他们已经通过白名单限制了网络访问，但仅开放 github.com 就可能带来大量潜在的数据泄露途径。

因此，在使用此功能处理任何敏感数据时，用户应保持高度警惕。

👉 如果你需要 ChatGPT 代充 / Claude / Claude Code / 镜像 / 中转 API：

购买 / 了解更多：ai4.plus
备用入口：kk4099.com

新旧功能对比#

环境探索#

系统配置#

网络访问与依赖安装#

关键限制#

实战测试#

基础任务：分析数据库并生成图表#

进阶挑战：复现复杂数据图表#

安全风险分析#