Anthropic 近日为其 AI 模型 Claude 推出了一项强大的新功能,允许模型在服务器端沙箱环境中执行代码、分析数据并创建文件。尽管官方将其命名为拗口的“升级版文件创建与分析”(Upgraded file creation and analysis),但其实质就是对标 OpenAI 广受欢迎的 ChatGPT 代码解释器(Code Interpreter)。
这项新功能目前已向 Max、Team 和 Enterprise 订阅用户开放预览,Pro 用户也将在未来几周内获得访问权限。
新旧功能对比
值得注意的是,这项新功能与 Claude 在 2024 年 10 月推出的“分析工具”(Analysis tool)截然不同。旧版工具通过在用户浏览器中生成并执行 JavaScript 来工作,而新功能则在服务器端容器中运行,实现方式更接近 OpenAI 的代码解释器。
在设置中启用新的“升级版文件创建与分析”后,旧的“分析工具”选项会自动关闭,二者无法同时使用。
环境探索
为了解其运行环境,我们首先让 Claude 自我剖析其 Shell 和 Python 环境。
系统配置
通过一系列命令查询,我们得到了其运行环境的关键信息:
- 操作系统: Ubuntu 24.04.2 LTS (Noble),Linux 内核 4.4.0
- 架构: x86_64
- Shell: GNU Bash 5.2.21
- 当前用户:
root - 工作目录:
/home/claude - 内存: 9.0 GB
- 可用磁盘空间: 约 4.6 GB(总共 4.9 GB)
- Python 版本: 3.12.3
- Node.js 版本: 18.19.1
这是一个配备了 9GB 内存和约 5GB 磁盘空间的 Ubuntu 24.04.2 容器,预装了 Python 3.12.3 和 Node.js 18.19.1。
网络访问与依赖安装
尝试直接访问互联网,如使用 curl 或 Python 的 http 库请求外部 JSON 文件,均返回了 403 Forbidden 错误。这表明其网络访问受到了严格限制。
通过检查环境变量,发现系统配置了 HTTP 代理:
HTTPS_PROXY=http://21.0.0.167:15001
https_proxy=http://21.0.0.167:15001
http_proxy=http://21.0.0.167:15001
这证实了所有出站网络请求都通过一个 Envoy 代理,该代理实施了严格的白名单策略。根据官方文档,允许访问的域名包括:
- Anthropic 服务:
api.anthropic.com,statsig.anthropic.com - 版本控制:
github.com - 包管理器:
- NPM:
registry.npmjs.org,npmjs.com,npmjs.org - Yarn:
yarnpkg.com,registry.yarnpkg.com - Python:
pypi.org,files.pythonhosted.org,pythonhosted.org
- NPM:
一个令人惊喜的发现是,Claude 可以在其环境中动态安装 PyPI 包。执行 pip install sqlite-utils 命令成功完成。这是 Claude 代码解释器相较于 ChatGPT 的一个显著优势。
关键限制
尽管功能强大,但 Claude 的代码解释器有一个重要限制:上传和下载的最大文件大小为 30MB。相比之下,ChatGPT 的限制是 512MB。对于需要处理上百兆数据库文件的用户来说,这无疑是一个明显的短板。
实战测试
基础任务:分析数据库并生成图表
上传一个 21.9MB 的 SQLite 数据库文件,并要求 Claude 探索该数据库,生成一个包含所有表连接关系图的 PDF 文件。
模型成功完成了任务,不仅生成了 PDF,还提供了一个 PNG 格式的等效图片。虽然生成的连接图线条有些杂乱,难以追踪,但证明了该系统具备分析 SQLite 文件并生成可视化结果的能力。通过进一步的提示词优化,相信可以获得更理想的输出。
进阶挑战:复现复杂数据图表
为了测试其处理复杂任务的能力,我们尝试复现一张关于 AI 技术采用率的图表。任务提供了原始图表的截图和一份 XLSX 数据文件。
第一步:初步生成
Claude 编写并运行了一系列 Python 代码,生成了图表的初版。结果不错,但线条呈锯齿状,不够平滑。
第二步:平滑曲线
尝试让其绘制“六个调查周期的滚动平均值”,并要求“让线条不那么锯齿状”。模型最初误解了意图,尝试使用 scipy 进行数据处理,导致结果不符合预期。
第三-步:精确引导
通过更明确的提示:“我不是指渲染平滑,而是希望点与点之间是平滑的曲线,就像原始截图中那样”,模型最终理解了需求,并成功生成了平滑的曲线图。
第四步:细节修复
与之前在 ChatGPT 上遇到的问题类似,图表标题出现了重叠。通过提供带有问题的截图并给出修复指令,Claude 最终解决了这个问题,成功复现了目标图表。
整个过程虽然需要多次引导和修正,但最终证明了 Claude 代码解释器在数据可视化方面具备强大的实力。
安全风险分析
与完全无法访问互联网的 ChatGPT 代码解释器不同,Claude 的环境可以访问 GitHub、PyPI 等特定网站。这带来了潜在的提示词注入(Prompt Injection)风险。
Anthropic 在其帮助文档中也明确指出了这一点:
恶意行为者可能通过外部文件或网站暗中添加指令,诱使 Claude:
- 在沙箱环境中下载并运行不受信任的恶意代码。
- 从连接的知识源中读取敏感数据,并利用沙箱环境通过外部网络请求泄露这些数据。
这意味着 Claude 可能被诱骗,将其上下文中的信息(如提示、项目数据等)发送给恶意的第三方。
Anthropic 给出的缓解建议是“在使用该功能时密切监控 Claude 的行为”,这种将安全责任转移给用户的做法略显不足。尽管他们已经通过白名单限制了网络访问,但仅开放 github.com 就可能带来大量潜在的数据泄露途径。
因此,在使用此功能处理任何敏感数据时,用户应保持高度警惕。
👉 如果你需要 ChatGPT 代充 / Claude / Claude Code / 镜像 / 中转 API:
- 购买 / 了解更多:ai4.plus
- 备用入口:kk4099.com