Gemini 近期功能更新速览

个性化与协作 自定义 Gem 现已支持分享(2025 年 9 月 18 日) 现在,您可以与朋友、家人和同事分享您创建的 Gem。Gem 是一种自定义 Gemini 以实现特定目标的便捷方式,能帮助您在处理重复性任务时,无需每次都重新输入冗长的提示词和背景信息。 您可以将精心调校的 Gem 变成一个共享资源,帮助他人节省时间,更轻松地开始使用。例如,分享您的“每周膳食规划”Gem 来给朋友提供灵感,或是在家人出发前将您的“假期规划”Gem 发送给他们。 如何分享: 在网页端打开 Gem 管理器,点击您创建的任一 Gem 旁的“分享”按钮即可。分享方式与 Google Drive 文件共享类似,您可以精确控制谁有权查看或编辑您的 Gem。 创意工具升级 通过提示词重塑你的照片(2025 年 8 月 26 日) 我们推出了最新的图像生成和编辑模型,将您的创意提升到全新水平。新模型能更好地遵循您的指令,让您更轻松地获得理想效果。 您可以上传多张图片来组合概念、借鉴创意元素或融合场景,创造出独一无二的作品。此外,当您使用自拍时,Gemini 能更好地保持您的相貌特征一致,让您在任何想象的冒险中担当主角。我们希望通过此次更新,为您提供更精确的控制和更强大的表达方式。 Canvas 创作功能全面增强(2025 年 5 月 20 日) Canvas 现已推出全新的创作方式。通过新增的 Create 菜单,您可以轻松地将文本转化为各种动态内容: 自定义网页 可视化信息图表 互动式测验 沉浸式音频概览 您还可以直接描述想要创建的应用,Gemini 会生成代码来构建一个可用的原型,并与您协作进行后续的定制和修改。 此外,Canvas 中的 Vibe 编码应用也得到了改进。现在,只需几句提示,您就可以构建功能齐全的个性化应用。这些应用能够: 调用 Gemini 的功能 在不同会话间保存数据 在多用户间共享数据 将快捷方式保存到手机主屏幕 当应用出现错误时,Canvas 会自动尝试为您解决 我们致力于让您专注于创意构想,而将生成、编辑和修复等繁重工作交给 Gemini。 ...

September 19, 2025 · AI小卖铺

探索 ChatGPT 诗歌翻译的最佳实践

机器翻译(MT)在处理文学作品,尤其是诗歌翻译方面,一直面临着巨大挑战。近年来,以 ChatGPT 为代表的大语言模型(LLM)为这一领域带来了创新的可能性。一项研究深入探讨了 ChatGPT 在英汉诗歌翻译任务中的能力,并通过特定设计的提示(Prompt)和少样本场景来探寻其最佳性能。 ChatGPT 诗歌翻译的挑战 研究发现,尽管 ChatGPT 在诗歌翻译方面展现出了一定的潜力,但其生成的译文仍存在一些亟待解决的顽固问题。这些问题促使研究人员探索更优化的翻译方法。 创新方法:解释辅助诗歌机器翻译 (EAPMT) 为了克服现有方法的局限性,研究团队提出了一种名为**解释辅助诗歌机器翻译(Explanation-Assisted Poetry Machine Translation, EAPMT)**的新方法。 该方法的核心思想是: 在翻译过程中,引入对源语言诗歌的单语解释作为引导信息,帮助模型更深刻地理解诗歌的内涵、意象和情感,从而生成更高质量的译文。 简单来说,不是直接命令“翻译这首诗”,而是先让模型生成对这首诗的解读,再基于这份解读进行翻译。 评估体系与实验结果 为了科学地评估翻译效果,研究团队不仅改进了现有的评估标准,使其更适应现代诗歌翻译的复杂性和细微差异,还采用了双重评估体系: 人类专家评估:邀请专业诗人组成评审小组,对翻译结果进行专业评估。 机器辅助评估:使用 GPT-4 对译文进行补充评估。 实验结果清晰地表明,无论是人类专家还是机器模型的评估,EAPMT 方法的表现均优于: 传统的 ChatGPT 直接翻译方法 现有的主流在线翻译系统 结论与贡献 这项研究成功验证了 EAPMT 方法的有效性,证明了通过引入“解释”这一中间步骤,可以显著提升大语言模型在诗歌翻译等复杂文学任务上的表现。它为机器辅助文学翻译领域提供了一个富有启发性的新视角。 👉 如果你需要 ChatGPT 代充 / Claude / Claude Code / 镜像 / 中转 API: 购买 / 了解更多:ai4.plus 备用入口:kk4099.com

September 18, 2025 · AI小卖铺

Claude:您的智能思维伙伴

Claude 是一款强大的人工智能助手,旨在成为您的思维伙伴,帮助您应对各种复杂和艰巨的挑战。无论您是需要进行创意写作、学习新知识还是编写代码,Claude 都能提供专业级的协作支持。 Claude 的核心能力 Claude 能够处理广泛的任务,从创意构思到深度分析,以下是其部分核心应用场景。 写作与创意 头脑风暴:探索新颖的创意和想法。 风格优化:改进您的写作风格,或为特定受众打造独特的行文风格。 专业文案:撰写商业计划书、项目申请报告、视频脚本等专业文档。 学习与研究 化繁为简:用通俗易懂的方式解释复杂的概念和主题。 梳理思路:帮助您整理和理解零散的想法与信息。 备考助手:为您准备考试或面试提供支持,例如生成学习指南、模拟问答等。 数据分析:对上传的文档或数据进行分析和解读。 编程与开发 概念解释:清晰地解释各种编程概念。 代码审查:检查您的代码并提供优化建议。 结对编程:与您一同协作,共同完成代码编写任务。 协同工作,简化复杂性 Claude 的设计理念是与您协同工作,它能够在您的想法基础上进行扩展,完善您的逻辑,并逐步简化复杂的问题。 分解问题:将庞大复杂的问题拆解成一个个更易于管理的小步骤。 专家级协作:在您需要完成的关键任务上提供专业支持,无论是开发新产品还是进行关键数据分析。 探索未知:如同您口袋中的专家,与 Claude 协作能够极大地拓展您个人或团队的创造边界。 应用实例:从课程材料生成学习指南 以下示例展示了如何通过提供课程材料,让 Claude 创建一份全面的学习指南。 用户需求 提示词: 请根据我提供的课程材料,设计一份全面的学习指南,包括内容摘要、练习题和记忆辅助工具。 附件: 学习笔记.docx (4MB) 心理学导论教学大纲.pdf (1.2MB) Claude 生成的输出 《心理学导论》综合学习指南 目录 课程概览 第一讲:心理学是什么? 第二讲:研究方法 练习题 学习策略 课程概览 上课时间:周一、周三、周五 10:10-11:00,实验课周二 14:00-16:50 答疑时间:周二 13:00-15:00,周四 11:00-13:00 重要日期: 2月21日:期中考试(一) 3月7日:文献评述截止 4月4日:期中考试(二) 5月12日:期末考试 (8:00-11:00) 成绩构成: 期中考试(一):20% 期中考试(二):20% 期末考试:30% 研究参与:10% 实验作业与测验:10% 课堂参与:5% 文献评述:5% 第一讲:心理学是什么? 核心定义 心理学 = 对行为和心理过程的科学研究。 作为一门科学的主要特征 采用实证方法(观察与实验)。 旨在描述、解释、预测和控制行为。 基于系统性研究建立理论。 遵循科学方法论原则。 历史沿革 哲学溯源 (古代 - 19世纪) 古希腊:心物问题。 柏拉图:心身二元论(心灵与身体分离)。 亚里士多德:心身一元论(心灵与身体相连)。 近代哲学家:勒内·笛卡尔(笛卡尔二元论)、约翰·洛克(经验主义与“白板说”)。 科学心理学的诞生 (1879年) 威廉·冯特在德国莱比锡建立第一个心理学实验室。 引入内省法作为研究方法。 构造主义:将意识分解为基本元素。 早期流派 机能主义 (威廉·詹姆斯, G. 斯坦利·霍尔):关注心理过程的目的和适应性,提出“意识流”概念。 行为主义 (约翰·华生, B.F. 斯金纳):主张只研究可观察的行为,反对内省法和对意识的研究。 格式塔心理学 (马科斯·韦特海默, 沃尔夫冈·苛勒):核心原则是“整体大于部分之和”,强调知觉和问题解决。 精神分析 (西格蒙德·弗洛伊德):关注无意识对行为的驱动作用,采用梦境分析、自由联想等方法,提出防御机制、性心理发展等概念。 现代心理学视角 生物学视角:关注大脑结构与功能、神经递质、激素、遗传及演化影响。 认知视角:研究思维、记忆、知觉等心理过程,运用信息加工模型。 行为视角:通过条件反射进行学习,强调环境影响和行为矫正。 人本主义视角:强调人的潜能、自我实现、自由意志和个人选择(卡尔·罗杰斯:无条件积极关注;亚伯拉罕·马斯洛:需求层次理论)。 心理动力学视角:关注无意识动机和童年经历。 社会文化视角:研究文化对行为的影响、社会学习和跨文化心理学。 主要分支领域 基础研究领域:实验心理学、发展心理学、社会心理学、人格心理学、生理心理学等。 应用领域:临床心理学、咨询心理学、教育心理学、工业与组织心理学等。 跨平台使用 您可以在不同设备上使用 Claude,以适应您的工作流程。 ...

September 17, 2025 · AI小卖铺

透视 ChatGPT 与 AI 的未来:机遇、挑战与社会影响

人工智能(AI)正以前所未有的速度渗透到社会的各个角落。从科技巨头的巨额投资到普通人的日常生活,AI 正在重塑我们的经济结构、人际关系乃至精神世界。 科技巨头的万亿级竞赛 为了在 AI 领域占据领先地位,各大科技公司正在进行一场豪赌。据统计,亚马逊、微软、谷歌、Meta 和 OpenAI 计划在今年年底前,在 AI 领域的总投资额将至少达到 3250 亿美元。这场竞赛的核心目标是构建更强大的通用人工智能,并将其整合到各自的生态系统中。 OpenAI 的治理与成本难题 作为行业的焦点,OpenAI 的内部治理和财务状况备受关注。这家初创公司正面临巨大的运营成本压力,同时也在积极推进其组织架构的重组。 近期,OpenAI 与其最大投资者微软达成了一项关于未来治理的初步协议。此外,公司计划将其价值 1000 亿美元的股份授予管理它的非营利组织,以平衡其商业目标与创建安全通用人工智能的初衷。 AI 融入社会:从职场到心灵 AI 的影响力远不止于科技行业内部,它正深刻地改变着社会结构和个人生活。 就业市场的结构性变迁 过去,长期失业人群主要集中在非大学毕业生中。然而,这一趋势正在改变。如今,越来越多的大学毕业生也开始面临长期失业的困境,这反映了 AI 对知识型工作岗位带来的冲击。 新兴应用场景:财务顾问与精神导师 人们正在以超乎想象的方式使用生成式 AI 聊天机器人: 财务咨询:越来越多的人向 ChatGPT 等工具寻求财务建议,内容涵盖债务管理、储蓄策略乃至股票推荐。 精神慰藉:数百万人正在使用 AI 聊天机器人来忏悔内心最深处的秘密,并寻求精神指引。一些用户甚至会发出这样的疑问:“我是在和真正的上帝对话吗?” 人机关系的危险边界 随着我们与 AI 的互动日益频繁和深入,人机关系的界限也变得愈发模糊。一些观察指出,人们可能会陷入与 AI 的“螺旋式关系”中,这种紧密甚至危险的互动模式,其长期影响值得我们警惕和深思。 存在主义的警示:AI 末日论 在 AI 飞速发展的同时,一股强烈的担忧情绪也在蔓延。 “末日先知”的疾呼 AI 研究者埃利泽·尤德科夫斯基(Eliezer Yudkowsky)在过去二十年里,一直在向 AI 圈内人士警告其潜在的危险。如今,他选择走向公众,公开呼吁应全面暂停 AI 的开发,以避免可能到来的灾难性后果。 技术范式的转移 AI 的崛起也引发了关于未来科技形态的讨论。有人提出,我们是否已经度过了“iPhone 的巅峰时代”?正如评论所言:“对于口袋里的那块玻璃矩形,你的重新设计空间已经非常有限了。” 这或许预示着,科技创新的重心正在从硬件形态转向由 AI 驱动的智能体验。 👉 如果你需要 ChatGPT 代充 / Claude / Claude Code / 镜像 / 中转 API: ...

September 16, 2025 · AI小卖铺

深入解析 PDF 文件结构

我们通常将 PDF (Portable Document Format) 视为一种“所见即所得”的文档格式,但其内部结构远比表面看起来要复杂。一个 PDF 文件并非简单的文本流,而是一个由多个对象组成的、结构化的数据库。当我们用文本编辑器打开一个 PDF 文件时,看到的往往是大量看似乱码的字符和一些特定关键词,这正是 PDF 文件的源代码。 本文将以一段 PDF 文件原始内容为例,深入剖析其内部构造。 PDF 文件的四大组成部分 一个标准的 PDF 文件通常由四个部分顺序组成: 文件头 (Header):文件的第一行,用于声明 PDF 的版本。 文件体 (Body):包含文档所有数据的核心部分,由一系列对象 (Objects) 组成。 交叉引用表 (Cross-Reference Table):记录每个对象在文件中的字节偏移量,实现对对象的快速随机访问。 文件尾 (Trailer):提供查找交叉引用表和关键对象(如文档目录)的入口点。 1. 文件头 (Header) 文件头非常简单,就是文件的第一行,格式为 %PDF-X.Y,其中 X.Y 代表 PDF 规范的版本号。 %PDF-1.7 这行代码明确指出该文件遵循 PDF 1.7 版本的规范。% 符号在 PDF 中通常表示注释,但文件头是唯一的例外。 2. 文件体 (Body) 文件体是 PDF 的核心,由一系列间接对象 (Indirect Objects) 构成。每个对象都有一个唯一的对象编号 (Object Number) 和一个生成号 (Generation Number),通常为 0。 一个典型的对象定义格式如下: <对象编号> <生成号> obj ... 对象内容 ... endobj 例如,示例中的 1 0 obj 和 3 0 obj 都是对象定义: ...

September 16, 2025 · AI小卖铺

从 Anthropic Claude 3.5 Sonnet 迁移至 Amazon Bedrock 上的 Claude 4 Sonnet

Anthropic 的 Claude 4 Sonnet 模型现已在 Amazon Bedrock 上线,标志着基础模型能力的又一次重要飞跃。与此同时,Anthropic 也公布了 Claude 3.5 Sonnet(v1 和 v2)的弃用时间表。这一演进为生产环境中的 AI 应用带来了双重任务:既是把握模型性能提升的机遇,也是在旧模型弃用前完成迁移的必要操作。 组织应将模型迁移视为其 AI 推理战略的核心组成部分,因为糟糕的迁移执行可能导致服务中断、性能下降和成本超支。本文旨在提供一个系统性的方法,指导您在 Amazon Bedrock 上从 Anthropic Claude 3.5 Sonnet 平滑迁移至 Claude 4 Sonnet。我们将深入探讨关键的模型差异,剖析核心的迁移注意事项,并分享经过验证的最佳实践,助您将这次必要的过渡转变为推动业务价值的战略优势。 模型差异概览 规划成功迁移的第一步是理解模型版本之间的具体变化。从 Claude 3.5 Sonnet 迁移到 Claude 4 Sonnet,带来了以下几项关键的能力和行为转变: 更长的上下文窗口:Claude 4 Sonnet 将上下文窗口从 20 万 token 扩展到了 100 万 token(测试版)。这使得应用程序可以在单个提示中处理和推理整个代码库、财务报告或冗长的法律文件,从而简化复杂的工作流。 原生推理机制:Claude 3.5 Sonnet 模型依赖于思维链(CoT)提示技术,而 Claude 4 模型引入了内置的、可通过 API 启用的推理功能,如扩展思维(extended thinking)和交错思维(interleaved thinking)。这些功能给予模型在回答前专用的计算时间进行推理,显著提升了其在复杂问题上的表现。 更强的工具使用能力:Claude 4 Sonnet 模型极大地增强了工具使用能力。它能够并行执行多个工具,并在工具调用之间利用扩展思维,与旧模型顺序使用工具的方式相比,可以实现更复杂、更高效的智能体工作流。 迁移前的准备工作 在开始使用 Claude 4 Sonnet 模型之前,您必须在 Amazon Bedrock 中启用对这些模型的访问权限。 ...

September 16, 2025 · AI小卖铺

在 iPhone 上配合 Apple 智能使用 ChatGPT

Apple Intelligence 引入了与 ChatGPT 的系统级集成,让用户可以在 iPhone 上直接利用 OpenAI 的先进模型能力。当系统原生功能无法满足需求时,你可以选择调用 ChatGPT 来处理更复杂的任务。 通过这项集成,你可以在以下场景中利用 ChatGPT: Siri 增强:当 Siri 遇到它无法直接回答的请求时(例如涉及复杂文档或照片内容的问题),可以请求 ChatGPT 协助生成答案。 写作工具:在系统的“写作工具”中,你可以直接调用 ChatGPT,仅通过简单的描述来创作全新的文本或图像。 视觉智能:通过相机或照片中的视觉智能功能,你可以调用 ChatGPT 来深入了解眼前的地点或物体。 使用前须知 在开始使用之前,请确保你满足以下条件: 设备型号:iPhone 15 Pro、iPhone 15 Pro Max 或更新机型。 系统版本:iOS 18.1 或更高版本。 功能开启:已在系统中启用 Apple Intelligence。 年龄限制:用户必须年满 13 周岁,或达到所在国家或地区使用 ChatGPT 的最低年龄要求。 地区可用性:请注意,Apple Intelligence 功能的可用性受地区限制。 如何启用 ChatGPT 集成 你可以在首次通过 Siri 或写作工具等功能调用 ChatGPT 时,根据弹出的提示启用该集成。此外,你也可以随时通过“设置”手动进行配置。 打开设置 App,向下滚动并选择 Apple 智能与 Siri。 点击 ChatGPT,然后轻点 设置。 根据你的需求选择以下一种方式: 不绑定账户使用:直接轻点 启用 ChatGPT。即使没有 OpenAI 账户,你也可以免费使用该功能。 绑定现有账户使用:轻点 配合账户使用 ChatGPT,然后按照屏幕提示登录你的免费或付费 OpenAI 账户。绑定付费账户可以享受更高级的 ChatGPT 功能和更高的使用频率。 提示:如果你希望将请求历史保存到 ChatGPT 账户中,必须选择登录现有账户。 ...

September 16, 2025 · AI小卖铺

Gemini 图像编辑新功能:10 个创意实例展示

Gemini 应用现已集成来自 Google DeepMind 的全新图像生成与编辑模型,为用户开启了创意编辑的无限可能。这项更新让你能够更精准地控制图像生成,创作出理想的画面。 新模型的核心能力包括: 保持主体一致性:在多次编辑中,能够保持人物或宠物的形象特征不变。 融合多张照片:将不同的照片无缝地融合在一起。 精确局部修改:在修改图像特定部分的同时,完好地保留其余部分的原始细节。 应用对象风格:将一张图片中某个物体的风格迁移到另一张图片的对象上。 为了给你一些灵感,以下展示了新模型能够实现的 10 个具体示例及其提示词 (Prompt)。 1. 将宠物变为 16 位游戏角色 将这只猫重新创作成一个 16 位视频游戏角色,并将其置于一个 2D 16 位平台跳跃游戏的关卡中。 2. 与童年的自己合影 这是一张我成年后的照片。请创作一张我成年后与童年的自己一起坐在游戏室里开茶会的照片。 3. 将照片转换为奇幻游戏地图 将这张照片转换成一张风格化的奇幻游戏 3D 世界地图,地图中要包含一个村庄和港口。 4. 转换为铅笔素描画 将这张照片变成一幅铅笔素描画。 5. 将食材变为米其林级甜点 以这些食材为灵感,将它们变成一道外观精致、看起来美味可口的甜点。请像五星级前卫餐厅的菜肴一样进行摆盘。 6. 将日常物品拟人化 将这把剪刀变成一个外形逼真的奇幻角色,用于一部关于精灵和仙女的电影。 7. 生成宠物的 3D 模型 为这只狗创建一个外观逼真的小型 3D 模型。将模型放在一张书桌上,旁边放着生日礼物包装,看起来像是有人刚拆开礼物得到了这个模型。 8. 用图像讲述系列故事 请用 9 张图片,为这两位主角创作一个由 9 部分组成的、引人入胜的史诗故事,讲述他们作为秘密超级英雄的冒险经历。整个故事要惊心动魄,情感跌宕起伏,并以一个精彩的反转和高潮结尾。图片上不要包含任何文字,仅通过图像本身来讲述故事。 9. 替换物体材质 将这个人的连衣裙材质换成网球。 10. 改变建筑风格 将这栋房子改造成充满活力的热带岛屿风格。用茅草替换屋顶,并添加竹制结构元素。在房子周围布置上茂盛、色彩鲜艳的热带植物和棕榈树。 现在,你可以在 Gemini 应用中亲自体验这些强大的图像编辑新功能。 👉 如果你需要 ChatGPT 代充 / Claude / Claude Code / 镜像 / 中转 API: 购买 / 了解更多:ai4.plus 备用入口:kk4099.com

September 15, 2025 · AI小卖铺

Claude Code 完全上手指南与最佳实践

Claude 是由 Anthropic 开发的一款人工智能助手,旨在为人类的长远福祉服务。用户可以通过网页聊天、桌面/移动应用以及 API 与 Claude 交互。它在编码、研究、写作、客户支持和 AI 智能体开发等领域展现出强大的能力,其 Claude Opus 和 Claude Sonnet 等模型始终致力于安全、可靠、负责任的 AI 发展。 什么是 Claude Code? Claude Code 是一款在终端中运行的智能体编码工具。它能深入理解你的代码库,通过自然语言命令帮助你更快地编程。通过与开发环境的直接集成,Claude Code 极大地简化了工作流程,无需额外的服务器或复杂的配置。 它的核心特性包括: 终端原生集成:直接在你的终端里运行,理解项目上下文并执行实际操作。 强大的多文件处理能力:能够理解代码库和依赖关系,执行复杂的跨文件编辑。 企业级集成:可与 Amazon Bedrock 或 Google Vertex AI 无缝对接,确保部署的安全与合规。 Git 工作流管理:能够读取 issue、编写代码、运行测试并提交 PR——所有操作均在终端内完成。 处理复杂任务的能力:擅长应对复杂的架构决策、棘手的错误修复以及多步骤的实现任务。 颠覆性时刻:一种全新的 AI 编码范式 初次体验 Claude Code 时,我感受到了前所未有的冲击。这项技术及其背后的工作机制,将从根本上改变一切。 大多数 AI 编码工具都离不开“复制粘贴”式的工作流,而 Claude Code 引入了一种截然不同的范式:你只需设定任务、实时监控和引导其进展,最后审查完成的工作即可。AI 的环境与你的开发环境真正融为了一体,不再需要手动在两者之间来回传递信息。 作为一名在产品设计、发明和人机交互(HCI)领域的实践者,我当时只有一个问题:它的可靠性究竟如何? 为了找到答案,我决定用一个真实项目进行测试。我的团队开发了几个用于功能和主题化的定制框架,让 Claude 在一个全新的框架内开发功能,无疑是检验其能力的绝佳试炼场。 起初,它的表现令人兴奋。它用复选框清晰地列出了行动计划,实时沟通进展,并在创建或编辑文件前征求许可。然而,当我尝试编译它生成的代码时,Android Studio 抛出了一系列错误。 我非但没有因这些错误而气馁,反而感到既好奇又兴奋。如果我能让它成功遵循指令,那我就挖到宝了——我将可以自动化生成功能和主题。 在初次失败后,我开始迭代优化项目中的 CLAUDE.md 文件。我将其细化为几个核心模块:任务上下文、规则、编号步骤和示例。经过这样的精确引导,Claude 最终成功完成了任务。这个过程为后来沉淀出的许多 Claude Code 最佳实践和优化技巧奠定了基础。 ...

September 14, 2025 · AI小卖铺

如何将 Claude Code 打造成领域专用编码助手

编码助手在处理流行库时表现出色,因为大语言模型(LLM)在这些库上经过了大量训练。但一旦面对自定义库、新版库、内部 API 或小众框架,它们往往力不从心。这对于使用特定领域库或企业代码的团队来说是个大问题。 作为 LangGraph 和 LangChain 等库的开发者,我们非常希望能让编码助手高效地编写相关的代码。为此,我们尝试了多种上下文工程技术,并总结了其中的成败经验。 我们的核心发现是:高质量的精炼信息,结合按需获取更多细节的工具,能产生最佳效果。 简单地让智能体访问原始文档,效果并不如预期,反而会更快地占满上下文窗口。一个以 Claude.md 形式存在的、结构清晰的简明指南,其表现始终优于直接接入文档工具。而最佳方案是将两者结合:让智能体拥有基础知识(通过 Claude.md),同时也能在需要时查询文档的具体部分。 本文将分享: 我们测试的几种 Claude Code 配置方案。 用于评估生成代码的评测框架(你可以复用此模板)。 实验结果与核心要点。 Claude Code 测试配置 为保证一致性,我们统一使用 Claude 4 Sonnet 模型,并测试了以下四种不同的配置: Claude 原生版 (Claude Vanilla):未经任何修改的开箱即用版本。 Claude + MCP:连接到我们自建的 MCPDoc 服务器,使其具备文档访问能力。 Claude + Claude.md:提供一个详细的 Claude.md 文件,其中包含针对 LangGraph 的专门指导。 Claude + MCP + Claude.md:同时提供 Claude.md 指南和 MCPDoc 服务器的访问权限。 MCP 文档访问工具 我们构建了 MCPDoc 服务器,旨在让编码助手能够访问任何库的文档。这是一个开源的 MCP 服务器,提供了两个工具:list_doc_sources 和 fetch_docs。前者用于列出可用的文档源文件(llms.txt),后者则用于读取指定文件的内容。 在我们的实验中,我们提供了 LangGraph 和 LangChain 的 Python 及 JavaScript 文档。你可以通过在 MCP 配置中传入自己库的 llms.txt 文件 URL,轻松地将其应用于你的场景。 ...

September 13, 2025 · AI小卖铺