文章 | AI小卖铺博客

K-12 教育者 ChatGPT 入门指南

本指南与 OpenAI 合作设计，旨在为 K-12 阶段的教育工作者提供在校园中有效使用 ChatGPT 的实用策略。核心学习内容通过本课程，您将系统地掌握以下关键知识与技能：深入理解 ChatGPT 工作原理学习 ChatGPT 的基础架构，全面了解其核心能力与技术局限性，从而更精准地判断其适用场景。践行安全与合乎伦理的 AI 应用掌握在教学活动中安全、负责任地使用 AI 的最佳实践，确保技术向善，辅助教学。掌握高效的提示词 (Prompt) 技巧获取一份详尽的提示词指南，学会如何通过精准提问，将 ChatGPT 应用于课程规划、教学材料制作等日常工作，显著提升效率。相关主题拓展除了基础入门，我们还建议关注以下议题，以构建更全面的 AI 认知：校园 AI 工具的应用与管理：探讨除 ChatGPT 外的其他 AI 工具，并制定在校内推广和管理 AI 的有效策略。 6-12 年级 AI 素养课程：为中学生设计专门的 AI 知识与技能普及课程。建立课堂 AI 使用规范：如何在课堂中为学生设定清晰的 AI 使用预期和规则。 👉 如果你需要 ChatGPT 代充 / Claude / Claude Code / 镜像 / 中转 API：购买 / 了解更多：ai4.plus 备用入口：kk4099.com

Google Gemini 全面评测：与自家生态深度融合的强大 AI 助手

Gemini 作为一款独立的 AI 聊天机器人表现出色，但其真正的价值在于附赠的云存储空间以及与几乎所有 Google 应用的深度集成。核心优势与不足优点极高的性价比：付费版直接附带 2TB 的 Google One 存储空间。强大的集成能力：与 Gmail、Docs、Chrome 等 Google 应用无缝协作，体验流畅。复杂的任务处理：擅长逻辑推理、文件处理和网络搜索。出色的多媒体功能：拥有强大的图像编辑和带音频的视频生成能力。缺点偶尔出现错误信息：与其他 AI 模型一样，回答的准确性并非 100%。深度研究的引用不便：信息溯源的体验有待提升。图像生成能力平平：相较于一些专注于图像生成的竞品，表现不够突出。 Gemini 是什么？ Gemini（前身为 Google Bard）是一款 AI 聊天机器人，你可以通过文本或语音与其交互，功能类似于 Microsoft Copilot 或 ChatGPT。它的应用场景非常广泛，包括但不限于：分析文档解答问题生成图片和视频研究课题撰写创意文案网络搜索解决数学问题你可以将 Gemini 视为一个高级的虚拟助手。对于开发者，Gemini 还提供了 Gemini Code Assist 和异步编码代理 Jules 等工具，能够帮助创建自定义 WordPress 插件或调试棘手的代码。相比于传统搜索引擎，使用 Gemini 进行提问和研究通常更高效，能为你节省大量筛选搜索结果的时间。但请务必牢记，所有 AI 聊天机器人都会犯错，Gemini 也不例外。对于严肃或重要的信息，务必通过可靠来源进行交叉验证。工作原理：Flash 与 Pro 模型 Gemini 的核心由大型语言模型（LLM）驱动，这些模型基于海量数据集训练的人工神经网络构建。这使得 Gemini 能够访问几乎所有主题的数据，并能连接互联网获取最新信息。 ...

Google Home 全新升级：为 Gemini AI 而生

由 Gemini for Home 驱动，全新改版的 Google Home 应用带来了更简洁的界面、更深度的 Nest 集成以及强大的自然语言控制能力。此次重构的核心目标有三个：更快、更可靠、更完整。性能为先：更快、更稳的全新基础我们深知，要提供卓越的 AI 新功能，应用本身必须快速而稳定。这是我们的首要任务。新版应用在性能上实现了显著飞跃：启动速度：大幅提升，在部分 Android 设备上，加载速度提升超过 70%。稳定性：Bug 数量显著减少，应用崩溃率相比几个月前降低了近 80%。资源优化：改进了电池消耗和内存使用情况。对于摄像头用户，体验提升同样明显：实时画面：加载速度加快 30%，播放失败率降低 40%。预览与回放：摄像头卡片预览可即时加载，滚动浏览历史记录的流畅度大幅提升，帧率提高了 6 倍以上。整个应用体验更具韧性、响应更灵敏。我们将持续关注性能优化，在未来几个月里，你将看到它变得越来越好。全面整合：告别 Nest，统一体验现在，你可以在全新的 Google Home 应用中找到 Nest 应用的全部精华功能，无需再切换应用。我们已将核心的 Nest 设备与功能完整迁移： Nest Thermostat：全面支持 2015 年以来所有型号的温控器，包括日程安排和热水加温等功能。 Nest Protect：支持烟雾和一氧化碳紧急警报。 Nest x Yale Lock：支持密码管理功能。即使是旧款的 Nest 摄像头和门铃，在新应用中的控制体验也变得更流畅、更快速。更高的帧率让用户在浏览事件时感觉更平滑，视频编码和处理的调整也帮助旧设备加载更快、更可靠。焕然一新：为 Gemini 设计的直观界面新版应用的界面设计更加直观，旨在让你能轻松触及 Gemini for Home 的强大能力。我们将其简化为三个核心标签页。 “家庭”标签页这里是你整个家的统一概览和控制中心。我们引入了全新的手势操作，让你单手操作更加流畅。你可以在“收藏”、“所有设备”和专用信息中心之间轻松滑动切换，无需离开当前标签页。 “活动”标签页这里是家中所有事件的统一历史记录中心，整合了来自第一方和第三方连接设备的所有动态。你还可以在这里找到“家庭简报”（Home Brief）功能，快速了解一天中发生的重要事件。 “日常程序”标签页此标签页顶部新增了一个轮播卡片，可以展示即将在你家中运行的自动化任务。对于高级用户，我们彻底重建了编辑器，在 iOS 和 Android 上都提供了快速的原生体验。这解锁了许多强大的新功能，例如创建一次性自动化任务，或使用新的条件触发器（如“仅当有人在家时运行”）。 ...

Gemini for Home：为智能家居 AI 新时代扩展平台

今天，是智能家居领域的关键时刻。我们正式向世界推出了 Gemini for Home——一项对家庭 AI 的颠覆性升级。它将取代音箱和智能显示器上的 Google Assistant，为摄像头赋予前所未有的智能，并全面革新 Google Home 应用。对于我们生态系统中的数万名开发者而言，这标志着一个充满机遇的新时代的开启。在 Google I/O 2025 大会上，我们分享了将 Gemini 引入 Home API 的计划。今天，我们朝着这一愿景迈出了坚实的下一步，通过两种关键方式扩展 Google Home 平台：首先，为您已经集成的设备启用由 Gemini 驱动的新功能；其次，推出全新合作项目，帮助您构建下一代 AI 摄像头。为所有智能家居设备带来 Gemini 升级一个真正实用的智能家庭，是所有设备无论品牌都能协同工作的家。通过我们的 “Works with Google Home” 计划，您已经通过 Google Home Cloud-to-Cloud API 和 Matter 将超过 8 亿台设备连接到我们的生态系统。今天，我们将 Gemini 的强大能力赋予所有这些设备。这是一次重大的平台升级，而其核心优势在于，您无需进行任何额外开发，即可让用户享受到核心的对话式控制功能。您的用户将能自动以更自然、更口语化的方式控制您的设备，并创建复杂的自动化流程。立即测试您现有的集成然而，Gemini 赋能的家居体验质量，直接取决于设备集成的质量。随着本月 Gemini for Home 开始向用户推送，我们强烈建议您立即对现有的 “Works with Google Home” 集成进行全面、严格的测试。确保无缝的用户体验是我们共同的首要任务，您的测试对于保证设备在新的对话能力下稳定运行至关重要。为了更好地支持您，我们将在今年晚些时候提供更完善的数据和工具，帮助您监控设备在 Google Home 平台上的性能和可靠性。构筑下一代 AI 摄像头我们相信 Gemini for Home 的力量不应局限于某个品牌、形态或价位。为了将 Gemini 的能力带给每一个人，我们将 “Works with Google Home” 计划提升到新的高度，通过引入一类新的合作伙伴设备，为客户提供更多选择。 ...

Gemini 2.5 Flash Image 正式发布：支持多种宽高比，可用于生产环境

我们先进的图像生成与编辑模型 Gemini 2.5 Flash Image 🍌 现已正式发布 (GA)，可用于生产环境。本次更新带来了多项新功能，包括支持更广泛的宽高比以及指定纯图像输出的能力。 Gemini 2.5 Flash Image 模型能够无缝融合多张图片、在创作中保持角色一致性、通过自然语言进行局部编辑，并利用 Gemini 强大的世界知识进行图像生成和修改。您可以通过 Google AI Studio 中的 Gemini API 或面向企业用户的 Vertex AI 平台来访问该模型。扩展创意边界：新增多种宽高比为了进一步释放创意潜力，新版模型现在支持 10 种不同的宽高比，让您能轻松为电影级横幅、社交媒体竖屏等不同格式创作内容。支持的宽高比包括：横向 (Landscape): 21:9, 16:9, 4:3, 3:2 方形 (Square): 1:1 纵向 (Portrait): 9:16, 3:4, 2:3 其他 (Flexible): 5:4, 4:5 API 与代码示例开发者可以立即开始使用 Gemini 2.5 Flash Image。通过 API，您可以轻松指定输出图像的宽高比，并设置为仅返回图像内容。以下是一个 Python 代码示例，演示了如何使用新功能： from google import genai from google.genai import types from PIL import Image # 初始化客户端 client = genai.Client() # 定义你的提示词 prompt = "请根据这张图片中的人物，创作一张 1980 年代风格的照片。照片需要捕捉到那个时代独特的时尚、发型和整体氛围。" # 打开本地图片 image = Image.open('/path/to/image.png') # 调用模型生成内容 response = client.models.generate_content( model="gemini-2.5-flash-image", contents=[prompt, image], generation_config=types.GenerationConfig( # 指定响应内容仅为图像 response_modalities=["IMAGE"], image_config=types.ImageConfig( # 设置图像宽高比为 16:9 aspect_ratio="16:9", ) ) ) # 处理并显示生成的图像 for part in response.parts: if part.inline_data is not None: generated_image = part.as_image() generated_image.show() 应用案例 Cartwheel：精准的角色姿态控制 Cartwheel 团队正利用 AI 赋予艺术家更直接的创作控制权。在开发其“姿态模式 (Pose Mode)”功能时，他们发现其他模型难以满足需求，最终在 Gemini 2.5 Flash Image 中找到了解决方案。通过将自家的 3D 姿态工具与 Gemini 2.5 Flash Image 相结合，他们创建了一个强大的图像生成系统，实现了前所未有的角色控制力与一致性。 ...

使用 Gemini 解锁多光谱数据的潜力

作为开发者，我们早已习惯与图像打交道，无论是构建宠物识别应用，还是进行产品分类和艺术创作。但大多数时候，我们都局限于一个由红 (Red)、绿 (Green)、蓝 (Blue) 构成的 RGB 世界——这正是我们的眼睛和相机感知世界的方式。然而，设想一下，如果能赋予你的应用“超人”般的视觉，让它能够看到人眼无法企及的波段，从而以全新的方式理解世界，将会怎样？这就是多光谱影像的力量。得益于 Google Gemini 模型原生的多模态能力，开发者现在可以前所未有地轻松利用这种数据。你不再需要训练专门的定制模型，可以直接上手分析复杂的卫星数据。什么是多光谱影像？一张标准的数码照片中，每个像素都由 R、G、B 三个值组成。而多光谱传感器则像一台超级相机，它不仅捕捉这三个波段，还能捕获电磁波谱中许多其他波段的数据，包括我们看不见的近红外 (NIR) 和短波红外 (SWIR) 等。这为何能改变游戏规则？植被健康监测：健康的植物会反射大量近红外光。通过分析 NIR 波段，你可以比仅凭一张绿色照片更精确地评估作物健康状况或监测森林砍伐。水体探测：水会吸收红外光，这使得我们可以轻松地将其与陆地区分开来，用于绘制洪泛区地图，甚至分析水质。火烧迹地识别：SWIR 波段能有效穿透烟雾，识别野火后新近烧毁的区域。物质识别：不同的矿物和人造材料具有独特的光谱“指纹”，使我们能够从太空中识别它们。过去，使用这些数据需要专业的工具、复杂的数据处理流程和定制的机器学习模型。而 Gemini 的出现彻底改变了这一局面，它允许你通过一种极其简单的方法，将其强大的推理能力应用于这些丰富的数据之上。核心方法：将不可见光映射为可见色像 Gemini 这样的大型多模态模型，是在海量的图像和文本数据集上预训练的。它能理解什么是“红色的汽车”或“绿色的森林”。让它理解多光谱数据的关键，就在于将我们关心的不可见波段映射到它已经理解的 R、G、B 通道上。我们通过创建一个“伪彩色合成”图像来实现这一点。我们的目的不是让图像看起来自然，而是将科学数据编码成模型可以处理的格式。整个过程分为三个简单的步骤：选择波段：根据你的具体问题，选择三个重要的光谱波段。归一化与映射：将每个波段的数据缩放到标准的 0-255 整数范围内，然后分别赋值给新图像的红、绿、蓝通道。结合上下文提示：将新创建的图像传递给 Gemini，并在提示 (Prompt) 中明确告知模型，图中的颜色分别代表什么。这最后一步是整个方法的精髓所在。你实际上是在实时地“教”模型如何解读你自定义的新图像。实例演示 Gemini 2.5 在遥感领域表现出色。例如，在处理用于土地覆盖分类的 EuroSat 数据集时，它能准确地将下图分别识别为“永久性作物”、“河流”和“工业区”。然而，在某些更具挑战性的场景中，仅凭 RGB 图像可能无法提供足够的信息。示例一：河流识别下面这张河流的图像，模型最初仅根据 RGB 信息会将其误判为“森林”。但是，当我们引入并构建了多光谱伪彩色图像，并辅以详细的提示词后，Gemini 2.5 成功地将其识别为“河流”。从它的推理轨迹可以看出，模型利用了多光谱输入，特别是归一化水体指数 (NDWI) 图像，才推断出这是水体。示例二：森林识别在另一个例子中，模型最初将下图这张森林的图像误判为“海洋湖泊”，其判断依据是图中的蓝绿色区域。当我们引入多光谱输入后，模型便能轻松地将其正确分类为“森林”。其推理轨迹同样表明，它在很大程度上利用了这些额外的信息。这些例子清晰地表明，额外的多光谱输入对于做出更准确的决策至关重要。更棒的是，由于整个过程无需更改模型本身，我们也可以用同样的方式添加其他类型的输入。 ...

重构 Devin：适配 Claude Sonnet 4.5 的经验与挑战

我们基于 Claude Sonnet 4.5 重构了 Devin。新版本的速度提升了 2 倍，在我们的初级开发人员评估中得分提高了 12%，现已在智能体预览版 (Agent Preview) 中可用。习惯旧版 Devin 的用户仍可继续使用。你可能会问，为什么不直接将新模型替换进去就草草了事，而要大费周章地进行重构？答案是，这个新模型的运作方式与众不同，它打破了我们对智能体架构的许多固有假设。 Devin 是一个能够自主规划、执行和迭代的智能体，而不仅仅是代码自动补全工具或编程助手。这种特性为我们提供了一个独特的窗口来观察模型的核心能力。每一次架构上的改进都会在 Devin 的反馈循环中产生复合效应，让我们能更深刻地理解模型的真正变化。与 Devin 正式发布时使用的 Sonnet 3.6 模型相比，Sonnet 4.5 带来了巨大的飞跃：规划性能提升了 18%，端到端评估得分提高了 12%，并且长达数小时的会话任务在速度和可靠性上都有了显著改善。为了实现这些提升，我们不仅需要围绕模型的新功能重构 Devin，还必须应对一些前几代模型中从未出现过的新行为。以下是我们观察到的一些关键点。模型能感知自身的上下文窗口 Sonnet 4.5 是我们见过的第一个能够感知自身上下文窗口的模型，这一特性深刻地影响了它的行为。我们观察到，当接近上下文长度限制时，模型会主动总结当前进展，并更果断地实施修复方案以尽快完成任务。这种“上下文焦虑”有时反而会损害性能：即使上下文空间还很充裕，模型也会因为认为自己即将“耗尽内存”而选择走捷径或不完整地结束任务。为了纠正这种行为，我们不得不采用相当激进的提示词工程。我们发现，仅在对话开始时给出提示是不够的，必须在提示词的开头和结尾都加入提醒，才能防止它过早地收尾。在研究解决方案时，我们意外发现了一个窍门：启用 100 万 Token 的 Beta 版本，但将实际使用上限限制在 20 万 Token。这样一来，模型会认为自己拥有充足的“跑道”，从而表现得更正常，避免了因“焦虑”而导致的性能下降和行为捷径。这一发现对我们如何设计上下文管理架构具有现实意义。现在，在规划 Token 预算时，我们必须把模型的自我感知也考虑进去：判断何时让它自然地进行总结，何时需要我们通过上下文压缩等手段进行干预。有趣的是，模型总是会低估自己剩余的 Token 数量，而且这种错误的估算还相当精确。模型热衷于做笔记 Sonnet 4.5 的一个显著变化是，它会通过查阅文档和动手实验，主动地构建关于问题领域的知识体系。自发撰写笔记在没有明确指令的情况下，模型会把文件系统当作自己的记忆体。它频繁地创建（或试图创建）总结和笔记文件（例如 CHANGELOG.md、SUMMARY.md），既是给用户看，也是为了自己将来参考。这表明该模型经过训练，倾向于将状态外部化，而不是单纯依赖上下文记忆。当接近上下文窗口末端时，这种行为会更加明显。起初，我们曾设想是否可以移除我们自己开发的内存管理系统，让模型自行处理。但在实践中，我们发现模型生成的总结不够全面，例如，它有时会转述任务，却遗漏了关键细节。当我们依赖模型的笔记而关闭我们自己的压缩和总结系统时，性能出现了下降，模型在特定知识上出现了断层——它不知道自己不知道什么（或者将来可能需要知道什么）。通过提示词工程，模型的笔记质量很可能会提高，但这并非一项开箱即用的完美功能。在某些情况下，我们甚至哭笑不得地发现，智能体花在写总结上的 Token 比解决问题本身还要多。我们还注意到，模型投入的精力并不均衡：上下文窗口越短，它生成的总结 Token 就越多。虽然这种行为在某些场景下有用，但当我们明确指示智能体使用我们系统先前生成的状态时，其效果不如我们现有的内存管理系统。这无疑是 Anthropic 公司探索的一个新方向，很可能预示着未来模型将更具上下文感知能力，并通过这种方式实现多智能体之间的通信。尽管强化学习训练尚未使这一功能完全可靠，但我们将持续关注其发展。 ...

Claude AI 的核心优势与应用场景解析

Claude AI 是由 Anthropic 公司开发的一款功能强大的人工智能聊天机器人。它能够处理从文本写作、内容分析到代码生成和技术问题解决等多种任务，尤其在建筑、工程和施工（AEC）等专业领域表现出色。 Claude 的核心优势在于其复杂的推理能力、强大的代码处理功能以及跨专业领域的深度内容生成。专业人士可以利用 Claude 进行项目方法论的头脑风暴、快速获取技术问题的答案，甚至分析图像和图表。它专为自然的、以解决问题为导向的对话而设计，能够高效完成总结长篇报告、编辑技术文档、辅助设计与项目决策等工作。用户可以通过网页和移动应用随时随地访问 Claude，无论是在办公室、施工现场还是差旅途中。尽管在许多方面与 ChatGPT 类似，但 Claude 拥有其独特的优势，尤其在高级问题解决和构建知识库方面更为突出。这使其成为 AEC 领域专业人士应对棘手技术难题、探索复杂规划或法规问题的得力助手。技术工作流中的应用：编程与集成 Claude 能够生成、调试和解释代码，这对于处理 BIM 数据、使用项目管理工具或实现报告自动化的专业人士非常有价值。结合 Cursor.so（AI 代码编辑器）和 Replit（在线集成开发环境）等工具，Claude 可以实现以下功能：代码优化：直接在编辑器中为现有函数提出改进建议或生成新函数。算法调试：调试和优化支撑工程模型的复杂算法。效率提升：提供样板代码，加速技术工作流的开发进程。代码解读：用通俗易懂的语言向团队中的非技术人员解释复杂的代码。与 ChatGPT 的比较得益于更新、更专业的训练数据，Claude 在某些编程应用中可能更具优势。它能够生成更准确的代码，理解更现代的编程框架，并提供详尽的技术解释。虽然 ChatGPT 仍然是一款强大的通用工具，但具体选择哪一个，最终取决于您项目所依赖的系统和编程语言。专业文档撰写与编辑在建筑项目的整个生命周期中，Claude 在起草和完善专业文档方面展现出巨大价值。内容生成：撰写项目案例研究、政策分析报告和专业技术文章。信息提炼：将复杂的建筑法规综合成可直接执行的行动指南。文档分析：深入分析规划文件和行业标准，并高亮显示关键要求。情景建模：模拟不同设计选择对项目风险、成本或交付周期的影响。 Claude 擅长关联跨学科问题，例如，分析可持续发展目标如何影响材料选择，或交通限制如何塑造住房交付策略。它能生成细致入微的分析结果，帮助项目团队预见挑战，避免代价高昂的失误。在文本编辑方面，Claude 能在不牺牲技术精度的前提下提升文档的清晰度和流畅性，确保最终文件专业、可信，可随时提交给客户或监管机构审查。特色功能：Artifacts 对于 AEC 领域的团队而言，Claude Artifacts 是一项杰出的功能。它能将代码、技术报告或数据表等复杂、庞大的输出内容显示在对话界面旁的一个独立窗口中，极大地方便了用户处理和管理这些信息。 Artifacts 功能的主要优势包括：清晰审阅：在整洁的界面中查看长篇技术输出，避免对话流被干扰。内容预览：直观地预览项目数据和可视化内容。便捷复用：轻松复制、编辑和复用生成的内容，并将其整合到项目工作流中。这一功能在协作撰写复杂文档或后续回顾项目细节时尤其有用。推动行业研发与创新 Claude 不仅是执行工具，也是研发创新的催化剂。工程和施工团队可以利用它：数据分析：分析海量数据集，识别潜在的风险或成本趋势。方案探索：在设计或交付阶段探索不同场景并检验各种假设。应用原型开发：快速构建由 AI 驱动的应用原型，以简化现有工作流程。凭借其卓越的推理和自然语言处理能力，Claude 成为了一个理想的协作伙伴，能够帮助团队应对跨越法规、技术和运营等多领域的复杂挑战。无论是分析环境影响、准备利益相关者演示文稿，还是对项目风险进行建模，Claude 都能帮助您化繁为简，在保证准确性的前提下，快速交付高质量成果。 ...

Grok 4 现已登陆微软 Azure AI Foundry

微软与 xAI 紧密合作，将其最先进的模型 Grok 4 引入 Azure AI Foundry 平台。这不仅为企业带来了强大的推理能力，更将其置于一个专为商业应用设计的、安全可控的平台之上。当今企业正进入 AI 采纳的新阶段，信任、灵活性和生产就绪不再是可选项，而是基础。本文将深入探讨 Grok 4 的独特之处，比较其与其它前沿模型的性能，并介绍开发者如何通过 Azure AI Foundry 访问它。 Grok 4 的核心优势 Grok 模型由 xAI 在其自家的 Colossus 超级计算机上训练而成。据 xAI 称，其庞大的计算基础设施使训练规模相较于 Grok 3 实现了十倍的飞跃。Grok 4 的架构也标志着一次重大转变，更加强调强化学习（RL）和多智能体系统，优先发展模型的推理能力而非传统的预训练，通过大量强化学习来优化其解决问题的能力。第一性原理推理：“思考模式” Grok 4 的一大亮点是其“第一性原理推理”能力。该模型尝试像科学家或侦探一样“思考”，将问题一步步分解。它并非直接给出答案，而是在内部进行逻辑推演并优化其响应。Grok 4 在数学（能解决竞赛级难题）、科学和人文学科问题上表现出色。早期用户反馈，它在处理逻辑谜题和细致推理方面优于某些现有模型，常常在其他模型感到困惑的地方找到正确答案。简而言ristmas，Grok 4 不仅仅是回忆信息，它能主动地对问题进行推理。这种对逻辑一致性的关注，使其在需要分步解答的场景中（如研究分析、辅导或复杂故障排查）极具吸引力。示例提示：假设火星上没有任何现有基础设施，请从第一性原理出发，解释你将如何发电。你需要考虑哪些基本资源、限制条件和物理定律？超长上下文窗口：轻松处理海量信息 Grok 4 最令人印象深刻的技术特性之一是其处理超大上下文的能力。该模型拥有 128K Token 的上下文窗口，能够一次性处理和记忆海量文本。这意味着 Grok 4 可以消化大量文档、长篇研究论文甚至大型代码库，并在推理时不会因截断而遗忘早期内容。这在以下场景中尤为实用：文档分析：你可以输入数百页的文档，让 Grok 进行总结、查找矛盾或回答特定问题。相比其他模型，Grok 4 因上下文窗口不足而错过细节的可能性要小得多。研究与学术：加载整期学术期刊或长篇历史文献，让 Grok 进行分析或跨全文回答问题。例如，它可以读完莎士比亚的所有剧作，并回答一个需要关联多部作品信息的问题。代码仓库：开发者可以输入整个代码仓库或多个文件（可达数百万字符），让 Grok 4 查找特定函数的定义位置，或检测跨代码库的错误。这对于理解大型遗留项目非常有帮助。 xAI 声称这不仅是“记忆”，更是“智能记忆”。Grok 能够智能地压缩或优先处理长输入中的信息，更牢固地记住关键部分。对开发者而言，这意味着可以一次性向 Grok 4 输入大量信息，它能在响应时将所有内容“尽在掌握”，减少了手动切分文档或管理上下文碎片的麻烦。 ...

Claude 4 提示工程最佳实践

本指南为 Claude 4 系列模型（Opus 4.1、Opus 4、Sonnet 4.5 及 Sonnet 4）提供了专业的提示工程技术，旨在帮助您在应用中获得最佳效果。与前代模型相比，这些模型经过训练，能够更精确地遵循指令。通用原则明确给出指令 Claude 4 模型对清晰、明确的指令响应良好。具体说明您期望的输出有助于提升结果质量。如果您希望 Claude 4 表现出超越基础指令的“额外”行为，需要更明确地提出这些要求。示例：创建分析仪表盘效果欠佳的提示：创建一个分析仪表盘。效果更佳的提示：创建一个分析仪表盘。请包含尽可能多的相关功能和交互。超越基础要求，实现一个功能完备的版本。补充上下文以提升性能在指令背后提供上下文或动机，例如向 Claude 解释为何某种行为很重要，可以帮助 Claude 4 模型更好地理解您的目标，并给出更有针对性的回应。示例：格式偏好效果欠佳的提示：绝不要使用省略号。效果更佳的提示：你的回答将由文本转语音引擎朗读，所以绝不要使用省略号，因为引擎不知道如何发音。 Claude 能够从这类解释中进行泛化学习。审慎使用示例与细节 Claude 4 模型在精确遵循指令时，会密切关注提示中的细节和示例。请确保您提供的示例与您希望鼓励的行为一致，并尽量减少您希望避免的行为。长程推理与状态追踪 Claude Sonnet 4.5 在长程推理任务中表现出色，具备卓越的状态追踪能力。它通过专注于增量式推进（一次稳步推进几件事，而非试图一次性完成所有事）来在长时间的会话中保持方向感。这种能力在跨越多个上下文窗口或任务迭代时尤为突出，Claude 可以在一个复杂的任务上工作，保存状态，然后在新的上下文窗口中继续。上下文感知与多窗口工作流 Claude Sonnet 4.5 具备上下文感知能力，能够在整个对话过程中追踪其剩余的上下文窗口（即“Token 预算”）。这使 Claude 能够通过了解可用空间来更有效地执行任务和管理上下文。管理上下文限制如果您在 Agent 框架中使用 Claude，该框架会压缩上下文或允许将上下文保存到外部文件，建议您将此信息添加到提示中，以便 Claude 采取相应行动。否则，当接近上下文限制时，Claude 可能会尝试自然地结束工作。以下是一个示例提示：你的上下文窗口在接近限制时会自动被压缩，让你能从中断的地方无限期地继续工作。因此，不要因为 Token 预算问题而提前停止任务。当接近 Token 预算限制时，在上下文窗口刷新前，将你当前的进展和状态保存到内存中。始终保持尽可能的持久和自主，并完整地完成任务，即使预算即将用尽。无论上下文剩余多少，都不要人为地提前停止任何任务。多上下文窗口工作流的最佳实践对于跨越多个上下文窗口的任务，请遵循以下建议： ...