欢迎来到AI小卖铺博客

每天分享人工智能资讯、技术教程和工具。

Gemini 功能更新：2025 年 10 月

本月，Gemini 应用迎来多项功能升级，涵盖视频生成、模型优化、演示文稿创建等多个方面。以下是本次更新的重点内容： Veo 3.1：视频生成能力再上新阶借助 Veo 3.1 模型，您现在可以生成效果更出色的视频，主要提升包括：逼真纹理：视频画面质感更加真实。镜头控制：更便捷地控制视频的镜头运动。音效对话：支持在视频中生成带音效的对话。 Gemini 2.5 Flash：更智能的响应与理解 Gemini 2.5 Flash 模型也获得了更新，旨在提供更优质的交互体验：分步指导：能为复杂主题提供清晰的步骤化指引。结构化回复：生成的答复更有条理，易于阅读。图像理解增强：提升了对笔记、图表等内容的图像理解能力。 Canvas 智能生成演示文稿现在，您可以在 Canvas 中快速创建演示文稿。只需提供一个主题或上传源文件，Gemini 就能自动生成一套完整的幻灯片，其中包含匹配的主题和相关的图片。完成初步生成后，您可以轻松将文件导出至 Google Slides 进行最终编辑。注意：此功能已向 Pro 订阅用户推送，并将在未来几周内向免费用户开放。 Web 端 LaTeX 渲染优化网页版 Gemini 改进了对 LaTeX 公式的渲染和处理，现在您可以：轻松复制数学公式。在 Canvas 中直接编辑公式。将包含公式的内容下载为精美的 PDF 文件。登陆 Google TV：化身语音助手 Gemini 现已集成至 Google TV，带来全新的客厅娱乐体验：语音助手：作为您的对话式语音助手，帮助您快速找到想看的电视节目。视频问答：当您提出问题时，Gemini 可以调用 YouTube 视频来提供更直观、更丰富的解答。 👉 如果你需要 ChatGPT 代充 / Claude / Claude Code / 镜像 / 中转 API： ...

ChatGPT 能审查合同吗？优势、风险与专业工具对比

人工智能正在深刻改变法律行业的合同处理方式，它简化了审查流程、加快了修订标记（redlining）的速度，并减少了律师在重复性任务上花费的时间。随着越来越多的律所开始尝试使用 ChatGPT 等工具，一个核心问题浮出水面：ChatGPT 能否可靠地审查法律文件？还是说，律师应该依赖更专业的 AI 合同审查工具？本文将深入探讨通用大语言模型（以 ChatGPT 为例）在合同审查方面的能力边界，分析其核心功能、优势以及明显的短板——尤其是在涉及法律细微差别、合规性和保密性时。同时，我们也会探讨像 Spellbook 这样的垂直领域法律 AI 平台如何弥补这些不足，并说明为何它们通常是专业法律工作的更优选择。 ChatGPT 在合同审查中的能力 AI 工具在法律实践的许多领域都发挥着重要作用，尤其是在自动化方面。ChatGPT 作为一种通用 AI，为合同审查提供了以下几种辅助功能：自然语言理解：能够初步理解法律术语和合同条款。草拟章节：可以根据提示生成对协议特定章节的修改建议。信息提取：能够识别并提取合同中的关键信息点，如当事人、日期、金额等。文本摘要：可将冗长的合同内容总结为简明扼要的摘要，帮助快速理解。模式识别：能够识别重复出现的条款，并提示潜在的不一致之处。问答能力：能以对话形式回答用户关于合同内容的具体问题。然而，值得注意的是，ChatGPT 对复杂法律语言的理解能力有限，这使其在进行全面、严谨的合同审查时可靠性不足。使用 ChatGPT 审查合同的优势尽管存在局限，将 ChatGPT 等 AI 工具集成到合同审查流程中仍有显著的好处：速度 ChatGPT 能够快速定位并提取与付款条件、终止条款或保密协议相关的章节。律师无需逐行阅读，AI 可以在数秒内完成这项工作，从而大幅缩短单份合同的审查时间。效率 ChatGPT 可以快速标记出合同中需要澄清的章节，并通过优化语言来帮助降低合同风险。成本效益通过减少审查基本法律协议所需的时间，ChatGPT 辅助审查有助于降低成本。这使得律师能将更多精力投入到更具价值的业务中。易用性传统上，昂贵的法律科技主要服务于大型律师事务所。ChatGPT 的出现让先进技术变得更加普及，为各类规模的律所提升法律服务交付能力提供了可能。使用 ChatGPT 审查合同的局限与风险对于包含微妙法律细节的合同，ChatGPT 的能力往往捉襟见肘。例如，涉及赔偿条款和特定司法管辖区条款的案例需要更深层次的法律理解，而这正是 ChatGPT 所缺乏的。其主要风险和局限性包括：准确性问题法律语言的复杂性是主要障碍。如果 AI 无法完全理解合同条款中的潜在问题、各方权利义务以及法律语境，其审查结果将是不完整的。它可能会忽略需要进一步关注、澄清、删除或修改的关键问题。此外，ChatGPT 有时会生成看似合法但实际上包含错误的文本（即“AI 幻觉”），因为它缺乏对法律概念的深刻理解，并且其训练数据可能已经过时。这严重影响了它评估合同是否符合最新法律标准的能力。缺乏上下文理解 ChatGPT 的训练数据来源广泛，包括书籍、代码、文章和各类公开信息。这种多样性使其能够理解宽泛的输入，但并未覆盖所有法律术语的精确含义。它能理解一般性的法律信息，却常常在特定合同和语境中误解或忽略法律语言的细微差别。数据隐私风险使用 ChatGPT 时，用户输入的信息可能会被服务提供商用于模型训练。虽然这有助于改进模型，但对于处理高度机密的客户信息的法律专业人士而言，这构成了严重的数据泄露风险，可能违反客户保密协议。依赖高质量输入如果输入的合同文本本身存在错误、歧义或不一致，ChatGPT 可能难以准确把握其上下文和细微之处，导致其生成的解释和建议价值有限。 ...

Microsoft 365 Copilot 全面解析

Microsoft 365 Copilot 是一款由 AI 驱动的生产力工具，旨在协助用户完成各类工作任务。用户通过输入提示词（Prompt），Copilot 能够实时生成 AI 回应。这些回应不仅基于互联网内容，还整合了用户权限范围内的企业数据，确保在不同 Microsoft 365 应用中提供与工作任务高度相关的上下文信息。例如，一位运营经理需要与人力资源部门合作更新职位描述。他可以要求 Copilot 创建一份职位描述初稿，并补充必要的任职资格。在同一次对话中，他还可以让 Copilot 将这份描述扩展为不同级别（如 Level 1, Level 2, Level 3）的版本。此外，用户还可以创建和使用 Agents（智能体）来连接企业内部数据源，定制 Copilot 体验。例如，仓库经理可以向定制的物流 Agent 询问：“1234 号货物的状态是什么？” Copilot 将从企业数据源中检索信息并提供实时状态。本文面向 IT 管理员，旨在介绍 Microsoft 365 Copilot 的核心组件及其在各项应用中的具体功能。最新模型更新 Microsoft 365 Copilot 正在不断集成业界领先的大型语言模型（LLM）以提升性能。 GPT-5 模型集成 Copilot Chat 正在逐步过渡到使用 OpenAI 最新的 GPT-5 模型作为其主要支持的 LLM。用户可以在 Copilot Chat 界面右上角选择“试用 GPT-5”按钮，体验其在处理复杂提示、准确性和整体性能上的提升。此模型更新不会改变您现有的安全、隐私或合规性设置。注意：目前 GPT-5 尚未在 Microsoft 365 Copilot GCC (政府社区云) 版本中提供。 Anthropic Claude 模型可选 Microsoft 365 Copilot 新增了对 Anthropic 公司 Claude AI 模型的支持，作为一个可选的 LLM。用户可以在 Microsoft 365 Copilot 应用中选择“试用 Claude”按钮来体验。 ...

2025年度AI聊天机器人评测：ChatGPT、Copilot及其他热门工具深度横评

自2022年首个成功的AI聊天机器人问世以来，这项技术如同一场科技地震，其影响力堪比互联网和智能手机的诞生。如今，AI聊天机器人已深度融入我们的工作与生活，在辅助写作、编程、教育等领域展现出巨大潜力。本次评测聚焦于市面上最主流的八款免费AI聊天机器人：ChatGPT、Copilot、Grok、Gemini、Perplexity、Claude、DeepSeek 和 Meta AI。我们通过一系列严苛的实际测试，旨在帮助你找到最适合自己需求的那一款。评测结果显示，免费AI聊天机器人的能力已远超以往，其中 ChatGPT、Copilot 和 Grok 在综合性能上名列前茅。特别是在图像生成和故事创作方面，免费工具的表现已能与部分付费AI相媲美。评测方法与标准为了提供最实用的参考，我们摒弃了单纯罗列模型名称和技术规格的做法，转而设计了一套贴近真实世界应用场景的测试方案。我们对每个聊天机器人的免费版本进行了总计112项独立测试，以检验它们在不同任务下的实际表现。 AI公司向免费用户提供的模型资源可能随时变化，就像餐厅的“每日例汤”，配方并不固定。因此，我们的测试着重于结果的质量，而非底层具体的模型版本。所有测试分为文本和图像两大类，总分为120分。文本生成测试 (满分100分) 我们设计了10个基于文本的测试提示，涵盖了以下方面：信息获取与总结：访问并总结一篇关于流感的网络新闻。概念解释：向一个五岁的孩子解释一个学术概念。数学与分析：处理数学计算与数据分析问题。文化探讨：结合背景知识讨论文化现象。文学分析：对文学作品进行简要分析。旅行规划：制定一份详细的旅行计划。情感支持：提供情感上的安慰与建议。翻译与文化关联：翻译文本并解释其文化背景。代码编写：完成一个基础的编程任务。长文创作：撰写一篇1500词的长篇故事。图像生成测试 (满分20分) 我们要求聊天机器人生成四张不同主题的图片：一艘在空中飞行的航空母舰。一个巨大的机器人。一位身处中世纪宫廷的年轻棒球手。一幅向电影《回到未来》致敬的作品。测试中的主要发现在数小时的密集测试中，我们得到了一些令人惊喜的发现：免费产品的强大功能：AI服务商为免费用户提供了极高的价值。在连续执行10个提示的过程中，我们几乎没有遇到任何性能限制或节流。低门槛使用：许多AI聊天机器人在不创建账户或登录的情况下，就允许用户使用大部分核心功能，非常便捷。响应质量普遍提升：与以往的评测相比，所有参评机器人的回答质量都有了显著提高。即使是排名靠后的产品，其表现也远超预期。接下来，我们将详细介绍本次评测的冠军。评测冠军：OpenAI ChatGPT 作为AI聊天机器人领域的开创者，ChatGPT自发布以来不断创新，其免费版本的功能依然强大。凭借庞大的用户基础和丰富的学习资源，它成为了许多人的首选。总分：109 / 120 文本得分：91 / 100 图像得分：18 / 20 强项表现在我们的测试中，ChatGPT在多个文本任务上表现完美，包括向儿童解释概念、数学分析、文化讨论、文学分析和翻译。旅行规划：它不仅规划了合理的旅行路线，还为每天的行程配上了图片，并贴心地给出了针对三月份东北部地区天气的着装建议。代码编写：成功通过了我们的基础编程测试。图像生成：生成的图片质量很高。在《回到未来》主题测试中，它准确地呈现了电影的Logo、德罗宁汽车以及一个手持滑板的少年。不足之处网页信息获取：在总结一篇雅虎新闻的文章时，ChatGPT意外地访问了雅虎的台湾新闻门户，并用繁体中文给出了结果，这可能是由于在无痕窗口下未登录账号所致。长文创作：未能达到要求的1500词，并且文章结构更像一个带有标题的大纲，而非一篇完整的故事。付费版本 ChatGPT提供更高级的付费方案以满足不同用户的需求： Plus Plan：20美元/月，提供更强大的模型和更快的响应速度。 Pro Plan：200美元/月，为重度用户和开发者提供更高的资源配额和高级功能。优缺点总结优点: 强大的图像生成能力代码生成结果出色拥有庞大的生态系统和丰富的学习资源缺点: ...

《Claude 代码综合指南》学习笔记

这是一份关于《Claude 代码综合指南》的精炼阅读笔记，旨在帮助开发者更好地利用 Claude 模型进行代码相关工作。该项目源自 Cranot/claude-code-guide 仓库，由用户 karminski 在其基础上进行了学习和整理。项目概述仓库名称：karminski/claude-code-guide-study 核心内容：系统性地梳理和总结了《Claude 代码综合指南》的核心知识点与实践技巧。原始项目：本项目 fork 自 Cranot/claude-code-guide，并在其基础上添加了个人的学习理解。主要内容推测根据项目名称和主题，这份学习笔记可能涵盖了以下几个方面，为希望利用大语言模型提升编程效率的开发者提供了宝贵的参考： Prompt 工程：如何编写高效的提示词（Prompt）以获得高质量的代码输出。代码生成：在不同编程语言和框架下，利用 Claude 生成函数、类、测试用例等代码片段的最佳实践。代码解释与调试：使用 Claude 分析复杂代码、定位 Bug 以及提供修复建议的方法。代码重构与优化：如何引导 Claude 对现有代码进行结构优化、性能提升或风格统一。综合应用案例：结合实际开发场景，展示 Claude 在项目开发全流程中的辅助作用。项目热度该项目在开发者社区中获得了广泛关注，截至目前已收获超过 345 个星标（Star）和 33 次复刻（Fork），表明其内容具有较高的学习和参考价值。对于希望系统掌握 Claude 编码技巧的开发者来说，这是一份不容错过的优质资源。 👉 如果你需要 ChatGPT 代充 / Claude / Claude Code / 镜像 / 中转 API：购买 / 了解更多：ai4.plus 备用入口：kk4099.com

Grok by xAI：一款融合实时信息与强大创作功能的人工智能助手

Grok 是由 xAI 开发的一款人工智能助手，其设计核心是追求最大限度的真实、实用与好奇心。它不仅能回答你提出的任何问题，还能生成引人注目的图像和视频，并为你搜索网络与 X 平台的实时信息，助你更深入地理解世界。核心功能智能问答与深度研究 Grok 具备强大的对话和分析能力，可以作为你的全能助理：快速问答：针对任何问题，提供迅速精准的回答。深度研究：可为你进行深入的网络研究，整合复杂信息。专业问题求解：利用 Grok 4 模型，解决数学、科学和编程领域的难题。内容分析：支持上传文档、照片或粘贴链接，让 Grok 帮助你分析和理解其中内容。 Grok Imagine：AI 图像与视频生成 Imagine 是 Grok 内置的全新 AI 创作工具，具备高速和开创性的体验：文生视频：通过文本提示，生成长达 6 秒并带有音效的视频。照片转视频：将静态照片转化为生动的动态视频。语音生成图像：仅通过语音描述，即可生成高质量的 AI 图像。 Grok 语音模式与实时摄像头通过语音模式，你可以与 Grok 进行自然流畅的对话，仿佛在与真人交流。实时摄像头：在语音模式下开启摄像头，Grok 可以实时看到你所见的场景，并提供相应帮助。个性化助手：你可以为 AI 助手选择不同的性格，如“助理”、“浪漫”、“故事家”等，打造专属的互动体验。 AI 伴侣：与虚拟角色互动 Grok 内置了多个生动有趣的动画 AI 角色，你可以与它们进行独特的对话： Rudi：一只略带调皮且富有幽默感的小熊猫，适合轻松有趣的闲聊。 Valentine：一位充满诗意魅力的男性角色，适合进行深入且触动灵魂的对话。 Ani：一个迷人的角色，随着你们之间联系的加深，它会害羞脸红并发送爱心。实时信息整合：连接 X 平台与网络 Grok 的一大特色是能够接入 X（前身为 Twitter）和网络的实时数据，确保提供的信息始终保持最新：获取最新资讯：让你随时了解全球范围内任何话题的最新新闻和趋势。 X 平台高级搜索：可以要求 Grok 在 X 平台上进行高级搜索，深入挖掘事件动态和公众舆论。强大的图像编辑功能除了从零生成图像，Grok 还提供了强大的编辑能力： ...

近期校园活动与重要日期

进行中的活动交叉点 II：艺术与设计领域的师生作品展展期：即日起至 2025 年 11 月 14 日（星期五）地点：麦克马斯特画廊 (McMaster Gallery) 学术校历以下是近期需要关注的几个重要学术日期： 11月5日，星期三：课程退选截止日在此日期前申请退课或退学，成绩单将不会记录为“WF”(Withdraw Fail)。此规定适用于第 30 学期 (Part of term 30) 的课程。 11月23日（星期日）至 11月26日（星期三）：感恩节假期此期间所有课程暂停。 👉 如果你需要 ChatGPT 代充 / Claude / Claude Code / 镜像 / 中转 API：购买 / 了解更多：ai4.plus 备用入口：kk4099.com

如何创建和使用自定义提示（Prompt）

通过创建自定义提示（Prompt），您可以指示生成式 AI 模型以特定方式行事或执行特定任务。精心设计的提示能够生成满足您特定业务需求的响应，从而将 AI 模型转变为一个能够完成各种任务的灵活工具。重要提示 AI Builder 中的提示功能由 Azure OpenAI Service 驱动的 GPT 模型提供支持。此功能目前仅在部分地区可用，并可能受到使用限制或容量调节的约束。支持的语言 AI Builder 提示功能目前支持以下语言，列表后续可能会更新：阿拉伯语中文（简体）捷克语（捷克共和国）丹麦语（丹麦）荷兰语（荷兰）英语（美国）芬兰语（芬兰）法语（法国）德语（德国）希腊语（希腊）希伯来语意大利语（意大利）日语（日本）韩语（韩国）波兰语（波兰）葡萄牙语（巴西）俄语（俄罗斯）西班牙语（西班牙）瑞典语（瑞典）泰语（泰国）土耳其语（土耳其）提示工程（Prompt Engineering）核心原则提示工程的目标是创建尽可能具体的指令，以便从模型获得更相关的响应。您的提示应该主题明确，并清晰地传达您的意图。优秀提示的构成要素一个有效的提示通常包含以下信息：主题：明确指出内容的核心。关键词或短语：与主题相关的核心词汇。响应的语气：例如，正式、友好、专业等。目标受众：响应内容是写给谁看的。如果模型生成的文本过长或包含无关信息，请尝试调整和优化您的提示。良好提示的四大特征清晰简洁：使用清晰、简洁、易于理解的语言编写。具体明确：足够具体，能够引导 GPT 模型朝正确的方向生成内容。提供上下文：提供足够的背景信息，帮助 GPT 模型生成有意义的输出。任务相关：与要执行的任务紧密相关，为模型提供生成高质量输出所需的信息。提示的基本结构一个提示通常由两个部分组成：指令和上下文。指令 (Instruction)：这是提示的第一部分，应明确指示 GPT 模型需要做什么。示例：用三个要点总结这封邮件。上下文 (Context)：这是提示的第二部分，提供模型生成适当响应所需的信息。示例：这封邮件包含过去一周的客户反馈。通过组合指令和上下文，自定义提示可以引导模型完成问答、文本补全、语言翻译、文档摘要以及从文本中识别任务、待办事项和行动项等多种任务。提示的复杂性可以从单个句子到更复杂的结构，具体取决于任务需求。 ...

Gemini API 现已支持 Google Maps Grounding 功能

现在，开发者可以在 Gemini API 中启用 Google Maps 工具，将丰富、实时的地理空间数据作为模型生成内容的基座，从而构建具备地理位置感知能力的 AI 应用。这项功能将 Gemini 模型的推理能力与来自全球超过 2.5 亿个地点的数据相结合，为打造新一代强大的地理空间感知 AI 产品提供了可能。与 Google Search Grounding 类似，Google Maps Grounding 能够在用户查询涉及地理位置信息时，为模型提供准确、可靠的最新数据，从而显著提升回答的质量。快速上手在您的 Gemini API 请求中，只需启用 Google Maps 工具即可开始使用。以下是一个使用 Python SDK 的示例代码： import google.generativeai as genai # 配置你的 API 密钥 genai.configure(api_key="YOUR_API_KEY") # 创建模型实例并启用 Google Maps 工具 model = genai.GenerativeModel( model_name='gemini-1.5-pro-latest', tools=['google_maps']) # 发起聊天请求 chat = model.start_chat() response = chat.send_message( "给我推荐一些旧金山唐人街附近适合举办生日派对的中餐馆，并说明理由。") print(response.text) 可视化地图结果为了更直观地展示基于地图的搜索结果，API 还会返回一个上下文令牌（context token）。您可以使用此令牌生成一个可交互的地图小组件（widget），并将其嵌入到您的应用界面中。这为用户提供了熟悉的地图体验，其中包含相关的照片、评论和其他详细信息。 ...

ChatGPT 入门指南：家庭历史研究者的 AI 助手

对 ChatGPT 感到好奇，但不知从何入手？本指南专为初学者设计，将带你一步步了解如何利用人工智能（AI）助力你的家庭历史研究。即使你对技术不太熟悉，也能轻松上手。一、创建 ChatGPT 账号使用 ChatGPT 的第一步是拥有一个账号。你可以访问 OpenAI 的官方网站，按照页面提示，使用你的电子邮箱地址进行注册。整个过程非常简单，只需几分钟即可完成。二、提出你的第一个问题注册完成后，你将看到一个类似聊天窗口的界面。与 ChatGPT 交流就像和人对话一样。你可以直接在输入框中输入你的问题或请求。尝试从一个简单的问题开始，例如：请帮我解释一下什么是“家谱”？或者提出一个与你研究相关的具体请求：我正在研究 19 世纪的德国移民，有哪些常见的德国姓氏？ ChatGPT 会根据你的问题生成详细的回答。三、ChatGPT 在家谱研究中的应用掌握了基本操作后，你可以尝试将 ChatGPT 应用于以下几个方面，以提高你的研究效率： 1. 整理研究资料当你面对大量零散的笔记、日期和人名时，可以让 ChatGPT 帮助你整理成清晰的结构。示例请求：我有以下关于我曾祖父的信息：姓名 John Smith，出生于 1880 年左右，可能在伦敦，妻子名叫 Mary Jones，他们有三个孩子：Peter、Jane 和一个夭折的儿子。请帮我将这些信息整理成一个简洁的生平摘要。 2. 转录和解读历史记录手写的老旧文档（如信件、日记或人口普查记录）常常难以辨认。你可以先手动输入难以辨认的文本，然后请求 ChatGPT 帮助你解读或将其格式化。示例请求：我正在尝试转录一份 1900 年的人口普查手写记录，其中一些词语很潦草。这是我辨认出的内容：“[此处输入你辨认的文本]”。根据上下文，你认为那个看不清的职业单词可能是什么？ 3. 激发写作灵感如果你想将你的家族故事写下来，但不知如何开头，ChatGPT 可以为你提供思路和草稿。示例请求：我想写一个关于我祖母从爱尔兰移民到美国的故事，请给我一些开头段落的建议。她的名字是 Bridget O'Connell，大约在 1920 年代抵达纽约。通过这些简单的方法，ChatGPT 可以成为你研究家族历史的得力助手，帮助你更高效地探索和记录你的家族故事。 👉 如果你需要 ChatGPT 代充 / Claude / Claude Code / 镜像 / 中转 API： ...

欢迎来到AI小卖铺博客#

欢迎来到AI小卖铺博客