欢迎来到AI小卖铺博客
每天分享人工智能资讯、技术教程和工具。
每天分享人工智能资讯、技术教程和工具。
nanochat 是一个全栈式实现类 ChatGPT 大语言模型 (LLM) 的项目。它被整合在一个单一、简洁、极简、易于修改且依赖轻量的代码库中。 nanochat 的设计目标是在单个 8xH100 节点上,通过 speedrun.sh 这样的脚本,端到端地运行整个 LLM 管线。这包括从分词、预训练、微调、评估、推理,到通过一个简单的 Web UI 提供服务,让你能像使用 ChatGPT 一样与自己训练的 LLM 对话。 本项目也将成为 Eureka Labs 正在开发的 LLM101n 课程的毕业项目。 快速上手 体验 nanochat 魅力的最快方式是运行 speedrun.sh 脚本,它将训练并运行一个百元成本级别的模型。在一台每小时 24 美元的 8xH100 节点上,整个过程大约需要 4 小时。 首先,从你常用的云服务商(例如 Lambda)启动一台 8xH100 GPU 服务器,然后运行以下训练脚本: bash speedrun.sh 由于脚本需要运行 4 小时,推荐在 screen 会话中启动,并将日志输出到文件: screen -L -Logfile speedrun.log -S speedrun bash speedrun.sh 如果你对 screen 不太熟悉,可以查阅相关教程。启动后,你可以在 screen 会话中观察进度,或使用 Ctrl-a d 分离会话,并通过 tail -f speedrun.log 查看进度。 ...
根据美国心理学会(APA)发布的第七版规范,当你在学术研究中使用 ChatGPT 或其他人工智能工具时,需要遵循特定的引用方法。本指南将详细介绍如何在论文中恰当引用这类 AI 模型。 在论文中声明 AI 工具的使用 如果你在研究中借助了 ChatGPT,应在论文的方法(Method)部分或类似章节中清晰说明你如何使用该工具。对于文献综述、评论性文章等类型的论文,则可以在引言部分进行描述。 在正文中,你需要提供: 你向 ChatGPT 提交的提示词 (Prompt)。 由 AI 生成并被你引用的相关文本。 由于 AI 生成的回复对于其他读者是不可检索的,并且交流对象并非真人,因此不能将其作为“个人通信” (personal communication) 来引用。引用 ChatGPT 的文本更像是分享一个算法的输出。因此,正确的做法是在文末的参考文献列表中列出该算法的作者(即开发公司),并在正文中进行相应的文内引用。 为了保证研究的透明度和可复现性,建议将 ChatGPT 生成的较长回复全文放入论文的附录 (Appendix) 或在线补充材料中。这一点尤为重要,因为即使输入完全相同的提示词,ChatGPT 在每次会话中也可能生成不同的回复。 参考文献格式 引用 ChatGPT 的格式基于 APA 手册中关于软件的引用模板。 引用示例 OpenAI. (2023). ChatGPT (Mar 14 version) [Large language model]. https://chat.openai.com/chat 格式解析 标准的 APA 引用包含四个核心要素:作者、日期、标题和来源。 1. 作者 (Author) 模型的开发者是 OpenAI。 2. 日期 (Date) 日期为你所使用版本的年份。APA 规范要求只写年份,具体的版本信息已在标题中提供。 3. 标题 (Title) 模型名称:即 ChatGPT,在引用中应使用斜体。 版本号:紧跟在模型名称后,用圆括号括起来。OpenAI 以日期作为版本标识,因此格式为 (Mar 14 version)。其他模型可能使用不同的版本号方案(如 Version 2.0),请根据其提供商的官方信息填写。 内容描述:在版本号后,使用方括号提供对引用内容的额外说明,以帮助读者理解其性质。对于 ChatGPT,描述为 [Large language model]。如果你使用的是 GPT-4,OpenAI 将其描述为“大型多模态模型”,因此可以使用 [Large multimodal model]。 4. 来源 (Source) 当作者与出版商相同时,无需在来源部分重复其名称。因此,在 OpenAI 的例子中,直接提供 URL 即可。URL 应尽可能直接指向模型的访问地址,而非公司主页。 ...
在近日的 Google Cloud 活动上,我们正式发布了 Gemini Enterprise——一个专为企业环境打造的全新 AI 入口。Gemini Enterprise 由强大的 Gemini 模型驱动,旨在连接企业内部信息,并通过 AI 代理(Agent)帮助团队高效协作和实现任务自动化。我们的目标是将 Google 最顶尖的 AI 技术融入每一位员工的每一个工作流程中。 本文将详细介绍 Gemini Enterprise 的核心功能、Workspace 的相关更新,以及我们为 AI 技能学习推出的全新平台。 隆重推出 Gemini Enterprise:企业级 AI 新入口 正如 Google Cloud CEO Thomas Kurian 所介绍,真正的业务转型不能止步于简单的聊天机器人。Gemini Enterprise 的诞生正是为了实现这一目标。它不仅仅是一个工具,更是企业在 AI 时代实现深度变革的催化剂。 Gemini Enterprise 将成为您工作场所中 Google AI 的统一入口,致力于解决更复杂的业务挑战。 Gemini Enterprise 的四大核心优势 Gemini Enterprise 旨在通过以下四个方面,帮助您和您的团队节省宝贵时间,让工作变得更轻松: 深度连接企业信息:安全地索引和访问公司内部数据,让 AI 能够基于准确、相关的上下文提供支持。 赋能团队协作:在会议、文档和沟通工具中提供智能摘要、内容创作和洞察分析,提升团队协作效率。 任务自动化代理:通过可定制的 AI 代理自动执行重复性任务和复杂的工作流,将员工从繁琐的工作中解放出来。 赋能所有工作流:将 AI 能力无缝集成到员工日常使用的各种应用和工作流程中,无需切换环境即可获得智能辅助。 蓬勃发展的合作伙伴生态系统 我们深知,一个强大的生态系统对于技术普及至关重要。因此,我们为合作伙伴提供了全新的机遇,让他们能够将自己的解决方案与 Gemini Enterprise 的代理生态系统相集成,并推向市场。这不仅丰富了 Gemini Enterprise 的功能,也为客户提供了更多样化的选择。 ...
Anthropic 的 Claude Sonnet 4.5 模型现已面向 GitHub Copilot 用户全面开放。您可以在多个平台和工具中通过模型选择器来调用此模型,以提升编码体验。 适用订阅计划 以下订阅计划的用户均可使用 Claude Sonnet 4.5: Copilot Enterprise Copilot Business Copilot Pro Copilot Pro+ 支持平台 您可以在以下环境中通过 Copilot Chat 的 agent、ask 或 edit 模式访问新模型: GitHub.com 网页端 GitHub Mobile 移动应用 Visual Studio Code Visual Studio JetBrains 系列 IDE Xcode Eclipse 如何启用模型 启用方式因用户类型而异: 针对企业和商业版用户 组织管理员必须在 Copilot Chat 和 IDE 的设置中,主动开启新的 Claude Sonnet 4.5 策略。一旦启用,该组织内的所有用户便可在各受支持的 IDE 模型选择器中看到此选项。 针对个人版用户 个人计划用户(Copilot Pro 及 Pro+)的启用步骤非常简单: 在任何受支持的 IDE 中打开 Copilot Chat。 从模型选择器中选中 Claude Sonnet 4.5。 在一次性弹出的提示中确认即可启用。 Copilot Coding Agent 的特别说明 需要注意的是,无论您在 Copilot Chat 中的个人设置如何,Copilot coding agent 现在将默认使用 Claude Sonnet 4.5 模型。此项更新适用于所有订阅类型的用户。 ...
OpenAI 正式推出了其备受期待的下一代大语言模型——GPT-5。相较于前代,GPT-5 在智能、速度和准确性上都实现了显著提升,这意味着它将能提供更可靠的回答,并大幅减少内容“幻觉”(即凭空捏造信息)的现象。 GPT-5 被定位为一个全能型模型,能够胜任写作、编码、创建交互式应用、处理邮件和进行深度研究等多种任务。更重要的是,这些强大的新功能将向所有 ChatGPT 用户免费开放。以下是 GPT-5 带来的七个最值得关注的核心新特性。 1. 统一的智能模型体验 GPT-5 整合了 OpenAI 旗下的多种模型。用户不再需要为特定任务手动选择合适的模型,ChatGPT 会根据你的提示词(Prompt)自动调用最佳模型或模型组合来解决问题。 除了作为旗舰的 GPT-5,OpenAI 还推出了两个更具成本效益的轻量级模型: GPT-5 Mini GPT-5 Nano 这两个模型主要面向希望降低成本的开发者。当用户达到 GPT-5 的使用上限时,系统也会自动切换到这些轻量级模型。官方表示,即使是 Mini 和 Nano,其能力在许多场景下也超越了 GPT-3。 2. 你的专属程序员 OpenAI 强调,GPT-5 在编写代码方面的能力得到了显著增强,旨在成为程序员的得力助手。 对于非专业开发者,GPT-5 也带来了所谓的“感觉流编程”(Vibe-Coding)新范式。在演示中,用户仅通过简单的自然语言描述,就让 GPT-5 现场创建了一个可交互的定制化应用。这意味着你可以将脑海中的应用或软件构想直接告诉 ChatGPT,让它为你实现。 尽管在实际应用中可能无法一步到位,但这项功能无疑为那些希望将创意变为现实的用户提供了一条捷径。 3. 深度研究与推理 随着 GPT-5 的发布,免费用户现在也能使用 OpenAI 最顶尖的推理模型。 该模型能够根据你的指令执行多步骤的复杂搜索,并从海量数据中综合提炼出精准的回答。OpenAI CEO Sam Altman 表示,GPT-5 的研究与推理能力可以达到博士研究生水平。 除了纯粹的信息整合,GPT-5 还能创建定制化的图表、交互式应用、游戏和测验,帮助用户更深入地学习和理解相关主题。 4. 预设人格 新版 ChatGPT 内置了四种全新的预设人格,用户可以在每次对话中根据需要进行选择,以调整 AI 的互动风格。这四种人格分别是: 愤世嫉俗者 (Cynic) 机器人 (Robot) 倾听者 (Listener) 书呆子 (Nerd) 这些预设人格是可选的,用户也可以在设置中进行调整。OpenAI 表示,此举旨在解决 GPT-4o 模型中存在的过度迎合(Sycophancy)问题。 ...
Google Gemini 是一款由 Google AI 开发的生成式人工智能聊天机器人和虚拟助手。它的前身是 Bard,于 2023 年 3 月首次亮相,旨在应对 OpenAI ChatGPT 的迅速崛起。2024 年 2 月,Bard 正式升级并更名为 Gemini,标志着其底层技术已全面转向更强大的同名大语言模型(LLM)。 诞生背景:ChatGPT 引发的“红色警报” 2022 年 11 月,OpenAI 发布了基于 GPT-3 系列大语言模型的聊天机器人 ChatGPT,并迅速在全球范围内引起轰动。面对 ChatGPT 对其核心搜索业务构成的潜在威胁,Google 管理层拉响了“红色警报”(Code Red),并紧急调动多个团队,全力投入人工智能的研发。 为了应对这一挑战,已于 2019 年卸任的 Google 联合创始人拉里·佩奇(Larry Page)和谢尔盖·布林(Sergey Brin)也罕见地回归,参与了一系列紧急会议,商讨公司的应对策略。 实际上,Google 早在 2021 年就已发布了其对话式大语言模型 LaMDA,但并未向公众开放。当被内部员工问及 LaMDA 是否错失了与 ChatGPT 竞争的良机时,Google CEO 桑达尔·皮查伊(Sundar Pichai)和 AI 负责人杰夫·迪恩(Jeff Dean)解释称,作为一家规模远超 OpenAI 的公司,过早地推出类似产品会带来巨大的“声誉风险”。 尽管如此,面对外部压力,Google 内部仍在加速研发。员工们开始密集测试一个代号为 Apprentice Bard 的聊天机器人,为正式发布做准备。 Bard 的问世与迭代 仓促发布与早期争议 2023 年 2 月 6 日,Google 正式发布了基于 LaMDA 模型的人工智能聊天机器人 Bard。这一举动被外界普遍认为是 Google 为抢在微软宣布将 ChatGPT 整合进必应搜索(Bing)之前,而采取的先发制人策略。这场科技巨头之间的竞争,被媒体称为新一轮的“AI 军备竞赛”。 ...
自 ChatGPT 发布以来,这款 AI 聊天机器人已成为一个现象级的产品。如果你也准备好开始尝试,本指南将为你提供清晰的入门路径,让你自信地驾驭这个强大的工具。 本文将深入介绍 ChatGPT 是什么、如何使用它,以及作为新手需要了解的核心知识。 ChatGPT 能做什么? ChatGPT 的功能远不止回答简单问题。它可以执行多种复杂的语言任务,例如: 回答问题:像搜索引擎一样提供信息。 总结文本:快速提炼长篇文章、报告或文档的核心内容。 内容创作:撰写文章、邮件、营销文案、简历甚至是诗歌和故事。 编写代码:生成代码片段、调试程序或解释代码逻辑。 语言翻译:在多种语言之间进行互译。 值得注意的是,ChatGPT 的回答基于其训练数据中的模式和概率,并非真正的“思考”。因此,它可能会出现以下问题: 信息幻觉:编造看似合理但完全错误的信息。 事实错误:提供过时或不准确的数据。 潜在偏见:重复其训练数据中存在的偏见。 因此,在使用时请务必保持批判性思维,将其视为一个强大的助手,而非绝对正确的真理来源。 第一步:注册与设置 开始使用 ChatGPT 非常简单。 访问平台:你可以通过官网 chatgpt.com 或在苹果 App Store、Google Play 商店下载官方 App 来使用。 创建账户:点击页面右上角的“注册”按钮。你可以选择免费版或付费版(每月 20 美元)。对于大多数日常使用场景,免费版已经足够强大。 选择使用场景: 移动端 App:适合快速查询、语音输入和随时随地的灵感捕捉。 桌面网页版:更适合处理复杂的工作任务,如撰写长文或分析数据。 登录后,系统会保存你的对话历史,这有助于 ChatGPT 更好地理解你的需求,并允许你对它的回答进行个性化定制。 第二步:掌握提问的艺术 如何有效使用 ChatGPT 并无固定规则,但请牢记最重要的一点:永远不要将你的批判性思维完全外包给它。 核心原则 交叉验证:同时使用 ChatGPT 和传统搜索引擎(如 Google),并对两者提供的信息进行事实核查。 赋予角色:在使用前,先明确你希望它扮演的角色。例如,你可以让它成为你的“创意伙伴”、“研究助理”或“代码审查员”。 上下文是关键:你提供的信息质量决定了输出结果的质量。在你的第一个提示(Prompt)中,尽量提供详尽的背景信息和明确的要求。 保护个人隐私:绝对不要在对话中输入任何个人敏感信息,如信用卡号、身份证号、家庭住址等,以防数据泄露。 实战演练:从入门到精通的 Prompt 示例 你的提问方式取决于你的具体目标,无论是提出问题、总结文本、头脑风暴还是分析图像。 示例一:获取专业建议 假设你正在备孕,希望了解理想的饮食方案。 初始 Prompt 示例: 我是一名 36 岁的女性,准备开始试管婴儿(IVF)疗程。我没有已知的生育问题,但 AMH 值偏低。请为我在取卵和移植前提供一份建议的饮食方案。 ...
近日,谷歌云正式发布了 Gemini Enterprise,一个旨在统一连接企业内部员工、工作流和数据的 AI 平台。这标志着企业采用 AI 的方式正从零散的单点工具转向一个集成的、智能化的工作平台。 Gemini Enterprise 不仅仅是一个聊天机器人,它被定位为企业 AI 的“入口”,整合了谷歌最先进的 Gemini 模型、企业级安全治理以及庞大的生态系统,旨在将 AI 的力量赋能给每一位员工。 Gemini Enterprise 的核心特性 该平台的核心是通过智能体(Agent)来编排和自动化复杂的业务流程,其关键特性包括: 1. 统一的智能交互界面 Gemini Enterprise 提供了一个单一的聊天界面,整合了多种 AI 功能。这改变了过去企业需要部署和管理多个分散 AI 工具的局面,大幅降低了使用和集成的复杂性。 2. 人人可用的无代码智能体构建器 平台内置了无代码(No-code)开发工作台,允许业务人员(如市场、财务、法务等部门的员工)在无需编写代码的情况下,自行创建 AI 智能体来自动化日常工作流。这极大地推动了 AI 在企业内部的普及和应用。 3. 深度集成与上下文感知 AI 智能体的有效性取决于其对业务上下文的理解。Gemini Enterprise 能够安全地连接到企业现有的数据生态系统,包括: Google Workspace Microsoft 365 Salesforce SAP ServiceNow, Workday, Box 等 通过连接这些应用,智能体可以获取完整的业务背景信息,从而提供更精准的洞察和自动化操作。 4. 开箱即用的预置智能体 为了帮助企业快速获得价值,Gemini Enterprise 提供了一组预置的专业智能体“特遣队”,可立即用于执行特定任务,例如: 研究分析:自动进行市场研究和数据洞察。 数据科学:协助进行数据整理、探索和模型构建(预览版)。 运营支持:处理跨部门的协调和自动化任务。 5. 开放的生态系统与企业级治理 Gemini Enterprise 建立在一个开放的平台上,拥有超过 10 万个合作伙伴,企业可以灵活选择和集成最适合自己的模型与工具,避免供应商锁定。同时,平台提供了统一的治理面板,让 IT 部门能够全面监控和管理企业级 AI 的部署,确保安全与合规。 ...
人工智能(AI)正为我们的工作方式带来颠覆性的变革机遇。然而,早期的 AI 工具往往各自为战,无法整合整个组织的数据与流程,形成了信息孤朵。 Gemini Enterprise 的出现正是为了解决这一难题。它作为企业 AI 的统一入口,将 Google 最顶尖的 AI 技术带给每一位员工。它不仅仅是处理简单任务的工具,更是一个能将工作、数据和人员连接在一起的 AI 驱动中心,旨在重塑整个工作流程。通过这个安全、统一的平台,任何员工都能轻松构建和部署 AI 智能体(Agent),实现业务流程的自动化。 以下是 Gemini Enterprise 帮助您和团队优化工作、释放时间的四种核心方式。 一、为每个团队配备 AI 专家 想象一下,如果每个团队都能随时拥有一位具备专业技能的助理,工作效率将得到多大提升?Gemini Enterprise 通过其强大的无代码工作台,让这一设想成为现实。无论是市场营销还是财务部门的员工,都可以轻松构建自定义的 AI 智能体,用于处理那些繁琐、重复的任务。 例如,一位营销经理可以在几分钟内(而非几天)启动一个全新的营销活动。他可以要求智能体为新产品发布生成创意概念。由于智能体已安全地连接到公司的内部数据,它能即时理解产品细节,并访问所有经过授权的创意资产,如品牌 Logo、产品图片等。 随后,智能体可以生成一系列符合品牌调性的高质量营销方案,包括社交媒体文案和视觉设计模型,供团队直接审阅。这使得团队能够以前所未有的规模和速度,将一个简单的想法迅速转化为精良、可执行的方案。 此外,Gemini Enterprise 还内置了多种 Google 预置的智能体,如深度研究和数据科学智能体,让用户可以即刻上手。平台还秉持开放原则,通过智能体市场,用户可以发现、筛选并部署来自合作伙伴生态系统的数千个经过验证的智能体,将强大的第三方解决方案直接集成到组织的工作流中。 二、打通所有业务数据,连接信息孤岛 企业最有价值的信息,常常分散并锁定在不同的电子表格、应用程序和聊天记录中。Gemini Enterprise 旨在通过一个简洁直观的聊天界面,安全地释放这些知识的潜力。 通过与日常使用的系统(如 Google Workspace、Microsoft 365)以及核心业务应用(如 Salesforce、SAP)进行安全连接,Gemini Enterprise 超越了简单的搜索,能够构建深度的业务情境。这为 AI 智能体提供了必要的上下文,使其能够提供真正智能、高度相关的结果。 例如,巴西联合银行(Banco BV)的关系经理通过授权智能体访问其内部的分析和商业智能系统,成功将数小时的工作自动化,从而有更多时间与客户建立联系。同样,法律科技公司 Harvey 利用 Gemini 为其法律 AI 提供深度的上下文理解能力,极大地提升了律师在合同分析和合规性审查方面的效率。 三、自动化完整工作流,而非零散任务 真正的变革源于优化整个流程,而不仅仅是单个步骤。Gemini Enterprise 的设计初衷正是为了编排跨越不同系统的复杂工作流。 通过组合使用预置、自定义和第三方的智能体,用户可以实现整个业务流程的自动化与协同。例如,麦格理银行(Macquarie Bank)利用 Google Cloud AI 实现了更高效、更主动的数字化自助服务能力。其帮助中心搜索功能成功将 38% 的用户引导至自助服务,同时将客户保护方面的误报率降低了 40%。 ...
谷歌云正式发布 Gemini Enterprise,旨在打造一个全新的企业级 AI 入口,将强大的人工智能无缝集成到每一位员工的日常工作流中。 Gemini Enterprise 的核心是一个直观的 Gemini 聊天界面。它作为所有员工的“前端”,让企业能够充分利用谷歌 AI 的全部能力。 核心功能 Gemini Enterprise 平台具备以下关键特性: Gemini 模型驱动:充分利用 Gemini 模型家族的强大智能。 自定义 AI 代理:支持企业根据自身需求,构建和编排专属的 AI 代理(Agent)。 预置代理生态:提供一系列由谷歌预先构建的 AI 代理,开箱即用,帮助企业从第一天起就创造价值。 连接企业数据:能够安全地连接到企业内部数据,确保 AI 的工作成果基于统一、准确的信息源。 集中化治理:提供对所有 AI 代理的集中可视化、安全防护、审计和治理能力。 开放的生态系统:依托于谷歌的合作伙伴生态,用户可以接入一个开放的代理网络和应用市场。 据谷歌云营销团队内部试用反馈,Gemini Enterprise 已帮助团队节省了数千小时的工作时间,显著提升了工作效率。 👉 如果你需要 ChatGPT 代充 / Claude / Claude Code / 镜像 / 中转 API: 购买 / 了解更多:ai4.plus 备用入口:kk4099.com