Gemini 入门指南：一篇就够

Gemini 是 Google 推出的一款 AI 聊天机器人，具备你所期望的 AI 聊天机器人的所有功能：浏览网页、进行深度研究、分析和可视化数据、生成 AI 图像和视频等等。然而，Gemini 最强大的地方在于它与 Google 生态产品的深度集成。你可以用一条提示词搜索 Gmail 中海量的邮件，或者快速总结 Google Drive 里的文档，而这一切都无需离开 Gemini 的聊天界面。

本文将为你详细介绍 Gemini 的使用方法。

注意：Gemini 同时也是 Google AI 模型家族的名称，为同名的聊天机器人提供支持。本文主要介绍的是 Gemini 聊天机器人的使用。

网页端与移动端使用方法

以下是使用 Gemini 的简明步骤：

访问 gemini.google.com 并使用你的 Google 账户登录。
在对话窗口中，可以点击模型下拉菜单切换不同的 AI 模型。
在主页的输入框中，通过文本、图片或音频输入你的提示词。
当 Gemini 生成回复后，你可以进行多种操作：
- 编辑原始提示词
- 输入新的提示词进行追问
- 对回复进行点赞或点踩
- 让 Gemini 重新生成回复
- 分享或复制回复内容
- 对回复进行事实核查
- 收听回复的语音朗读
- 查看同一提示词生成的不同版本回复

接下来，我们深入了解这些操作的细节。

1. 登录 Gemini

首先，访问 gemini.google.com 并点击“登录”。按照提示使用你的 Google 账户登录。如果你还没有账户，可以免费创建一个。

注意：如果你使用的是工作或学校的 Google 账户，管理员可能禁用了 Gemini 的访问权限。

2. 选择 AI 模型

在对话窗口的左上角，你可以点击模型名称的下拉菜单，根据需要切换到不同的 AI 模型。

3. 向 Gemini 提问

你可以通过多种方式向 Gemini 发出指令（部分功能可能仅限于网页端或移动端）：

文本输入：在文本框中输入你的提示词，然后按 Enter 键或点击提交图标。
深度研究 (Deep Research)：点击输入框中的“工具”，选择“深度研究”。Gemini 会梳理数百个在线来源和文件，为你提供一份带有引用来源的综合性回复。
画布 (Canvas)：如果你希望 Gemini 将回复输出到一个独立的文档式界面中，可以点击“工具”并选择“画布”。这会打开一个新画布，方便你对内容进行详细处理。
生成或编辑图片：点击“工具”，选择“创建图片”，然后输入你的 AI 绘画提示词。
语音输入：点击麦克风图标，通过语音输入你的提示词。
上传文件：点击输入框旁的“+”图标上传图片等文件，并附上你的问题。你也可以直接将文件从电脑拖拽到输入框中。

4. 与 Gemini 的回复互动

Gemini 会在数秒内生成格式清晰的回复。你可以对回复进行以下操作：

编辑提示词：将鼠标悬停在你的原始提示词上，点击铅笔图标进行修改后重新提交。
追问：在下方输入框中继续提问。Gemini 会记住上下文，无需重复信息。
评价回复：点击“赞”或“踩”图标，为 Gemini 提供反馈以改进其性能。
重新生成：如果对回复不满意，点击回复下方的“重新生成”图标，让 Gemini 使用相同的提示词再次回答。
分享与导出：
- 分享对话：点击“分享与导出”图标，选择“分享对话”，然后复制生成的链接。收到链接的人可以查看对话，甚至从你结束的地方继续聊。
- 复制回复：如果只想分享单条回复，点击该回复下方的复制图标即可。
事实核查：鉴于 AI 可能会虚构信息，强烈建议进行事实核查。点击回复下方的“更多”（⋮）图标，选择“核查回复”。Gemini 会高亮显示其陈述，点击高亮部分可以查看相关的 Google 搜索结果。
收听回复：点击“更多”（⋮）图标，选择“收听”，Gemini 会朗读回复内容。
查看不同版本：如果你多次重新生成了回复，可以点击版本号旁边的箭头，在不同版本的回复之间切换查看。

在 Chrome 地址栏中使用 Gemini

你可以在任何 Chrome 窗口的地址栏直接与 Gemini 开始对话：

在地址栏输入 @gemini。
在出现的提示中，点击“@gemini - 询问 Gemini”。
在地址栏继续输入你的提示词，然后按 Enter 键。
页面将跳转到 Gemini 官网，并显示你的问题和答案。之后便可像往常一样继续对话。

使用 Gemini Live 进行语音对话

除了打字，你还可以与 Gemini 进行实时语音对话，Google 称之为 Gemini Live。此功能目前仅在 Gemini 移动应用中提供。

打开 Gemini 移动应用。
点击 Gemini Live 图标（一个星星悬浮在三条竖线上方）。
直接说出你的提示词。说完后，Gemini 会自动处理并用语音回答你，无需手动发送。
如果需要暂停，可以说“暂停”或点击暂停按钮。准备好后，点击“继续”即可恢复。
对话结束后，点击“结束”按钮。

Gemini 的特色功能

Gemini 的功能远不止于聊天，它还拥有许多实用的特色功能。

与 Google 应用深度集成

通过 Gemini 应用扩展，你可以让 Gemini 从其他 Google 应用中实时获取信息，包括 Gmail、Drive、地图、航班、酒店，甚至 YouTube。

只需在提示词中输入 @ 并选择你想要查询的应用，然后提出问题。例如：

你可以要求 Gemini 从 Gmail 的一封邮件中提取关键信息，它会在回复中附上邮件链接。
你可以让它分享一个存储在 Google Drive 中的文件链接，甚至直接在对话中输出文件内容。

注意：未经你的许可，Gemini 不会访问你的个人内容。但当你通过 Gemini 与其他 Google 服务互动时，相关活动可能会被该服务记录。

此外，通过付费订阅 Gemini for Workspace，你还可以直接在 Google 全家桶应用（如文档、表格）内部使用 Gemini。

生成 AI 图像

Gemini 不仅能从网上搜索图片，还能利用其内置模型（如 Gemini 2.5 Flash）生成全新的 AI 图像。只需输入详细的文字描述，它就能将你的创意变为现实。

生成 AI 视频

Gemini 还能使用 Google Veo 3 模型生成 AI 视频。你可以输入一段描述场景的文字提示词，或者上传一张静态图片作为视觉参考，Gemini 会将其转换成一个带有自然语音和背景音的短视频片段。

为文件生成音频摘要

如果你不想阅读冗长的 PDF 或幻灯片，可以使用 Gemini 的“音频摘要”（Audio Overview）功能。它能将你的文件（如演示文稿、研究论文等）转换成播客风格的音频讨论。

使用方法很简单：上传文件后，点击输入框上方的“生成音频摘要”建议标签即可。根据文件大小，生成过程可能需要一些时间。最终你会得到一段由两个 AI 主持人讨论文件内容的音频，支持在线收听或下载后离线收听。

使用计划操作

Gemini 的“计划操作”（Scheduled actions）功能类似于 ChatGPT 的计划任务。不过，目前它的功能相对有限，主要用于在 Google Tasks 中添加任务或在 Google Calendar 中设置提醒。

使用方法如下：

在输入框中描述你希望 Gemini 做什么、何时执行以及执行频率（如果是重复性任务）。例如，你可以说：“提醒我每周五下午 4 点整理本周工作总结。”

👉 如果你需要 ChatGPT 代充 / Claude / Claude Code / 镜像 / 中转 API：

购买 / 了解更多：ai4.plus
备用入口：kk4099.com

网页端与移动端使用方法#

1. 登录 Gemini#

2. 选择 AI 模型#

3. 向 Gemini 提问#

4. 与 Gemini 的回复互动#

在 Chrome 地址栏中使用 Gemini#

使用 Gemini Live 进行语音对话#

Gemini 的特色功能#

与 Google 应用深度集成#

生成 AI 图像#

生成 AI 视频#

为文件生成音频摘要#

使用计划操作#