Gemini 是 Google 推出的一款 AI 聊天机器人,具备你所期望的 AI 聊天机器人的所有功能:浏览网页、进行深度研究、分析和可视化数据、生成 AI 图像和视频等等。然而,Gemini 最强大的地方在于它与 Google 生态产品的深度集成。你可以用一条提示词搜索 Gmail 中海量的邮件,或者快速总结 Google Drive 里的文档,而这一切都无需离开 Gemini 的聊天界面。
本文将为你详细介绍 Gemini 的使用方法。
注意:Gemini 同时也是 Google AI 模型家族的名称,为同名的聊天机器人提供支持。本文主要介绍的是 Gemini 聊天机器人的使用。
网页端与移动端使用方法
以下是使用 Gemini 的简明步骤:
- 访问
gemini.google.com
并使用你的 Google 账户登录。 - 在对话窗口中,可以点击模型下拉菜单切换不同的 AI 模型。
- 在主页的输入框中,通过文本、图片或音频输入你的提示词。
- 当 Gemini 生成回复后,你可以进行多种操作:
- 编辑原始提示词
- 输入新的提示词进行追问
- 对回复进行点赞或点踩
- 让 Gemini 重新生成回复
- 分享或复制回复内容
- 对回复进行事实核查
- 收听回复的语音朗读
- 查看同一提示词生成的不同版本回复
接下来,我们深入了解这些操作的细节。
1. 登录 Gemini
首先,访问 gemini.google.com
并点击“登录”。按照提示使用你的 Google 账户登录。如果你还没有账户,可以免费创建一个。
注意:如果你使用的是工作或学校的 Google 账户,管理员可能禁用了 Gemini 的访问权限。
2. 选择 AI 模型
在对话窗口的左上角,你可以点击模型名称的下拉菜单,根据需要切换到不同的 AI 模型。
3. 向 Gemini 提问
你可以通过多种方式向 Gemini 发出指令(部分功能可能仅限于网页端或移动端):
- 文本输入:在文本框中输入你的提示词,然后按
Enter
键或点击提交图标。 - 深度研究 (Deep Research):点击输入框中的“工具”,选择“深度研究”。Gemini 会梳理数百个在线来源和文件,为你提供一份带有引用来源的综合性回复。
- 画布 (Canvas):如果你希望 Gemini 将回复输出到一个独立的文档式界面中,可以点击“工具”并选择“画布”。这会打开一个新画布,方便你对内容进行详细处理。
- 生成或编辑图片:点击“工具”,选择“创建图片”,然后输入你的 AI 绘画提示词。
- 语音输入:点击麦克风图标,通过语音输入你的提示词。
- 上传文件:点击输入框旁的“+”图标上传图片等文件,并附上你的问题。你也可以直接将文件从电脑拖拽到输入框中。
4. 与 Gemini 的回复互动
Gemini 会在数秒内生成格式清晰的回复。你可以对回复进行以下操作:
- 编辑提示词:将鼠标悬停在你的原始提示词上,点击铅笔图标进行修改后重新提交。
- 追问:在下方输入框中继续提问。Gemini 会记住上下文,无需重复信息。
- 评价回复:点击“赞”或“踩”图标,为 Gemini 提供反馈以改进其性能。
- 重新生成:如果对回复不满意,点击回复下方的“重新生成”图标,让 Gemini 使用相同的提示词再次回答。
- 分享与导出:
- 分享对话:点击“分享与导出”图标,选择“分享对话”,然后复制生成的链接。收到链接的人可以查看对话,甚至从你结束的地方继续聊。
- 复制回复:如果只想分享单条回复,点击该回复下方的复制图标即可。
- 事实核查:鉴于 AI 可能会虚构信息,强烈建议进行事实核查。点击回复下方的“更多”(⋮)图标,选择“核查回复”。Gemini 会高亮显示其陈述,点击高亮部分可以查看相关的 Google 搜索结果。
- 收听回复:点击“更多”(⋮)图标,选择“收听”,Gemini 会朗读回复内容。
- 查看不同版本:如果你多次重新生成了回复,可以点击版本号旁边的箭头,在不同版本的回复之间切换查看。
在 Chrome 地址栏中使用 Gemini
你可以在任何 Chrome 窗口的地址栏直接与 Gemini 开始对话:
- 在地址栏输入
@gemini
。 - 在出现的提示中,点击“@gemini - 询问 Gemini”。
- 在地址栏继续输入你的提示词,然后按
Enter
键。 - 页面将跳转到 Gemini 官网,并显示你的问题和答案。之后便可像往常一样继续对话。
使用 Gemini Live 进行语音对话
除了打字,你还可以与 Gemini 进行实时语音对话,Google 称之为 Gemini Live。此功能目前仅在 Gemini 移动应用中提供。
- 打开 Gemini 移动应用。
- 点击 Gemini Live 图标(一个星星悬浮在三条竖线上方)。
- 直接说出你的提示词。说完后,Gemini 会自动处理并用语音回答你,无需手动发送。
- 如果需要暂停,可以说“暂停”或点击暂停按钮。准备好后,点击“继续”即可恢复。
- 对话结束后,点击“结束”按钮。
Gemini 的特色功能
Gemini 的功能远不止于聊天,它还拥有许多实用的特色功能。
与 Google 应用深度集成
通过 Gemini 应用扩展,你可以让 Gemini 从其他 Google 应用中实时获取信息,包括 Gmail、Drive、地图、航班、酒店,甚至 YouTube。
只需在提示词中输入 @
并选择你想要查询的应用,然后提出问题。例如:
- 你可以要求 Gemini 从 Gmail 的一封邮件中提取关键信息,它会在回复中附上邮件链接。
- 你可以让它分享一个存储在 Google Drive 中的文件链接,甚至直接在对话中输出文件内容。
注意:未经你的许可,Gemini 不会访问你的个人内容。但当你通过 Gemini 与其他 Google 服务互动时,相关活动可能会被该服务记录。
此外,通过付费订阅 Gemini for Workspace,你还可以直接在 Google 全家桶应用(如文档、表格)内部使用 Gemini。
生成 AI 图像
Gemini 不仅能从网上搜索图片,还能利用其内置模型(如 Gemini 2.5 Flash)生成全新的 AI 图像。只需输入详细的文字描述,它就能将你的创意变为现实。
生成 AI 视频
Gemini 还能使用 Google Veo 3 模型生成 AI 视频。你可以输入一段描述场景的文字提示词,或者上传一张静态图片作为视觉参考,Gemini 会将其转换成一个带有自然语音和背景音的短视频片段。
为文件生成音频摘要
如果你不想阅读冗长的 PDF 或幻灯片,可以使用 Gemini 的“音频摘要”(Audio Overview)功能。它能将你的文件(如演示文稿、研究论文等)转换成播客风格的音频讨论。
使用方法很简单:上传文件后,点击输入框上方的“生成音频摘要”建议标签即可。根据文件大小,生成过程可能需要一些时间。最终你会得到一段由两个 AI 主持人讨论文件内容的音频,支持在线收听或下载后离线收听。
使用计划操作
Gemini 的“计划操作”(Scheduled actions)功能类似于 ChatGPT 的计划任务。不过,目前它的功能相对有限,主要用于在 Google Tasks 中添加任务或在 Google Calendar 中设置提醒。
使用方法如下:
在输入框中描述你希望 Gemini 做什么、何时执行以及执行频率(如果是重复性任务)。例如,你可以说:“提醒我每周五下午 4 点整理本周工作总结。”
👉 如果你需要 ChatGPT 代充 / Claude / Claude Code / 镜像 / 中转 API:
- 购买 / 了解更多:ai4.plus
- 备用入口:kk4099.com