多客科技 发表于 2025-8-19 20:12

【AI工具教学】Google Gemini CLI 2.0 新版发布:计划/实施模式、GitHub Actions 全面上线

作者:微信文章


本篇整理自油管博主 WorldofAI 的视频《Gemini CLI 2.0 (UPDATE): Powerful Coding Agent Beats Claude Code!》

约一月前,Google 推出开源终端智能体:Gemini CLI。它在本地终端直接调用 Gemini 2.5 Pro,提供约 100 万 token 上下文,并给出每分钟约 60 次、每天约 1000 次的免费额度。此次 v2 更新把它从“命令行助手”升级为“可落地的编码智能体”,重点在工作流与 IDE 集成上。



新能力一:Plan / Implement 双模式

视频中展示了全新的“规划—实施”两种模式。规划模式会把任务拆成可执行路线图;实施模式按规划逐步执行或生成必要代码。这个过程可视、可回溯,适合需求分解、增量式改动与多步任务。


在终端输入:/plan: new Add a model selectorCLI 输出一份可执行计划:




接下来,可以切换到实施模式。

在这个模式下,CLI 会根据计划逐条去执行:自动生成或修改相关文件;更新配置和调用点;在编辑器里给出 diff 对比,让你决定是否应用修改;最后完成测试与验证。

简单来说:Plan 负责拆解任务,Implement 负责照计划落地。这两步配合,就能让开发过程更高效、可控。

新能力二:自定义 Slash 命令与模板

Gemini CLI 新增可复用命令模板与自定义 slash 命令。通过 TOML 配置即可定义提示词、参数与可选的 Shell 指令;命令支持按目录做命名空间管理,便于分类与规模化维护。配合 MCP 提示,可把常用操作固化为“随取随用”的工作流。








新能力三:深度 IDE 集成

现在可在 VS Code 以及 Cursor 等 IDE 中直接联动。








终端与编辑器互通后,支持原生 diff 预览与一键应用改动,更关键的是具备“工作区与选择内容感知”,能围绕当前打开文件、选中片段给出更贴近上下文的建议,减少“跑题”。


新能力四:GitHub Actions(Beta)

新增的 Gemini CLI GitHub Action 让它成为“零成本的 AI 协作队友”。它可以自动分诊 Issue、辅助评审 PR、按标签接收并推进任务,提供代码修改建议并直接提交变更。开发者可在仓库中以更低的人力开销完成日常例行工作。



社区推动的连续迭代

过去一个月里,开源社区持续提交 PR 并被快速合并。视频里提到的显著改进包括自动循环检测以提升可靠性与安全性、Docker 支持、认证流程与稳定性优化、Vim/Emacs 输入模式等。这些更新使得 Gemini CLI 逐步成为“可托付”的终端 AI 编码智能体。

体验与安装要点

确保本地 Gemini CLI 版本不低于 0.1.20,在 VS Code 的集成终端中运行并完成 IDE 安装步骤;需要时再执行 GitHub 相关的初始化与账号连接。作者强调:全局安装后即可获得最新版本,流程相对简单;启用与关闭也可在终端内切换。



适用场景与价值

当你需要把模糊任务拆解为清晰步骤、在一个窗口内完成编辑—对比—应用、把琐碎的 Issue/PR 审查与修修补补交给“智能体”时,Gemini CLI 2.0 的这组更新能直接省时。与以往单点式“问答型助手”不同,它更像一套“可编排、可复用”的开发流程层,把人从频繁上下文切换与重复劳动中解放出来。

注意与边界

视频中提到的新特性仍在快速演进,GitHub Action 处于 Beta 阶段;在引入到关键仓库前,建议先在分支或沙盒仓库验证规则、权限与自动化行为,尤其关注循环检测与权限范围,避免“过度执行”。

小结

Gemini CLI 2.0 用计划/实施双模式、IDE 深度集成与 GitHub Actions,把“AI 编码助手”推进到“可协作、可批量复用的终端智能体”。在免费大上下文与开源社区加速下,它已具备与 Claude Code 等工具同台竞争的实力,值得把它纳入你的日常开发工具链中进行评估与试用。




小白答疑解惑
常见疑问 1:CLI 是什么?

CLI(命令行界面)和 VS Code 这种可视化编辑器不一样。它主要通过输入命令来和程序交互,看起来像黑色窗口。Gemini CLI 就是一个能在命令行里直接调用 Google Gemini 模型的工具。

常见疑问 2:Gemini CLI 和 VS Code 有什么关系?

Gemini CLI 可以独立使用,但 VS Code 集成后体验更好,比如能直接在编辑器里对比代码修改(diff)、结合工作区上下文给出更相关的建议。

常见疑问3:TOML 是什么?
TOML 是一种配置文件格式,用来写命令和参数。它比 JSON、YAML 更简洁,Gemini CLI 里的自定义命令就是通过 .toml文件来定义和组织的。比如 git/commit.toml就对应 /git:commit这个命令。



常见疑问 4:GitHub Actions 听起来很复杂,我需要用吗?

如果你平时不写开源项目,可以暂时忽略。它本质上是一种自动化流程,比如自动分配 Issue、评审 PR。对于团队协作很有价值,但个人试用时不是必需。

常见疑问 5:免费额度能用多少?

目前是 100 万上下文、每日 1000 次请求,足够大多数学习和尝试场景。


欢迎关注我的公众号「雪梨学AI」这里是我作为零基础新手学习者和内容整理者的分享地。如果你也在构建自己的AI学习系统,用 AI 提升效率,欢迎留言分享你的玩法,一起坚持成长!

记得点赞、在看、转发支持我继续更新💛.
页: [1]
查看完整版本: 【AI工具教学】Google Gemini CLI 2.0 新版发布:计划/实施模式、GitHub Actions 全面上线