Gemini 3 上手实测：Sonnet 3.5 还在“删库跑路”，它几分钟就把功能写完了

绷不住了，Google 这次是真的要把桌子掀了。

前两天 Gemini 3 发布，我第一时间拿到了 Antigravity（Google 官方的 AI IDE）的内测资格。本来以为又是 Google 的“常规操作”——发个 Demo 视频炸场，实际一用全是 Bug。

结果测完我彻底飘了：这哪里是 IDE，这简直是把一个高级工程师塞进了浏览器里。

为了验证它到底有多强，我拿自己正在做的项目 markdowntoimage.com 试了试水。

任务很简单：给网站加一个 “Markdown to Cards” 的新功能，把 Markdown 文字转成多张卡片图片。技术栈是 Next.js + TailwindCSS + Prisma。

同样的任务，我先用目前公认最强的 Claude 3.5 Sonnet 试了一遍，又用 Gemini 3 跑了一遍。

结果？Sonnet 3.5 还在因为格式错误“删库跑路”的时候，Gemini 3 已经把功能上线了。

话不多说，直接看实测对比。

Round 1：它懂我想干啥

Sonnet 3.5：你说什么，我做什么
Gemini 3：你没说的，我也懂

做这个功能时，我给的指令其实比较模糊：“增加一个 Markdown 转多张图片的功能”。

Sonnet 3.5 的反应是典型的“听话型选手”。它确实去改了代码，但改得非常机械。我不告诉它具体的样式、不告诉它要关联修改哪个组件，它就真的不动。

结果就是，我得像挤牙膏一样，一次次提醒它：“这里样式不对”、“那里逻辑没闭环”。

到了 Gemini 3 这里，画风突变。

它不仅听懂了我要做什么，还自动理解了我的潜在意图。

它自己去看了我的现有代码风格，发现我用了 TailwindCSS，就自动把新组件的样式配好了；发现我用了 Prisma，就自动把数据库 Schema 也顺手改了。

这种感觉就像，你跟一个初级外包说“加个功能”，他问你“文档在哪”；你跟一个高级工程师说“加个功能”，他说“搞定了，顺便帮你优化了一下数据库”。

Round 2：改大文件

Sonnet 3.5：格式不对？那我删了重写吧
Gemini 3：小问题，我帮你修

这绝对是 Sonnet 3.5 最大的槽点，没有之一。

一旦文件行数超过 1000 行，Sonnet 3.5 就开始“发癫”。稍微有一点格式错误，或者括号没对齐，它就识别不了。

最灾难的是，它识别不了的时候，居然会选择直接删除文件内容，试图重写！

我眼睁睁看着它把我的核心逻辑文件删得只剩几行，当时心态就崩了。

反观 Gemini 3，稳如老狗。

同样的 1000+ 行大文件，Gemini 3 不仅读得飞快，而且容错率极高。遇到格式小错误，它能自己识别出来：“哦，这里少了个括号”，然后默默修好，继续执行任务。

这种长窗口下的稳定性，才是 Gemini 3 真正的护城河。

Round 3：拼手速

Sonnet 3.5：磨磨唧唧 20 分钟 Gemini 3：一发入魂 5 分钟

Sonnet 3.5 完成这个功能，前前后后花了我快 20 分钟。中间经历了无数次“报错-修复-再报错-再修复”的循环。

Gemini 3 呢？

从我敲下指令，到它生成 Plan，再到代码落地、功能跑通，全程不到 5 分钟。

而且是一次性通过，没有反复横跳。

这种效率的提升，不是 30% 或 50%，而是代际级别的碾压。

Round 4：自动化测试 (Computer Use)

这是最让我起鸡皮疙瘩的地方。

代码写完了，通常我们得自己去浏览器里点一点，看看功能对不对。

但在 Antigravity 里，Gemini 3 直接调用了 Computer Use 能力。它自己打开了一个内置浏览器，输入 URL，然后像真人一样去点击按钮、输入 Markdown 测试文本。

它甚至能自己判断：“哦，这里生成的图片样式有点歪”，然后切回代码编辑器，修好 Bug，再切回浏览器重测。

看着屏幕上鼠标自己动来动去，我第一次感觉：程序员这个职业，可能真的要变天了。

最终成果

几分钟后，功能完美上线。

祛魅时刻：强是真强，门槛也是真高

吹了这么多，是不是觉得 Gemini 3 完美无缺？

但你别急，槽点也不少。

首先是网络门槛。Google 这次的风控简直是“变态级”。对 IP 的要求极高，环境稍微不干净一点，直接连门都进不去。

其次是IDE 体验。Antigravity 毕竟还是公测版（Preview），Web IDE 的性能优化还没跟上。多轮对话之后，界面会明显变卡，有时候甚至需要刷新页面才能继续。

最后是配额限制。Gemini 3 目前不适合多次反复修改。如果你像用 Sonnet 那样反复调教它，很容易触发 Rate Limit，直接给你锁死，不让用了。

总结：编程的终局

测完 Gemini 3，我有一个强烈的预感：AI 编程的“Copilot 时代”要结束了，“Agent 时代”真的来了。

以前我们用 Copilot，是把它当副驾驶，手还得放在方向盘上。

现在用 Gemini 3，更像是雇了个代驾。你告诉它去哪，然后就可以在后座打个盹了。

虽然现在的“代驾”还比较挑车（IP 限制）、偶尔也会急刹车（IDE 卡顿），但它展现出的那种对复杂任务的掌控力，确实让人看到了未来的样子。

Sonnet 3.5，是时候歇歇了。