当前位置: 首页 » AI » AI编程 » Gemini 3 上手实测:Sonnet 3.5 还在“删库跑路”,它几分钟就把功能写完了

Gemini 3 上手实测:Sonnet 3.5 还在“删库跑路”,它几分钟就把功能写完了

绷不住了,Google 这次是真的要把桌子掀了。

前两天 Gemini 3 发布,我第一时间拿到了 Antigravity(Google 官方的 AI IDE)的内测资格。本来以为又是 Google 的“常规操作”——发个 Demo 视频炸场,实际一用全是 Bug。

结果测完我彻底飘了:这哪里是 IDE,这简直是把一个高级工程师塞进了浏览器里。

为了验证它到底有多强,我拿自己正在做的项目 markdowntoimage.com 试了试水。

任务很简单:给网站加一个 “Markdown to Cards” 的新功能,把 Markdown 文字转成多张卡片图片。技术栈是 Next.js + TailwindCSS + Prisma。

同样的任务,我先用目前公认最强的 Claude 3.5 Sonnet 试了一遍,又用 Gemini 3 跑了一遍。

结果?Sonnet 3.5 还在因为格式错误“删库跑路”的时候,Gemini 3 已经把功能上线了。

话不多说,直接看实测对比。

Round 1:它懂我想干啥

Sonnet 3.5:你说什么,我做什么 
Gemini 3:你没说的,我也懂

做这个功能时,我给的指令其实比较模糊:“增加一个 Markdown 转多张图片的功能”。

Sonnet 3.5 的反应是典型的“听话型选手”。它确实去改了代码,但改得非常机械。我不告诉它具体的样式、不告诉它要关联修改哪个组件,它就真的不动。

结果就是,我得像挤牙膏一样,一次次提醒它:“这里样式不对”、“那里逻辑没闭环”。

到了 Gemini 3 这里,画风突变。

它不仅听懂了我要做什么,还自动理解了我的潜在意图

它自己去看了我的现有代码风格,发现我用了 TailwindCSS,就自动把新组件的样式配好了;发现我用了 Prisma,就自动把数据库 Schema 也顺手改了。

这种感觉就像,你跟一个初级外包说“加个功能”,他问你“文档在哪”;你跟一个高级工程师说“加个功能”,他说“搞定了,顺便帮你优化了一下数据库”。

Round 2:改大文件

Sonnet 3.5:格式不对?那我删了重写吧 
Gemini 3:小问题,我帮你修

这绝对是 Sonnet 3.5 最大的槽点,没有之一。

一旦文件行数超过 1000 行,Sonnet 3.5 就开始“发癫”。稍微有一点格式错误,或者括号没对齐,它就识别不了。

最灾难的是,它识别不了的时候,居然会选择直接删除文件内容,试图重写!

我眼睁睁看着它把我的核心逻辑文件删得只剩几行,当时心态就崩了。

反观 Gemini 3,稳如老狗。

同样的 1000+ 行大文件,Gemini 3 不仅读得飞快,而且容错率极高。遇到格式小错误,它能自己识别出来:“哦,这里少了个括号”,然后默默修好,继续执行任务。

这种长窗口下的稳定性,才是 Gemini 3 真正的护城河。

Round 3:拼手速

Sonnet 3.5:磨磨唧唧 20 分钟 Gemini 3:一发入魂 5 分钟

Sonnet 3.5 完成这个功能,前前后后花了我快 20 分钟。中间经历了无数次“报错-修复-再报错-再修复”的循环。

Gemini 3 呢?

从我敲下指令,到它生成 Plan,再到代码落地、功能跑通,全程不到 5 分钟

而且是一次性通过,没有反复横跳。

这种效率的提升,不是 30% 或 50%,而是代际级别的碾压

Round 4:自动化测试 (Computer Use)

这是最让我起鸡皮疙瘩的地方。

代码写完了,通常我们得自己去浏览器里点一点,看看功能对不对。

但在 Antigravity 里,Gemini 3 直接调用了 Computer Use 能力。它自己打开了一个内置浏览器,输入 URL,然后像真人一样去点击按钮、输入 Markdown 测试文本。

它甚至能自己判断:“哦,这里生成的图片样式有点歪”,然后切回代码编辑器,修好 Bug,再切回浏览器重测。

看着屏幕上鼠标自己动来动去,我第一次感觉:程序员这个职业,可能真的要变天了。

最终成果

几分钟后,功能完美上线。

祛魅时刻:强是真强,门槛也是真高

吹了这么多,是不是觉得 Gemini 3 完美无缺?

但你别急,槽点也不少。

首先是网络门槛。Google 这次的风控简直是“变态级”。对 IP 的要求极高,环境稍微不干净一点,直接连门都进不去。

其次是IDE 体验。Antigravity 毕竟还是公测版(Preview),Web IDE 的性能优化还没跟上。多轮对话之后,界面会明显变卡,有时候甚至需要刷新页面才能继续。

最后是配额限制。Gemini 3 目前不适合多次反复修改。如果你像用 Sonnet 那样反复调教它,很容易触发 Rate Limit,直接给你锁死,不让用了。

总结:编程的终局

测完 Gemini 3,我有一个强烈的预感:AI 编程的“Copilot 时代”要结束了,“Agent 时代”真的来了。

以前我们用 Copilot,是把它当副驾驶,手还得放在方向盘上。

现在用 Gemini 3,更像是雇了个代驾。你告诉它去哪,然后就可以在后座打个盹了。

虽然现在的“代驾”还比较挑车(IP 限制)、偶尔也会急刹车(IDE 卡顿),但它展现出的那种对复杂任务的掌控力,确实让人看到了未来的样子。

Sonnet 3.5,是时候歇歇了。

滚动至顶部