实测Cursor 项目开发:Claude 3.7 Sonnet、Claude 3.5 Sonnet、Claude 3.7 Sonnet thinking、deepseek-R1 大对决!
今天来一波超刺激的 Cursor 项目开发实测,参战选手有 Claude 3.7 Sonnet 、Claude 3.5 Sonnet、Claude 3.5 Sonnet thinking 以及 deepseek-R1,到底谁能在代码能力上一骑绝尘呢?咱直接开测!
从之前的评测数据来看,Claude 3.7 Sonnet 的代码能力简直把 Claude 3.5 Sonnet 按在地上摩擦,强得不是一星半点。但光看数据可能还不够直观,咱也没啥特别明显的体感。
为了让这次实测更有说服力,可信度直接拉满,按下列需求进行对比:
- 整一个网页复刻,就是为了排除第一轮可能存在的概率胜出这种 “玄学” 情况;
- 再来个响应式网页测试,主要考察对传统前端框架 HTML、CSS 和 JavaScript 代码的理解和实际操作能力。
先给大伙瞅瞅某智慧管理平台的真实截图,就是这么个界面,接下来就看各位 “选手” 的表现啦!
Cursor 设置
deepseek-R1
deepseek-R1 这边呢,生成网站的时候直接给咱报了个 “目前还不支持图片生成” 的提示。这就有点尴尬了,在图片这一块,它直接掉链子,连基本需求都满足不了,看来在这轮比拼里,deepseek-R1 开局就有点拉胯啊。
Claude 3.5 Sonnet 模型
Claude 3.5 Sonnet 模型接到任务后, 开始帮你打工了。一顿操作猛如虎,最后成功生成了页面,点 “Accept ALL” 之后,界面效果出来了。
整体看下来,页面结构是有了,也给了一些建议,像添加交互效果、实现分页功能、添加表格排序功能等等。只能说勉强满足基本需求,有些功能还得咱自己手动优化,这表现也就中规中矩吧,甚至有时候还达不到咱心里预期的效果。
Claude 3.7 Sonnet 模型
Claude 3.7 Sonnet 开始帮你打工了。好家伙,这生成的页面优化项那叫一个多!什么优化分页控件、用 CSS 变量定义颜色主题、添加过渡效果、实现响应式设计等等。
点 “Accept ALL” 后,界面效果简直绝绝子!不仅页面美观度直线上升,交互也变得超流畅,感觉直接copy人工稍微优化一下,直接就能拿去用了。这波操作,直接把其他 “选手” 甩在身后,Claude 3.7 Sonnet 真的是 yyds!
Claude 3.7 Sonnet thinking 模型
Claude 3.7 Sonnet thinking 模型开始干活,生成的页面从外观上看,和 Claude 3.7 Sonnet 的差别不是很大,主要是在细微的样式上做了调整。虽然变化不明显,但也能看出它在优化代码方面下了功夫,不过对整体效果的影响确实不算大。
实测结论
结合这一轮激烈的实测对比,我对 Cursor 搭配不同模型的编程能力有了下面这几个初步结论:
- 需求理解能力:Cursor + deepseek-R1 在图片需求这块直接 “摆烂”,根本满足不了;Cursor + Claude 3.5 Sonnet 也就只能达到基本需求,还时不时掉链子;而 Cursor + Claude 3.7 Sonnet 就厉害了,不仅能满足需求,还能挖掘出咱没说出口的潜在需求,总能给人惊喜。Cursor + Claude 3.7 Sonnet thinking 呢,就是做了些细微调整,对整体影响不大。
- 前端 UI 能力:以前总吐槽 Cursor(+ Claude 3.5 Sonnet)生成的 UI 不咋地,但是换上 Claude 3.7 Sonnet 之后,这个短板一下子就没那么明显了,进步那是肉眼可见;同时要求产品经理输出保真需求原型设计,那么前端开发进一步缩短开发工作量。
- 多模态能力:以前把参考页面丢给 Cursor(+ Claude 3.5 Sonnet)复刻,只能小打小闹,复刻的范围小,精度和细节更是差得远。现在有了 Claude 3.7 Sonnet,复刻的范围、精度和细节全方位提升,简直像开了挂一样。
这波实测下来,Claude 3.7 Sonnet 的表现真的太亮眼了,deepseek-R1还得加把劲啊!不知道后续它们还会不会有新的突破,咱就拭目以待吧!有点感叹前端开发码农有点危险啊,前端不会消失,前端的你可能会消失!