试用了 GitHub Copilot 的 Opus 4.7,整体体验并不理想。
我拿一个从零开始的工具类项目做测试,前后尝试了 5 次,竟然有 3 次直接被拒绝。理由都是认为这个项目需要团队投入数周甚至数月,超出了 AI 能完成的范围。但实际上,这个项目代码量最多也就一万行左右,我一个人一个周末完全可以完成。
这种“直接拒绝”的处理方式确实有些过头,系统级提示词到底是如何设计的?类似情况在 4.6 版本中从未出现过。当初难度更高的项目(比如维基萌公会)都能被耐心完成。
在我不断调整提示词、强烈要求之后,有 2 次成功执行,但结果质量依然不尽如人意,问题包括但不限于:
功能缺失、逻辑遗漏
声称“已完成”,但实际并未完成
无视我提供的前端代码,自行重新实现
在一个表单中,将多个字段通过遍历逐个提交的低效做法
这些问题,本质上更像是思考深度不足导致的。相比之下,Github Copilot 版的 4.6 思考深度是高,而 4.7 是中。
总体来说,4.7 在价格提升数倍的情况下,却带来了明显下降的体验,难免让人失望。更何况还强制下架了 4.6,以“升级”为名降低成本,这种做法确实难以令人认同。