AI 自主研发能力的飙升,让 Anthropic 坐不住了,最近频频发出警示声。
一份最新发布的报告表明,人工智能已经具备了自我完善与自主迭代的潜力,将来无需依赖开发人员也能自行优化。
这个消息就像是在现实中引爆了一颗重磅炸弹。

对此,Anthropic 主张业界应当建立起约束机制,确保各大科技企业停止军备式竞争,采取更加谨慎的态度。
这个机制的核心思想很简单——通过相互验证,使各方都能确保没有人在暗地里进行前沿研究竞赛。

这个提议在网络上激起了广泛讨论,仅短短数小时内,相关帖子的浏览就突破了千万次。
为了更好地理解这一立场,我们有必要深入阅读 Anthropic 的官方报告,但细致阅读后就会发现一些值得思考的地方。
简而言之,尽管报告确实建议放缓研发步伐,但这一建议在现实中很难得到普遍遵循。

让我们逐一拆解这份报告的核心内容。
这份文档的标题是”When AI builds itself”,描述的是 AI 实现自我演进的场景。

本质上,Anthropic 的观点认为 AI 系统已经演进到一个阶段,足以自己完成代码修补和功能增强。

据数据显示,在 Claude Code 推出之前,Anthropic 2025 年 2 月的代码库里有超过 90% 的代码出自工程师之手,而到了今年 5 月,这一比例已经下降到仅 20% 左右。

甚至有公司成员坦诚,自己已经半年多没有手写过代码。
与此同时,AI 生成的代码不仅数量在递增,其质量指标也在持续提升。
以下这张对比图展现了 Claude 在四个等级任务上的表现变化,可以明显看出随着算法迭代,AI 的各难度任务完成率都在上升。
就连那种最具挑战性的、没有固定答案的问题,Claude 现在也能以大约 70% 的概率成功解决。
去年同期这一概率还不足 20%。
颜色从黄到蓝依次代表:基础任务、常见任务、困难任务、探索性问题

根据 Anthropic 内部人士的表述,目前人类工程师与 Claude 编写的代码质量基本持平,而在约一年之后,预计 AI 生成代码的质量将全面超越人类水平。

那么,人类的未来真的如此黯淡?

面对这一问题,Anthropic 声称自己也难以确定,因此为人类未来描绘了三种可能的发展路径。
在第一种情景中,AI 发展将陷入停滞,原因可能是芯片短缺、电力限制或算法瓶颈等多种因素的制约。

但 Anthropic 认为这种情况发生的可能性很小。

第二种假设是 AI 将继续进步但不会经历根本性的质变,人与 AI 携手共建安全可控的系统。
在此场景下,AI 将接手大部分重复劳动,而人类保留监督与决策权限,仅仅角色发生了调整。从表面上看这似乎是一个相对乐观的结局。
第三种则是开头所述的那种令人担忧的未来——AI 掌握充分的创新力,实现完全自动化的自我提升。
此时人工智能进步的唯一限制就是计算资源本身,人类的角色逐渐边缘化。
向未来推进,AI 既可能成为完全听命的劳动力,也可能突破束缚而失去控制。之后会怎样,谁也无法预料。

因此,Anthropic 呼吁建立相互制约的监督框架,鼓励全球合作参与,确保在需要时能及时对 AI 研发踩下制动踏板。
仔细看下去,初步感受是这套逻辑确实有其合理性,但稍作深思就能察觉到些许不协调。
Anthropic 列举了三种前景,但实际上只有一种需要认真对待。第一种是被他们否定的过去,第二种是现在正在发生的事,而第三种才是 A 社真正所忧虑的。与其说三种前景,不如说是步步推进。
而且整份报告的数据源自他们自己的定义、收集和诠释,甚至包括评价,既是出题者又是判卷人,这必然会削弱其说服力。

更何况,AI 研发能否通过协议就如约停止呢?这和核能不同,不是签个《不扩散条约》就能靠监管来约束的。
只要有数据中心就能进行 AI 研发,实际上根本缺乏有效的管制手段。
总不能强制各公司相互开放所有的数据设施,让彼此监视对方如何利用算力吧?
假如真要做到这么透明,Anthropic 应该先想清楚如何开源自己的模型。
否则这类呼吁就显得有点底气不足。

而且 Anthropic 这番建议的发布时机颇有讲究,这家企业一贯以来的风格可谓饱受争议。
许多公司都能推出卓越的模型,但能像 A 社这样始终如一地获得相同评价的屈指可数。
访问 Anthropic 的网站,阅读其企业介绍时,几乎每句话都在强调安全理念。
你会看到他们从产品安全到应用安全的全套措施,甚至为 Claude 制定了专属的安全准则。

可这些措施是否真正有效?现实要复杂得多。
早期,A 社就承诺说,只有在安全设施充分到位后才会展开新一轮模型训练。
但他们没过多久就放弃了这一承诺。
今年 2 月接受《时代》采访时,他们的首席科学家指出,单方面的自我约束并不现实,公司可能会调整这一政策。

说到底,安全和进步在硅谷就像是一个万能筐,什么都往里装。
理想与商业利益相冲突时,安全考量往往得让步于季度盈利和市场竞争。
比如之前大肆渲染危机感的 OpenAI 首席执行官,最近就悄然改变了口径,曾声称 AI 会夺走大量工作岗位,现在却承认之前的论断过于仓促。

英伟达首席执行官黄仁勋则走得更远,在接受采访时指出,当下很多论述极其脱离现实、过度戏剧化,对解决问题毫无帮助,他不理解为什么有些领导者会装作预言家,通过夸大威胁来制造恐慌。

虽然不知道他具体是在批评谁,但从这些声音足以看出,即便在 AI 领域最前沿的人物之间,观点差异也很大。
众所周知,每个人的立场往往决定了他的思维角度,看待问题时难免带上自身的利益考量。

客观来看,Anthropic 最近的日子并不算顺利。
他们新推出的 Claude 4.8 版本并未掀起预期的波澜,再也看不到曾经那种代际领先的势头。
同时 OpenAI 全面出击,在编码和图像领域均表现出色,而其首席执行官更是频频在社交平台为开发者争取计算资源,俨然成了业界的大好人。

面对这样的局势,为了获取更多芯片和运算能力来打造性能更强的模型,Anthropic 决定启动首次公开募股,为融资上市做准备。

汇总这一系列因素,就会发现这份呼吁的分量似乎有所打折。
让我想起了今年参加谷歌 I/O 大会的见闻,DeepMind 首席执行官哈萨比斯在会上告诉大家:
我们正站在 AI 奇点时代的起点。
结果话音还未落,A 社就转身朝后来者说,前面有风险,攀登需谨慎,为了集体利益,我们还是共同停下脚步吧。
这番话看起来也不是完全没道理,毕竟这些企业的顶级研究者确实接触到了常人难以了解的信息。
但仔细琢磨起来,这种表述就像是漂亮而无益的空话。
因为自古至今,只要山峰存在,人们就总想登上去一睹究竟。