Anthropic 被曝雇 1000 名人类工程师训练 Claude Code,每项任务 280 美元

人类工程师化身“代码教官”,每项任务280美元

根据 Business Insider 报道,Anthropic 与数据标注公司 Snorkel AI 合作,启动代号 “Marlin” 的秘密项目。该项目招募约1000名具备软件工程背景的人类承包商,对 Claude Code 生成的代码进行 A/B 测试——比较两个模型的输出,选择更优结果,并判断代码是否精准满足提示词要求。一名承包商表示,该项目的核心不是让模型 “会写代码”,而是教会其写出更简化、更易维护的代码。

值得注意的是,这标志着数据标注行业的结构性转变:过去低门槛的重复劳动,如今已演变为高专业度的工作。Snorkel 由斯坦福研究人员创办,合作对象包括博士、医学博士和法学博士,顶级专家每周收入可超3000美元。除 Snorkel 外,Scale AI、Mercor 等平台也为软件工程师提供高达110美元/小时的报酬。Anthropic 此举相当于用资深开发者的判断标准为 AI 编程工具 “补课”。

越复杂越拉胯,Claude Code 遭遇“能力退化”投诉

尽管人力训练投入巨大,Claude Code 在实际复杂工程场景中的表现仍不尽人意。用户反馈显示,自2025年2月更新后,该工具在复杂任务中“明显退化”,甚至无法被信任用于大型项目。一位频繁使用四个月的用户称,过去处理网站和落地页效果不错,现在却需反复解释需求,模型还频繁出现“做错后道歉”的循环,导致他不得不借助其他工具进行事实核查。

此外,Claude Code 还会忘记基础工作流程、执行中突然中止。这些反馈迫使 Anthropic 引入人类工程师兜底——本质上是用工程实践中的真实判断弥补模型能力的短板。与此同时,Anthropic 在内部文章《When AI builds itself》中披露,截至2026年5月,其生产代码库中超过80%的代码由 Claude 编写,而2025年2月前这一比例还是个位数。这引发了社区的广泛讨论:当 AI 代码占比激增,人类审核环节是否将成为新瓶颈?

Token 烧不起了!Uber 四个月烧光全年AI预算

AI 编程工具的普及也带来了惊人成本。据钛媒体援引的内部消息,Uber 将 Claude Code 部署给约5000名工程师后,月使用率达95%,但四个月内就耗尽了全年 AI 预算。微软同期紧急关停大部分 Claude Code 授权,强制工程师迁移回自家的 GitHub Copilot。Meta、亚马逊也收紧内部 Token 消耗指标——数十亿美元的计算资源投入后,却几乎看不到可衡量的业务产出。

“Token 从白菜价变成奢侈品”背后是结构性供需失衡:全球 Token 需求年增10倍,而算力增速仅3.4倍。HBM 内存扩产周期长达24~36个月,CoWoS 封装订单已排至2026年底。GPT-5.5 定价翻倍,Gemini 部分场景涨价3倍,Claude API 水涨船高。更有企业因内部排行榜催生“Tokenmaxxing”现象——员工用 AI 执行无意义任务刷排名,亚马逊高管不得不公开喊停。Entelligence.AI 数据显示,每1美元 Token 投入中,只有18美分产生实际价值,44美分用在修复 AI 引入的 Bug 上,27美分返工,11美分被审查摩擦消耗。

现金奶牛 Claude Code 收入暴涨5.5倍,主创“出逃”后回归

尽管成本争议不断,Claude Code 已成为 Anthropic 的营收增长引擎。2025年7月,其开发负责人 Boris Cherny 和产品经理 Cat Wu 曾短暂跳槽至 Cursor(另一家 AI 编程公司),引发业内关注。但两个月后两人又回归 Anthropic。期间,Claude Code 用户基数增长300%,收入飙升5.5倍,累计吸引11.5万开发者用户。Anthropic 还推出了团队仪表盘,追踪代码接受率、支出等关键指标。

值得注意的是,Curso r 的 AI 功能很大程度由 Claude 模型提供支持,因此其增长同样惠及 Anthropic。公司正从“模型即服务”向“垂直解决方案”延伸,推出金融分析平台等产品。与此同时,Anthropic 宣布将 Claude Code 每周限额临时上调50%,并自6月15日起将付费套餐的程序化调用独立计费,转向20至200美元不等的专属模式。这显示 AI 编程工具正从免费或低价获客,走向精细化定价与企业级管控的新阶段。