← 返回

AI训练数据行业兴起:高学历劳动者陷入零工经济困局

随着人工智能技术发展,全球兴起大量AI训练数据生产平台,如Mercor、Scale AI和Surge AI,这些公司雇佣数万名高学历专业人士,包括律师、作家、科学家和教师,为AI模型提供训练数据。然而,这些工作具有高度不稳定性,任务突然暂停、薪酬降低、工作时间被严密监控,且工人常被突然解雇。尽管部分工人月收入可观,但普遍面临心理压力、家庭疏离和职业前景黯淡问题。行业内部存在严重保密协议,工人无法组织工会或集体谈判,形成类似Uber的零工经济模式,引发法律诉讼和对劳动权益的担忧。

AI训练数据行业兴起:高学历劳动者陷入零工经济困局

近日,全球AI训练数据生产行业快速发展,吸引大量高学历专业人士参与。平台如MercorScale AI和Surge AI通过AI面试和自动化评估招聘数万名专家,涵盖法律、金融、教育、创意写作、工程等多个领域,为大型AI公司如OpenAI和Anthropic提供训练数据。

这些工作内容包括撰写AI提示词、设计评分标准(rubrics)、生成“黄金输出”(golden output)以及创建“推理轨迹”(reasoning trace)。尽管部分岗位初期薪酬较高,如Mercor曾提供每小时45美元,但随后普遍出现任务中断、薪酬下降、工作时间延长及突然解雇现象。工人被要求在Insightful等监控软件下工作,系统记录每一秒操作,非生产时间可能被扣薪。

工人普遍反映工作不稳定,项目常以“scope changes”为由突然终止。Mercor的Meta项目曾从每小时21美元降至16美元,引发上千名工人抗议,但公司未提供解释。部分工人被迫在社交媒体上匿名发帖,因公司监管严格,真实项目代号被进一步伪装。一些工人在项目中被要求录制敏感内容,面临精神压力和伦理困境。

行业内部存在严重保密协议,禁止员工透露客户信息或工作细节,导致工人无法建立职业连续性或集体谈判。即使拥有硕士或博士学位,工人仍被视为可替代的“数据生产者”,面临“挖自己坟墓”的困境。部分工人转而从事咖啡店、餐厅等传统服务行业,寻求更稳定的工作环境。

目前,美国加州已对Mercor、Scale AI等公司提起三起集体诉讼,指控其将工人错误归类为独立承包商,实际施加“非凡控制”。法律界担忧,若无有效监管,该行业可能引发全球范围内“数据劳工”的系统性剥削。


行业背景与趋势

AI模型进步依赖大量高质量训练数据。2023年,Mercor由三位19岁创始人创立,最初为海外工程师求职平台,后转型为AI数据供应商,估值达100亿美元,成为全球最年轻亿万富翁团队。Scale AI宣称拥有70万硕士、博士及本科毕业生,Surge AI则招聘麦肯锡专家、最高法院律师及格莱美获奖音乐人。

数据供应链高度复杂,包括撰写评分标准、评估模型输出、生成理想答案、模拟企业环境(“世界构建”)及制作语音对话等任务。部分项目要求工人在虚拟公司环境中协同创作数百份文档,如财务预测、会议记录和项目提案,用于测试AI在模拟场景中的表现。


工人困境与社会影响

工人普遍经历心理压力和家庭关系紧张。一位单亲母亲Mimi表示,因工作需随时响应Slack消息,导致无法陪伴孩子,甚至因孩子找不着学习用品而情绪崩溃。她称:“工作正在把我变成恶魔。”另一位工人Lindsay在项目被突然取消后,被邀请加入同质化新项目,薪酬却下降24%,且失去团队沟通渠道,工作环境陷入“绝对混乱”。

行业采用“9-9-6”工作模式,即每日早9点至晚9点,每周工作6天。年轻管理层(多为20多岁)缺乏管理经验,对高级专业人士缺乏尊重,常以“使用你的判断”等模糊指令回复,引发不满。部分工人因压力转向AI辅助,但公司严格禁止AI生成内容,以防“模型坍塌”(model collapse)。


法律与监管挑战

目前,美国加州已对Mercor等公司提起集体诉讼,指责其通过严密监控和非正式解雇机制,实质上将工人当作雇员管理,却规避雇佣责任。类似诉讼已针对Surge AI和Scale AI提起,后者正在和解中。

MIT经济学家Daron Acemoglu将该现象比作工业革命前的织工,技术不仅夺走工作,更重塑劳动组织方式,使资本拥有绝对控制权,直到劳工组织和监管介入。他呼吁建立“数据工会”式组织,以防止大公司通过“分而治之”策略压低数据价格,保护数据生产者的合法权益。


未来展望

AI训练数据行业在推动技术进步的同时,也暴露出深刻的社会问题。随着AI模型能力提升,任务难度增加,工人面临“被抽取知识”的困境。一位语言学硕士表示,他已无法再“难倒”模型,因为模型能准确检索其提出的冷门理论或原住民语言,最终项目结束,他失业五个月,不知何去何从。

当前,数据生产者承受着“技术进步的代价”,而政策制定者尚未有效回应。若不建立合理监管框架,该行业可能加剧社会不平等,使高学历劳动者陷入前所未有的不稳定零工经济之中。

编辑点评

该新闻揭示了人工智能发展进程中一个被忽视的结构性矛盾:技术进步与劳动保护之间的严重脱节。AI训练数据生产行业本质上是全球范围内对‘人类智慧’的大规模工业化采集,其模式高度集中于平台经济,工人被置于极端不稳定的劳动环境中。

从全球影响看,这一现象不仅限于美国,其模式已蔓延至印度、越南等国,形成全球数据劳工网络。这重塑了知识型工作的边界,使律师、作家、科学家等传统高知职业沦为‘数据生产者’,其劳动价值被压缩至最低。这种‘数字血汗工厂’的出现,挑战了现有劳动法体系,特别是在独立承包商与雇员的界定上,具有深远的法律与社会意义。

经济层面,该行业本质是AI公司为应对‘模型瓶颈’而采取的‘外包式创新’,即通过大量人力生成高质量数据以突破技术瓶颈。但这种模式不可持续,当模型能力逼近人类水平时,数据需求将锐减,导致工人集体失业。这预示着未来可能出现‘技术失业’与‘数据劳工崩溃’的双重危机。

长期来看,若无政策干预,该行业可能固化为‘数字剥削’的新范式。借鉴历史经验,工业革命初期的织工也曾面临类似困境,最终通过工会运动与法律改革获得保护。当前,全球需要推动‘数据劳工权’立法,建立类似于《数字服务法案》的监管框架,确保AI发展红利能公平分配,而非仅由资本垄断。否则,技术进步可能加剧社会分化,引发更深层次的结构性危机。

相关消息:https://www.theverge.com/cs/features/877388/white-collar-workers-training-ai-mercor
当日日报:查看 2026年03月10日 当日日报