Mercor 4TB语音样本被盗,涉及4万名AI承包商
2026年4月4日,黑客组织Lapsus$在其泄露网站上公布了Mercor的泄露数据,涉及约4TB的语音样本和身份文件。这些数据来自于4万名AI承包商,他们在为AI训练提供数据标注、录音和验证通话时被收集。此次泄露的数据不仅包括语音样本,还包括承包商的政府颁发的身份证明文件,形成了一个完整的生物识别信息库。此类数据的泄露可能被用于合成语音克隆服务,尤其是当高质量语音克隆只需15秒的清晰参考音频时,Mercor的录音平均每个承包商提供2到5分钟的高质量语音,远超所需门槛。这一事件引发了多起法律诉讼,原告指控公司在未明确告知的情况下收集了永久性的生物识别标识符。