目 录CONTENT

文章目录

OpenAI要求承包商上传过去工作的成果,以评估AI智能体的性能

Administrator
2026-01-10 / 0 评论 / 0 点赞 / 0 阅读 / 0 字

📢 转载信息

原文链接:https://www.wired.com/story/openai-contractor-upload-real-work-documents-ai-agents/

原文作者:Will Knight, Maxwell Zeff, Zoë Schiffer


据WIRED从OpenAI和培训数据公司Handshake AI获得的记录显示,OpenAI正要求第三方承包商上传他们当前或以前工作场所的真实作业和任务,以便公司可以利用这些数据来评估其下一代AI模型的性能。

该项目似乎是OpenAI努力的一部分,旨在为不同任务建立人类基准表现,然后与AI模型进行比较。今年九月,该公司启动了一项新的评估流程,以衡量其AI模型在各种行业中相对于人类专业人员的表现。OpenAI表示,这是其在实现AGI(即在大多数具有经济价值的任务上超越人类的AI系统)方面取得进展的关键指标。

OpenAI一份机密文件显示:“我们雇佣了来自不同职业的人员,帮助收集基于您全职工作中完成的真实世界任务,以便我们衡量AI模型在这些任务上的表现如何。”文件指示道:“请选取您在职业生涯中完成的现有长期或复杂工作(数小时或数天+)的一部分,并将每一项转化为一个任务。”

根据WIRED查看的一份OpenAI演示文稿,OpenAI要求承包商描述他们在当前或过去工作中完成的任务,并上传他们所做工作的真实示例。演示文稿指出,每一个示例都应该是“一个具体的产出(不是文件的摘要,而是实际的文件),例如Word文档、PDF、PowerPoint、Excel、图像、代码仓库(repo)”。OpenAI表示,人们也可以分享为演示在特定场景中如何真实反应而编造的工作示例。

OpenAI和Handshake AI均拒绝置评。

根据OpenAI的演示文稿,真实世界任务包含两个组成部分:一是任务请求(某人的经理或同事让他们做什么),二是任务交付物(他们为响应该请求而实际完成的工作)。该公司在说明中多次强调,承包商分享的示例应反映他们“确实”做过的“真实的、在职的工作”。

OpenAI演示文稿中的一个示例描述了一个来自“为超高净值个人服务的豪华礼宾公司的资深生活方式经理”的任务。目标是“为计划首次前往巴哈马度假的家庭准备一份简短的、两页的巴哈马七日游概览PDF草稿”。它包含了关于该家庭兴趣和行程应包含内容的额外细节。随后展示的“经验丰富的人类交付物”说明了承包商在此案例中上传的内容:一份为客户创建的真实巴哈马行程。

OpenAI指示承包商从上传的工作文件中删除企业知识产权和个人身份信息。在一项标为“重要提醒”的部分,OpenAI告知工作人员“删除或匿名化任何:个人信息、专有或机密数据、材料性非公开信息(例如内部战略、未发布的产品细节)”。

WIRED查看的文件中提到了一个名为“Superstar Scrubbing”的ChatGPT工具,它提供了如何删除机密信息的建议。

知识产权律师Evan Brown告诉WIRED,以如此大规模接收机密信息的AI实验室可能会面临商业秘密不当得利(trade secret misappropriation)的指控。向AI公司提供先前工作场所文件的承包商,即使经过“擦洗”,也可能因违反先前雇主的保密协议或泄露商业秘密而面临风险。

Brown说:“AI实验室非常信任其承包商来决定什么是机密、什么不是机密。如果真的有东西泄露了出去,AI实验室真的会花时间去确定什么是商业秘密吗?我认为AI实验室正在将自己置于巨大的风险之中。”

这些文件揭示了AI实验室正在使用的一种策略,即让模型擅长处理现实世界任务。像OpenAI、Anthropic和Google这样的公司正在雇佣大量的承包商来生成高质量的训练数据,以开发能够自动化企业工作的AI智能体。

AI实验室长期以来一直依赖Surge、Mercor和Scale AI等第三方承包公司来招聘和管理数据承包商网络。然而,近年来,AI实验室为了改进模型,需要更高质量的数据,这迫使他们为有能力生产这些数据的熟练人才支付更高的费用。这在AI培训领域催生了一个有利可图的子行业。Handshake表示,其在2022年的估值达到了35亿美元,而据报道,Surge在去年夏天的融资谈判中将其自身估值为250亿美元

OpenAI似乎探索了获取真实公司数据的其他途径。一位帮助企业在倒闭后出售资产的人士告诉WIRED,OpenAI的一位代表曾就获取这些公司的数据进行过咨询,前提是可以移除个人身份信息。这位消息人士(因不想破坏任何商业关系而要求匿名)表示,这些数据将包括文件、电子邮件和其他内部通讯。该消息人士表示,他们没有继续推进这一想法,因为他们不确定个人信息是否能被完全清除。




🚀 想要体验更好更全面的AI调用?

欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。

0

评论区