📢 转载信息
原文链接:https://www.wired.com/story/openai-contractor-upload-real-work-documents-ai-agents/
原文作者:Will Knight, Maxwell Zeff, Zoë Schiffer
据WIRED获取的OpenAI和培训数据公司Handshake AI的记录显示,OpenAI正在要求第三方承包商上传他们当前或以前工作场所的真实任务和作业,以便利用这些数据来评估其下一代人工智能模型的性能。
该项目似乎是OpenAI努力的一部分,旨在为不同任务建立一个人类基准,以便与AI模型进行比较。去年9月,该公司启动了一项新的评估流程,以衡量其AI模型在各种行业中相对于人类专业人员的表现。OpenAI表示,这是其在实现AGI(即在大多数具有经济价值的任务上超越人类的AI系统)方面取得进展的一个关键指标。
OpenAI一份保密文件显示:“我们雇佣了来自不同职业的人员,帮助收集基于您在全职工作中完成的真实世界任务,以便我们衡量AI模型在这些任务上的表现如何。”文件进一步说明:“请将您在职业生涯中完成的、耗时较长或复杂的现有工作(数小时或数天以上)中的一部分,将其转化为一个任务。”
根据WIRED查看的一份OpenAI演示文稿,OpenAI要求承包商描述他们在当前或过去工作中完成的任务,并上传他们所做工作的真实示例。演示文稿指出,每一个示例都应该是“一个具体的产出(不是文件的摘要,而是实际文件),例如Word文档、PDF、Powerpoint、Excel、图像、代码库”。OpenAI表示,人们也可以分享为演示特定场景中如何做出实际回应而编造的工作示例。
OpenAI和Handshake AI拒绝置评。
根据OpenAI的演示文稿,真实世界任务包含两个组成部分。一个是任务请求(某人的经理或同事要求他们做什么),另一个是任务交付物(他们响应该请求而实际制作的工作成果)。该公司在说明中多次强调,承包商分享的示例应反映他们“实际”做过的“真实、在职工作”。
OpenAI演示文稿中的一个例子概述了一项来自“为超高净值人士提供服务的豪华礼宾公司的高级生活方式经理”的任务。目标是“为第一次前往巴哈马度假的家庭准备一份简短的、两页的PDF草稿,概述为期7天的游艇之旅”。其中包含了关于该家庭兴趣和行程应包含内容的附加细节。“有经验的人类交付物”随后展示了承包商在这种情况下会上传的内容:为客户创建的真实巴哈马行程。
OpenAI指示承包商从上传的工作文件中删除公司知识产权和个人身份信息。在标记为“重要提醒”的部分,OpenAI告知工作人员“删除或匿名化任何:个人信息、专有或机密数据、材料非公开信息(例如内部策略、未发布的产品细节)”。
WIRED查看的文件之一提到了一个名为“Superstar Scrubbing”的ChatGPT工具,该工具提供有关如何删除机密信息的建议。
知识产权律师Evan Brown告诉WIRED,以如此大规模接收机密信息的AI实验室可能会面临商业秘密不当使用的指控。向AI公司提供先前工作文件的承包商,即使经过清理,也可能因违反先前雇主保密协议或泄露商业秘密而面临风险。
布朗说:“AI实验室在多大程度上信任其承包商来决定什么是机密,什么不是?如果他们确实让某些信息泄露了,AI实验室是否真的会花时间来确定什么是商业秘密,什么不是?在我看来,AI实验室将自己置于巨大的风险之中。”
Photo-Illustration: WIRED Staff; Getty Images
这些文件揭示了AI实验室正在使用的、旨在让其模型在真实世界任务中表现出色的策略之一。像OpenAI、Anthropic和Google这样的公司正在雇佣大量的承包商,他们可以生成高质量的训练数据,以开发能够自动化企业工作的AI代理。
AI实验室长期以来一直依赖Surge、Mercor和Scale AI等第三方承包公司来招聘和管理数据承包商网络。然而,近年来,AI实验室为了改进模型,要求更高质量的数据,迫使它们为有能力生产这些数据的熟练人才支付更高的费用。这在AI培训领域催生了一个有利可图的子行业。Handshake表示其在2022年的估值为35亿美元,而Surge在去年夏天的融资谈判中估值据报道达到250亿美元。
OpenAI似乎还探索了获取真实公司数据的其他方式。一位帮助企业在倒闭后出售资产的人士告诉WIRED,OpenAI的一名代表曾就获取这些公司的数据进行过询问,前提是可以删除个人身份信息。这位消息人士(因不希望破坏任何商业关系而要求匿名)表示,这些数据将包括文件、电子邮件和其他内部通信。该消息人士表示,他们选择不推进这一想法,因为他们对个人信息能否被完全清除没有信心。
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。
评论区