📢 转载信息
原文链接:https://openai.com/index/our-approach-to-age-prediction
原文作者:OpenAI
我们正在向 ChatGPT 消费者计划推出年龄预测功能,旨在确定账户很可能属于未满18岁的用户,以便为其应用正确的体验和安全保障措施。
正如我们在《青少年安全蓝图》和《关于模型行为的未满18岁原则》中所概述的,年轻人应该获得既能拓展机遇又能保护其福祉的技术。
年龄预测建立在已有的保护措施之上。在注册时告知我们未满18岁的青少年会自动获得额外的安全保障,以减少接触敏感或潜在有害内容的风险。这也有助于我们像对待成年人一样对待成年人,并在安全范围内的用户期望方式下使用我们的工具。
我们此前分享了有关年龄预测的早期计划,今天随着部署的进行,我们分享更多细节。
年龄预测的工作原理
ChatGPT 使用一个年龄预测模型来帮助估算账户很可能属于未满18岁的用户。该模型会考察行为和账户层面的信号组合,包括账户存在时长、用户活跃的典型时间段、随时间变化的用法模式以及用户声明的年龄。部署年龄预测有助于我们了解哪些信号可以提高准确性,我们会利用这些学习成果随着时间的推移持续改进模型。
如果用户被错误地分配到未满18岁的体验中,他们将始终可以通过 Persona(一个安全的身份验证服务)使用自拍来快速、简单地确认其年龄并恢复全部访问权限。用户可以随时通过进入“设置 > 账户”来检查是否已为其账户添加了安全保障措施,并启动此流程。
当年龄预测模型估计某个账户可能属于未满18岁的用户时,ChatGPT 会自动应用旨在减少敏感内容暴露的额外保护措施,例如:
- 图形暴力或血腥内容
- 可能鼓励未成年人进行冒险或有害行为的网络挑战(Viral challenges)
- 色情、浪漫或暴力角色扮演
- 自残行为的描述
- 宣传极端美貌标准、不健康节食或身材羞辱的内容
这种方法以专家意见为指导,根植于有关儿童发展科学的学术文献,并承认青少年在风险感知、冲动控制、同伴影响和情绪调节方面存在的已知差异。虽然这些内容限制有助于减少青少年接触敏感材料的风险,但我们专注于持续改进这些保护措施,特别是要解决绕过我们安全保障的尝试。当我们对某人的年龄没有把握或信息不完整时,我们会默认采用更安全的体验。
除了这些安全措施外,家长还可以选择通过家长控制(在新窗口中打开)进一步定制其青少年的体验,包括设置 ChatGPT 无法使用的“安静时间”,控制如记忆或模型训练等功能,并在检测到急性痛苦迹象时接收通知。
后续步骤
我们正在从初步部署中吸取经验教训,并继续提高年龄预测的准确性。我们将密切跟踪部署情况,并利用这些信号来指导持续改进。
在欧盟,年龄预测将在未来几周内推出,以考虑地区要求。如需更多详细信息,请访问我们的帮助页面(在新窗口中打开)。
虽然这是一个重要的里程碑,但我们为支持青少年安全所做的工作仍在继续。我们将与包括美国心理学会(American Psychological Association)、ConnectSafely 和全球医生网络(Global Physicians Network)在内的专家保持对话,持续分享我们的进展和学习到的经验。
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。
评论区