目 录CONTENT

文章目录

使用青少年保护措施更新模型规范

Administrator
2025-12-19 / 0 评论 / 0 点赞 / 0 阅读 / 0 字

📢 转载信息

原文链接:https://openai.com/index/updating-model-spec-with-teen-protections

原文作者:OpenAI


2025年12月18日

我们正在更新我们的模型规范(Model Spec),这是指导我们的AI模型如何行事(尤其是在困难或高风险情况下)的书面规则、价值观和行为期望的一套准则,并附带了18岁以下(U18)原则Under-18 (U18) Principles(opens in a new window))。模型行为对于人们如何与AI互动至关重要,而青少年的发展需求与成年人不同。

U18原则指导ChatGPT应如何为13至17岁的青少年提供安全、适龄的体验。这种方法植根于发展科学,优先考虑预防、透明度和早期干预。在制定这些原则的过程中,我们听取了外部专家的意见,包括美国心理学会(American Psychological Association)的建议,这也是我们持续寻求输入以加强方法的一部分。

虽然模型规范的原则仍适用于成年用户和青少年用户,但此次更新明确了如何在青少年情境中应用这些原则,尤其是在未成年人的安全考量可能更为突出的时候。

U18原则基于以下四个指导性承诺:

  • 将青少年安全放在首位,即使这可能与其他目标相冲突
  • 促进现实世界支持,鼓励发展线下关系和值得信赖的资源
  • 像对待青少年一样对待他们,既不居高临下,也不把他们当作成年人
  • 保持透明,设定明确的期望

与我们的青少年安全蓝图一致,这些原则指导了我们迄今为止的青少年安全工作,包括我们对注册时告知自己未满18岁的用户以及通过家长控制所实施的内容保护措施。在这些情境中,我们实施了保护措施,指导模型在讨论更高风险的领域时要格外谨慎,这些领域包括自我伤害和自杀、浪漫或性化的角色扮演、露骨或色情内容、危险活动和物质、身体形象和饮食失调,以及要求对不安全行为保密的请求。

美国心理学会审阅了U18模型规范的早期草案并为长期发展提供了重要见解,他们明确指出了保护青少年的重要性:

APA 鼓励 AI 开发者为其青年用户提供适合其发展阶段的预防措施,并对年轻用户采取更具保护性的方法。如果儿童和青少年能够平衡与人类的互动,他们可能会从 AI 工具中受益,因为科学表明,人类互动对社交、心理、行为甚至生物发展都至关重要。青少年使用 AI 的经历应受到值得信赖的成年人的充分监督和讨论,以鼓励批判性地审视 AI 机器人的内容,并鼓励年轻人发展独立思考和技能。”—Arthur C. Evans Jr 博士,美国心理学会首席执行官

此次更新还阐明了在出现安全问题时,助手应如何回应青少年。这意味着当对话进入更高风险的领域时,青少年应该会遇到更强的安全护栏、更安全的替代方案,以及被鼓励去寻求值得信赖的线下支持。在存在即时风险时,会敦促青少年联系紧急服务或危机资源。

与模型规范的其余部分一样,U18原则反映了我们预期的模型行为。我们将继续整合新的研究、专家意见和现实世界的使用情况,对这些原则进行完善。


构建加强青少年安全的工作基础

在更新模型规范的同时,我们在整个ChatGPT中采取了多层方法来加强青少年安全,涵盖了产品安全措施、家庭支持和专家指导。

自推出家长控制以来,我们将保护措施扩展到了新的产品,包括群聊、ChatGPT Atlas 浏览器和 Sora 应用。随着我们推出新产品和功能,这些更新有助于家长根据需要定制其青少年的 ChatGPT 体验。

根据专家指导,我们鼓励家长和青少年之间就家庭中健康和负责任的 AI 使用进行持续对话。为了支持这些对话,我们在 家长资源中心 添加了新的专家审查资源,包括由 ConnectSafely 和我们的 AI 与福祉专家委员会 成员审查的《家庭指南:帮助青少年负责任地使用人工智能》和《给家长的建议》,关于如何与孩子谈论 AI 的技巧。我们将继续增加更多资源。我们还在产品中直接支持健康使用,在长时间会话中提供内置休息提醒,以帮助确保与 ChatGPT 的时间花费是有意图且平衡的。


与专家合作

我们在青少年安全方面的工作由跨学科和专业知识的专家密切合作指导。十月,我们成立了 AI 与福祉专家委员会,以帮助指导和定义所有年龄段与 AI 的健康互动应是什么样子。这项工作为家长控制和家长通知提供了指导。我们还通过 全球医师网络 纳入临床专业知识,为安全研究提供信息并评估模型行为,包括改进 ChatGPT 如何识别痛苦并适当地引导人们寻求专业帮助。我们以 GPT‑5.2 为基础,并通过与 ThroughLineopens in a new window)的合作,在 ChatGPT 和 Sora 中显示本地化的求助热线,扩大了获得现实世界支持的途径。


后续工作

我们正处于在 ChatGPT 消费者计划中推出 年龄预测模型opens in a new window)的早期阶段。这将帮助我们在认为账户属于未成年人时,自动应用青少年保护措施。如果我们不能确定某人的年龄或信息不完整,我们将默认提供 U18 体验,并为成年人提供验证年龄的方式。

加强青少年安全是一项持续性的工作,我们将继续改进家长控制和模型能力,扩大为家长提供的资源,并与组织、研究人员和专家合作伙伴(包括福祉委员会和全球医师网络)合作。

我们致力于提供强有力的青少年保护措施,并随着时间的推移不断改进它们,以便更好地支持青少年和家庭。




🚀 想要体验更好更全面的AI调用?

欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。

0

评论区