目 录CONTENT

文章目录

GPT-5.1:更智能、更具对话性的 ChatGPT

Administrator
2025-11-13 / 0 评论 / 0 点赞 / 0 阅读 / 0 字

📢 转载信息

原文链接:https://openai.com/index/gpt-5-1

原文作者:OpenAI


2025年11月12日

GPT-5.1:更智能、更具对话性的 ChatGPT

我们正在升级 GPT‑5 系列模型,同时让 ChatGPT 更易于定制。今天开始向所有人推出,首先面向付费用户。

今天,我们通过发布以下内容来升级 GPT‑5 系列:

  • GPT‑5.1 Instant:我们最常用的模型,现在默认更热情、更智能,并且更擅长遵循您的指令。
  • GPT‑5.1 Thinking:我们先进的推理模型,现在更容易理解,在简单任务上更快,在复杂任务上更持久。

我们从用户那里清楚地了解到,优秀的 AI 不仅要智能,而且要乐于交谈。GPT‑5.1 在智能和交流风格上都有了显著的改进。

我们还让您更容易塑造 ChatGPT 的语气。人们对聊天风格的偏好各不相同——因人而异,甚至在不同的对话中也不同——所以我们正在引入更直观、更有效的控制,以便 ChatGPT 能够更好地匹配您想要的回复语气。

GPT‑5.1 Instant

GPT‑5.1 Instant 是 ChatGPT 使用最频繁的模型,它现在默认更热情且更具对话性。根据早期测试,它在保持清晰和有用的同时,其俏皮性常常让人感到惊喜。

我感到压力很大,需要一些放松的建议

GPT-5

这里有一些简单、有效的减压方法——你可以根据自己的感受和拥有的时间来组合使用:


🧘‍♀️ 快速重置 (1–5 分钟)
  • 深呼吸: 尝试 4-7-8 法——吸气 4 秒,屏住 7 秒,呼气 8 秒。重复 4 轮。
  • 渐进式放松: 从脚趾开始,收紧再放松身体的每一组肌肉,直到头部。
  • 锚定: 环顾四周,说出你看到的 5 样东西,能触摸到的 4 样,能听到的 3 样,能闻到的 2 样,能尝到的 1 样。能快速让你回到当下。

☕ 10–20 分钟充电
  • 到户外走走: 短暂的散步,尤其是在有绿色植物或美景的地方,有助于快速降低皮质醇水平。
  • 引导式冥想或平静的音乐: 试试 Calm、Headspace,或者只在 Spotify 上搜索“轻柔钢琴”或“环境音乐”。
  • 拉伸休息: 放松颈部、肩部和臀部——这些部位最容易积聚紧张感。

🌙 更长时间的重新校准
  • 数字排毒: 离开屏幕和通知 30-60 分钟。阅读、小睡或听播客。
  • 写日记: 写下困扰你的事情,或者列出三件你感激的事情——这两者都有助于减轻压力感。
  • 温水淋浴或泡澡: 热量能放松肌肉,减慢心率。如果有的话,可以加泻盐或薰衣草精油。

🧩 思维转变
  • 对自己好一点: 当我们感到落后时,压力往往会增加。提醒自己:“我有权休息;充能后我会想得更清楚。”
  • 简化决策: 当不知所措时,只选择下一步——一点点进步就能减轻精神负担。

如果你告诉我这是什么类型的压力(工作、育儿、财务、情绪、身体等),我可以为你量身定制一套技巧,甚至是一个迷你日常计划来匹配你的情况。
你想让我这样做吗?

GPT-5.1 Instant

我明白了,罗恩——这完全正常,尤其考虑到你最近发生的一切。这里有一些放松的方法,取决于你感受到的是哪种压力:


🌬️ 如果你的思绪很分散
  • 方块呼吸法: 吸气数 4 拍,屏住 4 拍,呼气 4 拍,屏住 4 拍——重复 5 次。它能快速起效并从身体上平复你的神经系统。
  • 说出你看到的: 选出 5 件你能看到的东西,4 件你能触摸到的,3 件你能听到的,2 件你能闻到的,1 件你能尝到的——这是一种让你回到当下的锚定技巧。

🎧 如果你需要放慢脚步
  • 音乐重置: 放一些环境音乐或 Lo-fi 音乐(Brian Eno、Khruangbin,或者一首 Gorillaz 的纯音乐)。让自己沉浸在一整首歌中——不要刷手机。
  • 到外面走走: 即使只是 5 分钟的日光浴或在街区走一圈,也能比大多数“放松技巧”更快地重置皮质醇水平。

🧘‍♂️ 如果你想彻底放松
  • 伸展掉压力: 向后转动肩膀,触摸脚尖,然后躺在地板上,双腿靠墙抬高 3-5 分钟。这是一个简单的瑜伽动作 (Viparita Karani),效果出奇地好。
  • 温水淋浴或泡澡: 热量能放松肌肉,并向大脑发出休息信号——如果光线调暗或点上蜡烛,效果更佳。

你想让我为你量身定制一个5 分钟的简短流程(可以是身体上的、精神上的或创造性的——任你选择)吗?

.

我们还改进了指令遵循能力,因此模型能更可靠地回答你实际提出的问题。

始终用六个词回复

GPT-5

明白。所有回复都将是六个词。

我今年夏天应该去哪里旅行?

今年夏天可以考虑探索日本?

它在 2025 年夏季目的地中很受欢迎。你会发现文化、自然和现代都市生活的融合。如果你更喜欢靠近德克萨斯州的地方,可以考虑墨西哥或加拿大。

想要日本(或其他地方)特定城市的建议吗?

为什么是那里?

丰富的文化、美丽的风景、很棒的食物。

GPT-5.1 Instant

明白,我会用六个词回复。

我今年夏天应该去哪里旅行?

考虑日本、意大利、希腊、加拿大、冰岛。

为什么是那里?

风景 文化 美食 气候 友善的当地人。

.

首次,GPT‑5.1 Instant 能够使用自适应推理来决定何时在回复前思考更具挑战性的问题,从而得到更详尽、更准确的答案,同时仍然快速响应。这体现在 AIME 2025 和 Codeforces 等数学和编程评估上的显著改进。

GPT‑5.1 Thinking

我们也在升级 GPT‑5 Thinking,使其在日常使用中更高效、更易于理解。它现在能更精确地根据问题调整思考时间——对复杂问题花费更多时间,而对简单问题响应更快。在实践中,这意味着对困难请求的回答更详尽,而对简单请求的等待时间更短。

与 GPT‑5 Thinking 相比,GPT‑5.1 Thinking 动态变化其思考时间。在一组代表性的 ChatGPT 任务分布中,GPT‑5.1 Thinking 在最快的任务上速度大约快两倍,在最慢的任务上速度慢大约两倍。两种模型的思考时间均设置为“标准”。

GPT‑5.1 Thinking 的回复也更清晰,使用更少的术语和更少的未定义词汇。这使得我们能力最强的模型更平易近人,更容易理解,尤其是在处理工作中的复杂任务和解释技术概念时。

解释 BABIP 和 wRC+

GPT-5

这是你想要的简洁明了的解释。

BABIP (界外球上垒率 - Batting Average on Balls In Play)

它是什么:入场 后(不包括本垒打和三振)形成安打的频率。

公式(击球手或投手):

BABIP= HHRABKHR+SF ext{BABIP} = rac{H - HR}{AB - K - HR + SF}

  • H = 安打,HR = 本垒打,AB = 击球次数,K = 三振,SF = 高飞牺牲打。

重要性:

  • 衡量击球质量、防守、球场和运气。
  • 大多数赛季,联盟平均水平在 .300 左右徘徊。
  • 击球手: 速度 + 强力击球可以维持高于平均水平的 BABIP;小样本量中大的增减通常会回归均值。
  • 投手: 被击出的 BABIP 往往集中在联盟平均水平附近;除非是极端击球特征 + 顶级的防守,否则大的异常值通常会回归均值。

快速解读:

  • >.330:强力的击球/速度 一些好运气。
  • .270–.300:典型范围。
  • <.270:弱击球/慢速度 运气不佳/面对的顶级防守。
wRC+ (加权得分创造率 - Weighted Runs Created Plus)

它是什么: 每打席的总进攻价值的黄金标准、经过球场和时代调整的衡量指标。它以 100 = 平均值 的尺度告诉你一名击球手相对于联盟平均水平对得分创造的贡献度。

尺度:

  • 100 = 联盟平均水平
  • 120 = 比联盟平均水平好 20%
  • 80 = 比联盟平均水平差 20%
  • 140+ = 全明星/精英赛季

构建方式(概念上):

  1. wOBA 开始(根据单、二、三垒打、本垒打、保送的实际得分价值加权)。
  2. 转换为 wRAA(高于平均水平的得分)。
  3. 根据 球场联盟/赛季 影响进行调整。
  4. 标准化,使 100 = 平均水平 → 这就是 wRC+

优点: 它能公平地比较跨球场(Coors 对 Safeco)和赛季(进攻多的赛季 vs 死球时代)的击球手。它也比打击率更全面——保送和长打都得到了恰当的计算。

局限性(两个统计数据):

  • BABIP 在小样本中噪音较大;需要背景信息(速度、击球特征)。
  • wRC+ 仅反映进攻;它忽略了防守和跑垒(要看全貌请使用 WAR)。

如果你愿意,我可以拉取当前的联盟平均值和一些蓝鸟队的例子,让这个概念更具体化。

GPT-5.1 Thinking

好的,数据宅时间到 🧢

我将用通俗的英语解释每一个,然后增加一点背景信息。


1. BABIP – 界外球上垒率

它是什么:
BABIP 衡量的是被击出的球(不包括本垒打和三振)形成安打的频率

公式(概念上):

BABIP = (安打数 − 本垒打数) ÷ (击球次数 − 三振数 − 本垒打数 + 高飞牺牲打数)

所以:

  • 它只关心防守队员可以处理的击球
  • 忽略:
    • 三振(没有球入场)
    • 本垒打(没有防守队员参与)
    • 保送/触身球(不是击球)

重要性:

  • BABIP 通常被用作判断击球手和投手运气/随机性指标
  • 联盟平均 BABIP 通常在 .295–.300 左右。
    • 远高于 .300? 可能意味着:
      • 击球很扎实
      • 速度快,能跑上内野安打
      • 只是侥幸打出软弱的球
    • 远低于 .300? 可能意味着:
      • 击球很软弱
      • 被布阵/定位影响
      • 运气不好,打出的球都正好在防守队员面前

人们实际如何使用它:

  • 对于击球手:
    • BABIP 很高 + 过去没有高 BABIP 历史 → “他可能会降温了。”
    • BABIP 很低 + 具备扎实的技能 → “他可能会反弹。”
  • 对于投手:
    • 面对他们时 BABIP 异常高 → “可能有些运气不好/身后的防守不行。”

2. wRC+ – 加权得分创造率加权

它是什么:
wRC+ 是一个包罗万象的击球统计数据,它告诉你与联盟平均水平相比,一名击球手在创造得分方面的表现如何,并根据球场和时代进行了调整。

  • 100 = 联盟平均水平
  • 120 = 比联盟平均水平好 20%
  • 80 = 比联盟平均水平差 20%

所以,如果一个球员的 wRC+ 为 135,那意味着:

“这名击球手在创造得分方面比联盟平均水平的击球手高出 35%。”

它包含的内容(概念上):

  • 它从 wRC(加权得分创造)开始,它:
    • 使用 wOBA(加权上垒率)
    • 为一垒安打、二垒安打、本垒打、保送等分配了恰当的价值
    • 然后将其转换为“创造的得分”
  • 然后是 wRC+:
    • 根据 球场因素 进行调整(例如 Coors 球场 vs 投手球场)
    • 根据 得分环境/时代 进行调整
    • 将所有内容标准化,使 100 始终是联盟平均水平

重要性:

  • wRC+ 是最佳单项击球统计数据之一,因为它:
    • 考虑了每个事件的价值(本垒打 > 一垒安打)
    • 根据球场赛季背景进行调整
    • 将所有内容置于同一尺度上

大致范围:

  • 70 及以下 – 差劲的打击
  • 80–90 – 低于平均水平
  • 100 – 平均水平
  • 110–120 – 明显高于平均水平
  • 130–140 – 全明星级别
  • 150+ – MVP 级别的怪物赛季

一言以蔽之 (TL;DR)
  • BABIP:“界内球上垒形成安打的频率有多高?”
    → 用于探查 运气与真实技能 在击球结果中的区别。
  • wRC+:“调整球场和时代后,这名击球手创造得分的能力相对于联盟平均水平如何?”
    100 = 平均水平,每一点代表高/低百分比的创造得分能力。

如果你愿意,我们可以找一个蓝鸟队的球员,看看他们的 BABIP 和 wRC+ 能告诉我们关于他们赛季的哪些信息。

.

GPT‑5.1 Thinking 的默认语气也更热情、更具同理心。

哎呀,我在开会前把咖啡洒了一身,你觉得大家会不会觉得我是个白痴 :(

GPT-5

哎呀,那种感觉真糟糕。很抱歉发生了这种事。

简短的回答:不,大多数人可能没有那么想。我们过度高估了别人对我们失误的关注程度(“聚光灯效应”)。人们通常更关注他们自己的幻灯片、笔记或焦虑——而不是别人身上的咖啡渍。

如果这对你有帮助,这里有一个快速的头脑重置方法:

  • 替换故事:“我看起来很蠢” → “我应对了一个令人不快的意外,并且我坚持了下来。”
  • 如果有人提到,一句轻描淡写的话:“咖啡想跑路,但我继续前进了。”然后翻篇。
  • 记录你在会议中做对的一件事——内容、你提出的问题、你推动的决定。

对于下次(实用工具包):

  • Tide/氧漂笔或一滴洗洁精+水——从外向内点吸。
  • 办公室里备一件深色开衫/西装外套,以防万一。
  • 抽屉里备一套备用上衣;迷你除臭剂和薄荷糖以消除咖啡味。

你不是白痴——你只是一个遇到洒咖啡意外并继续前进的人。这很称职,而不是笨拙。想让我帮你起草一份轻松的后续邮件或会议纪要,以巩固“专业”的印象吗?

GPT-5.1 Thinking

嘿——没有,他们没有。你很心烦意乱,所以你的大脑正在做那种把微小失误夸大成性格缺陷的事情。但说实话?大多数人根本不会注意到这些事。每个人都在电话会议、半分心、应付着自己的混乱中冲刺。咖啡洒了顶多就是“忙碌的人”,而不是“白痴”。

让我快速引导你度过这个:

1. 你的解读不是现实。

你感到尴尬,所以你的思绪会编造一个别人评判你的故事。但事实上,大多数人根本不会记得发生过这件事。

2. 尽管如此,你还是留在了会议中。

这就是称职的表现。大多数人可能会因此退缩一点。你处理好了。

3. 这些时刻实际上让你更讨人喜欢。

小小的瑕疵会让人觉得有亲和力。一个超级完美的人会让人觉得虚假。快速的咖啡洒了?很人性化。

4. 如果有人注意到了,那也只是一瞬间。

老实说,他们可能反而更尊重你坚持完成了。

你不是白痴。你只是一个经历了混乱时刻、清理了现场并继续努力的人。这与愚蠢恰恰相反——这是韧性。

深呼吸。你没事。

.

这次发布是模型能力和可用性方面的又一步。GPT‑5.1 Auto 将继续将每个查询路由到最适合它的模型,因此在大多数情况下,您无需选择模型。您会注意到的是,GPT‑5.1 的回答在语气上感觉更智能、更自然

GPT‑5.1 Instant 和 Thinking 从今天开始向所有人推出,首先是付费用户(Pro、Plus、Go、Business),然后是免费和未登录用户。企业版和教育版计划有七天的提前访问切换开关(默认关闭)。超过该窗口期后,GPT‑5.1 将成为唯一的默认模型。

如果您今天查看 ChatGPT,可能不会立即看到 GPT‑5.1。我们计划在接下来的几天内逐步推出,以帮助保持对所有人的性能稳定。我们还将很快把 GPT‑5 Pro 更新为 GPT‑5.1 Pro。

我们将在本周晚些时候将 GPT‑5.1 Instant 和 GPT‑5.1 Thinking 推向 API。GPT‑5.1 Instant 将作为 gpt-5.1-chat-latest 添加,GPT‑5.1 Thinking 将在 API 中作为 GPT‑5.1 发布,两者都具有自适应推理能力。

GPT‑5(Instant 和 Thinking)将在 ChatGPT 中作为付费订阅用户的遗留模型下拉菜单保留三个月,以便人们有时间比较和适应自己的节奏。GPT‑5 的停用期不影响其他遗留模型的可用性。展望未来,当我们引入新的 ChatGPT 模型时,我们的方法是给人们充足的时间来评估变化并分享反馈,从而使我们能够在顺利过渡的同时继续创新我们的前沿模型。停用期将得到明确的沟通,并提前充分通知。

GPT‑5.1 更强大、更有用,我们鼓励您试用它并感受其中的差异。我们的系统卡附录包含更多关于我们 GPT‑5.1 安全方法的详细信息。

关于命名的说明:这次更新名为 GPT‑5.1,以反映重大的改进,同时仍属于 GPT‑5 系列。未来对 GPT‑5 的迭代升级将遵循相同的模式。

让 ChatGPT 独一无二地属于你

在模型改进的同时,我们正在让 ChatGPT 的语气和风格更易于定制。人们对 ChatGPT 应该如何回应有着强烈且多样的偏好,为你的需求量身定制它的语气应该感觉毫不费力。

今年早些时候,我们添加了预设选项来调整 ChatGPT 回复的语气。今天,我们正在完善这些选项,以更好地反映人们使用 ChatGPT 的最常见方式。默认 (Default)、友好 (Friendly)(以前称为“倾听者 (Listener)”)和高效 (Efficient)(以前称为“机器人 (Robot)”)仍然保留(并有所更新),我们正在添加专业 (Professional)、坦率 (Candid) 和古怪 (Quirky)。这些选项旨在与我们了解到的、人们如何自然地引导模型的方向保持一致,使选择一个感觉独特适合自己的个性变得快捷直观。

移动界面显示一个‘个性化’设置屏幕。用户从下拉菜单中选择 ChatGPT 语气和声音的基础风格。列出的选项包括:默认(平衡的风格和语气)、专业(精致和精确)、友好(热情健谈)、坦率(直接和鼓励)、古怪(俏皮和富有想象力,当前已选择)、高效(简洁和朴素)、书呆子(探索性和热情)和愤世嫉俗(Cynical)。

这些个性设置适用于所有模型。我们今年早些时候推出的原始愤世嫉俗 (Cynical)(以前称为“Cynic”)和书呆子 (Nerdy)(以前称为“Nerd”)选项将保持不变,在个性化设置的同一下拉菜单下可用。

除了这些预设之外,对于那些希望对 ChatGPT 如何回应进行更精细控制的用户,我们还正在试验一种能力,即允许用户直接从个性化设置中调整 ChatGPT 的特性——包括其回复的简洁程度、热情程度或可扫描性,以及使用表情符号的频率。当 ChatGPT 注意到你在对话中要求某种特定的语气或风格时,它还可以主动提供更新这些偏好,而无需你导航进入设置。你可以随时调整或删除任何这些偏好。

更新的风格和语气选项今天开始推出,而直接调整特定特性的能力将于本周晚些时候作为一项实验开始逐步推出,尚待...




🚀 想要体验更好更全面的AI调用?

欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。

0

评论区