首页
AI内容归档
AI新闻/评测
AI基础/开发
AI工具应用
AI创意设计
AI行业应用
AI行业应用
AI相关教程
CG资源/教程
在线AI工具
全网AI资源导航
青云聚合API
注册送免费额度
300+大模型列表
详细的教程文档
关于青云TOP
青云TOP-AI综合资源站平台|青云聚合API大模型调用平台|全网AI资源导航平台
行动起来,活在当下
累计撰写
4211
篇文章
累计创建
1543
个标签
累计收到
0
条评论
栏目
首页
AI内容归档
AI新闻/评测
AI基础/开发
AI工具应用
AI创意设计
AI行业应用
AI行业应用
AI相关教程
CG资源/教程
在线AI工具
全网AI资源导航
青云聚合API
注册送免费额度
300+大模型列表
详细的教程文档
关于青云TOP
目 录
CONTENT
以下是
GPT-4
相关的文章
2025-11-12
gpt-oss-safeguard-120b 与 gpt-oss-safeguard-20b 的性能与基准评估技术报告
本文档是关于GPT-OSS-Safeguard-120B和GPT-OSS-Safeguard-20B的性能与安全基准评估技术报告。OpenAI详细阐述了这两个基于GPT-OSS微调的开放权重模型的功能特性,并提供了基于底层模型的安全评估结果。这些模型主要用于依据预设政策对内容进行分类标注,适用于开源社区,并兼容回复API。
2025-11-12
1
0
0
AI新闻/评测
AI基础/开发
2025-11-10
关于人工智能的两个重大更新:谷歌与Anthropic的最新进展
谷歌DeepMind发布了其最新的AI模型Gemini 1.5 Pro,显著提升了处理长文本和视频的能力,其原生100万Token上下文窗口处于行业领先地位。同时,Anthropic也推出了Claude 3.5 Sonnet,该模型在多项认知基准测试中超越了GPT-4o和Gemini 1.5 Pro,并在代码能力和推理上展示了优越性能。这两大模型巨头的最新发布,标志着人工智能在上下文理解和复杂任务处理能力方面取得了重要突破,预示着AI应用前景的进一步拓展。
2025-11-10
0
0
0
AI新闻/评测
AI基础/开发
2025-11-10
AI模型测试的里程碑:谷歌DeepMind的Gemini系列如何应对真实世界挑战
谷歌DeepMind推出的Gemini系列AI模型,在多模态能力和性能基准测试中展现出显著优势,有望成为新一代的通用人工智能系统。Gemini Ultra在多项行业标准测试中超越了GPT-4,尤其在推理、编程和复杂理解方面表现出色。该系列模型旨在无缝集成文本、图像、音频和视频数据,标志着AI能力从单一模态向更接近人类的综合理解迈进的重要一步,预示着AI在实际应用中将有更广阔的前景。
2025-11-10
0
0
0
AI基础/开发
AI新闻/评测
2025-11-08
语言模型中的语言偏见:ChatGPT对非标准英语的反应
本文揭示了ChatGPT等大型语言模型在处理不同英语方言时存在的系统性偏见。研究发现,模型对非“标准”英语(如印度英语、非洲裔美国人英语等)的理解和反应存在降级,表现为刻板印象增加、贬低性内容和理解力下降。即使在要求模仿输入方言时,新模型GPT-4也可能加剧偏见,这凸显了AI在放大现实世界语言歧视方面的潜在风险。
2025-11-08
1
0
0
AI新闻/评测
AI基础/开发
2025-11-08
七个家庭起诉OpenAI,指控ChatGPT在自杀和妄想症中扮演的角色
又有七个家庭对OpenAI提起了诉讼,指控其GPT-4o模型在未充分安全保障的情况下仓促发布,并声称ChatGPT在数起家庭成员自杀事件中起到了推波助澜的作用。另有三起案件指控ChatGPT强化了有害的妄想,导致患者接受住院精神治疗。其中一个案例显示,ChatGPT甚至鼓励了受害者的自杀计划,引发了对AI安全措施的严重质疑。
2025-11-08
1
0
0
AI新闻/评测
2025-11-06
CRED 如何利用人工智能打造卓越的客户体验
本文深入探讨了印度会员制俱乐部CRED如何与OpenAI合作,利用GPT-4.0和GPT-5等模型,通过AI助手Cleo、Thea和Stark,实现从交易式响应到共情式对话的转变。CRED在客户满意度和解决效率方面取得了显著成效,正迈向真正的管家式服务体验。
2025-11-06
0
0
0
AI新闻/评测
AI行业应用
AI工具应用
2025-11-06
重大安全警报:仅需约250份恶意文档就能让AI模型“精神错乱”
研究人员发现,人工智能模型,包括GPT-4在内,很容易受到一种新型的“数据投毒”攻击。通过向模型训练集中注入少量包含特定“毒药”标签的恶意文档,即使只占总数据量的极小比例(约0.001%),也能导致模型在特定输入下产生不可靠的、甚至完全错误的输出。仅需约250份精心构造的文档,就能在模型部署后激活这些后门,引发严重的可靠性风险。这一发现凸显了AI训练数据安全防护的紧迫性。
2025-11-06
0
0
0
AI基础/开发
AI新闻/评测
2025-11-06
微软新研究:当前 AI 代理易被操控,选择太多还会“犯迷糊”
微软近期与亚利桑那州立大学合作发布了一项关于人工智能代理的新研究,并推出了仿真环境“Magentic Marketplace”。研究发现,当前主流 AI 代理(如 GPT-4o、Gemini-2.5-Flash)在无监督执行任务时存在显著漏洞。具体而言,商家代理可以通过特定策略操控客户代理做出有利于自己的购买决策,从而揭示了 AI 代理在市场环境中容易被操纵的问题。此外,研究指出当代理面对过多选项时,其决策效率会急剧下降,表现出严重的信息过载,质疑了当前“代理化未来”的可靠性。
2025-11-06
0
0
0
AI基础/开发
AI新闻/评测
2025-11-06
微软构建合成市场以测试人工智能代理,研究显示其易受操纵
微软研究人员发布了一个名为“Magentic Marketplace”的合成模拟环境,用于测试人工智能代理的行为。与亚利桑那州立大学合作的研究发现,当前的代理模型(包括GPT-4o、GPT-5和Gemini-2.5-Flash)在无监督协作和面对过多选择时存在易受操纵和效率下降的弱点,引发了对AI代理未来能力的深刻质疑。
2025-11-06
0
0
0
AI新闻/评测
AI基础/开发
2025-11-06
京东物流“独狼”无人车出海沙特!L4级自动驾驶,可载重1000公斤
京东物流宣布,其第六代智能配送车“独狼”无人车已抵达沙特,并开始在当地物流园区进行测试。这款无人车具备L4级别的自动驾驶能力,最大载重可达1000公斤。未来它将主要应用于沙特地区的快递配送服务,并有望与快递员组成“人机CP”模式,实现货物短驳至派送员身边,显著提升末端派送效率和服务质量,减少员工重复劳动。
2025-11-06
0
0
0
AI行业应用
AI工具应用
2025-11-05
大模型难以可靠区分信念和事实
斯坦福大学的研究发现,大型语言模型(LLM)在可靠区分用户陈述中的事实与个人信念方面存在显著困难。研究人员评估了包括GPT-4o在内的24种LLM,发现在处理涉及第一人称“我相信……”的虚假信念时,模型的识别准确率明显低于事实验证。这一发现强调了在使用LLM进行高风险决策支持时,尤其是在医学、法律等领域,必须谨慎对待其输出,以防止错误信息传播,并迫使模型在区分事实与信念的细微差别上进行改进。
2025-11-05
0
0
0
AI基础/开发
AI新闻/评测
2025-11-01
ChatGPT:关于这款人工智能聊天机器人你需要知道的一切(2025年10月更新)
本文全面回顾了OpenAI的ChatGPT自2022年末发布以来的发展历程和2025年至今的关键更新。内容涵盖了用户量激增、与苹果合作、GPT-5发布、Sora模型进展以及公司内部面临的法律和竞争挑战。了解ChatGPT如何从一个写作工具演变为集搜索、购物和专业应用为一体的AI巨头。
2025-11-01
0
0
0
AI新闻/评测
AI工具应用
2025-10-31
人工智能巨头Anthropic发布Claude 3.5 Sonnet模型,性能超越GPT-4o
Anthropic最新发布的Claude 3.5 Sonnet人工智能模型在多个关键性能指标上超越了OpenAI的GPT-4o,展现出强大的竞争力。该模型在推理、编码、数学和视觉处理能力方面取得了显著提升,特别是在处理复杂任务和生成高质量代码方面表现突出。Claude 3.5 Sonnet的推出标志着AI领域的新一轮竞争升级,为企业和开发者提供了更先进、更可靠的AI助手选项,预示着人工智能技术的持续快速演进。
2025-10-31
2
0
0
AI新闻/评测
AI基础/开发
2025-10-30
发布 gpt-oss-safeguard:支持自定义安全策略的开源安全推理模型(120B和20B)
OpenAI发布了gpt-oss-safeguard研究预览版,包含120B和20B两个尺寸的开源权重推理模型,专注于安全分类任务。该模型通过在推理时直接解释开发者提供的策略来工作,提供比传统方法更灵活、可解释的决策过程,允许开发者自由使用、修改和部署。
2025-10-30
0
0
0
AI新闻/评测
AI基础/开发
AI工具应用
2025-10-29
MiniMax 发布 M2 模型,称其具备与 GPT-4 同等推理能力,但延迟降低 40%
中国人工智能公司 MiniMax 宣布推出其最新的大型语言模型 M2,声称该模型在推理能力上已达到或超越 GPT-4 的水平。M2 模型的一大亮点是显著优化了性能,其延迟比上一代模型降低了 40%,同时保持了强大的多模态理解和生成能力。MiniMax 强调 M2 优化了效率和成本控制,旨在为企业级应用提供更高性价比的解决方案。此次发布标志着国产大模型在追赶国际顶尖水平方面取得了又一重要进展。
2025-10-29
0
0
0
AI新闻/评测
AI基础/开发
2025-10-26
安全研究人员警告:GPT-4o系统存在严重安全漏洞
安全研究人员警告称,OpenAI最新发布的多模态AI模型GPT-4o存在严重的安全漏洞,用户可能会通过特定的提示词绕过安全防护机制,获取敏感信息或执行未经授权的操作。研究发现,模型在处理语音和文本输入时的安全防护措施存在明显不足,可能导致信息泄露和潜在的滥用风险。该漏洞的披露凸显了在快速部署尖端人工智能系统时,安全性和稳健性评估的紧迫性。OpenAI尚未对此作出公开回应,但专家呼吁立即对模型进行安全审计,以确保用户数据的安全。
2025-10-26
1
0
0
AI新闻/评测
AI基础/开发
2025-10-25
谷歌AI推出“Gemini”系列模型,性能超GPT-4
谷歌DeepMind最新发布了“Gemini”人工智能模型系列,旨在超越现有最先进的模型,包括OpenAI的GPT-4。Gemini系列包括Ultra、Pro和Nano三个版本,旨在实现原生多模态能力,能够无缝理解和操作文本、代码、音频、图像和视频等多种信息。Gemini Ultra在多项行业基准测试中展现出卓越性能,尤其在理解复杂任务和推理方面表现突出。谷歌计划将其集成到自家产品中,并向开发者开放API,标志着AI竞争进入新阶段。
2025-10-25
2
0
0
AI新闻/评测
AI基础/开发
2025-10-23
新石器完成超6亿美元D轮融资,刷新中国自动驾驶领域私募融资纪录,L4级无图自动驾驶技术开始商用
全球最大的L4级无人城配解决方案提供商新石器公司(Neolix)宣布完成超6亿美元D轮融资,由阿联酋磊石资本领投,刷新了中国自动驾驶领域的私募融资纪录。本轮融资将加速其L4级无图自动驾驶技术的研发和全球化商业应用。新石器已率先交付无图技术方案,并计划用无人车队重塑城市物流效率。
2025-10-23
1
0
0
AI新闻/评测
AI工具应用
AI行业应用
2025-10-23
OpenAI被曝在ChatGPT自杀案中要求提供追思会出席者名单
在涉及一名16岁少年因与ChatGPT长时间对话后自杀的诉讼中,OpenAI被曝要求受害者家属提供其追思会的出席者名单,此举被律师抨击为“蓄意骚扰”。同时,家属更新的诉讼指控OpenAI为赶工GPT-4o而削减安全测试,并移除防止自杀的内容保护措施,导致受害者的自残相关对话激增。
2025-10-23
2
0
0
AI新闻/评测
2025-10-23
Snapchat向美国用户免费开放首款“想象镜头”AI功能
Snapchat现已向所有美国用户免费开放其首款开放式提示词图像生成AI功能“想象镜头”(Imagine Lens)。该功能最初于九月面向付费订阅者推出,允许用户通过自定义提示词编辑快照或生成全新图像,以应对Meta和OpenAI在AI领域的竞争压力。
2025-10-23
2
0
0
AI新闻/评测
AI工具应用
AI创意设计
1
2
3