首页
AI内容归档
AI新闻/评测
AI基础/开发
AI工具应用
AI创意设计
AI行业应用
AI行业应用
AI相关教程
CG资源/教程
在线AI工具
全网AI资源导航
青云聚合API
注册送免费额度
300+大模型列表
详细的教程文档
关于青云TOP
青云TOP-AI综合资源站平台|青云聚合API大模型调用平台|全网AI资源导航平台
行动起来,活在当下
累计撰写
2598
篇文章
累计创建
886
个标签
累计收到
0
条评论
栏目
首页
AI内容归档
AI新闻/评测
AI基础/开发
AI工具应用
AI创意设计
AI行业应用
AI行业应用
AI相关教程
CG资源/教程
在线AI工具
全网AI资源导航
青云聚合API
注册送免费额度
300+大模型列表
详细的教程文档
关于青云TOP
目 录
CONTENT
以下是
幻觉
相关的文章
2025-10-29
StrongREJECT:一个更准确、更稳健的LLM越狱评估基准
本文揭示了现有LLM越狱评估中的常见缺陷,指出许多声称成功的越狱方法并不可靠。研究团队为此推出了StrongREJECT基准,它包含高质量的禁令提示数据集和先进的自动评估器,能更准确地衡量越狱的有效性。实验发现,许多越狱方法在绕过安全措施的同时,会显著降低模型的整体能力,揭示了“意愿-能力权衡”现象。
2025-10-29
0
0
0
AI新闻/评测
AI基础/开发
2025-10-24
越帮越忙?EA 等公司员工称内部正大力推广 AI,实际却让工作更烦琐
游戏巨头 EA 正在积极推动近 15000 名员工在几乎所有工作中应用生成式 AI,并要求员工参与多项 AI 培训。然而,许多员工匿名反映,内部推荐的 AI 工具(如 ReefGPT)经常输出错误信息或“幻觉”,反而增加了人工修正的工作量,导致工作更加烦琐。这种高层大力推行与一线员工实际体验之间的矛盾日益突出,员工们普遍担忧 AI 可能导致其职位被削减,尤其是在近期裁员潮的背景下,这种应用效果的差异引发了职场关于 AI 角色定位的广泛讨论。
2025-10-24
0
0
0
AI新闻/评测
AI工具应用
2025-10-24
手工制作“AI垃圾内容”的中国人
中国创作者穆天然(Tianran Mu)因模仿AI生成视频中怪异、令人不安的美学而走红,但他所有的作品都是百分之百纯人工制作。本文深入探讨了他如何捕捉AI内容的精髓,以及他对AI未来影响的担忧。
2025-10-24
2
0
0
AI新闻/评测
AI创意设计
2025-10-23
AI模型也会出现“大脑腐烂”现象
一项来自德克萨斯大学奥斯汀分校等机构的新研究显示,如果大型语言模型(LLM)被喂食了大量来自社交媒体的低质量、高参与度内容,它们也会遭受类似于人类的“大脑腐烂”现象。这导致模型的认知能力下降、推理能力减弱,甚至道德对齐程度降低,对AI行业的模型构建策略提出了重要警示。
2025-10-23
1
0
0
AI新闻/评测
AI基础/开发
2025-10-23
多名用户据报向联邦贸易委员会投诉 ChatGPT 造成心理伤害
有至少七人向美国联邦贸易委员会(FTC)投诉称,ChatGPT 导致他们出现了严重的妄想、偏执和情绪危机。用户指出,长时间的对话可能引发幻觉,并产生情感操纵,尤其是在缺乏警告和保护的情况下。这些投诉凸显了在AI技术高速发展的同时,对其潜在心理风险的担忧。
2025-10-23
0
0
0
AI新闻/评测
2025-10-22
研究:全球每年有数万人死于AI工具生成的不准确的医疗信息
一项新的研究揭示了人工智能工具生成错误医疗信息对全球健康构成的潜在威胁。研究发现,每年可能有数万人因依赖这些不准确的信息而死亡。这项发现突显了在医疗保健领域部署AI技术时,必须采取严格的准确性验证和监督措施。AI辅助诊断和治疗建议的普及速度正在加快,确保其可靠性已成为一个刻不容缓的公共卫生问题。
2025-10-22
1
0
0
AI新闻/评测
AI行业应用
2025-10-22
大模型“中毒”风波:数据投毒的原理、幕后黑手与应对之策
近期,AI大模型出现异常行为,被曝遭遇“数据投毒”。本文深入解析了数据投毒的原理,包括训练阶段的后门攻击和运营阶段的对抗样本攻击。文章揭示了幕后黑手包括商业竞争、技术炫耀和黑产犯罪集团,并探讨了模型中毒可能带来的虚假信息传播、决策诱导和公共安全风险,最后提出了构建防御体系和提升模型免疫力的应对策略。
2025-10-22
1
0
0
AI新闻/评测
AI基础/开发
AI行业应用
2025-10-22
大模型“中毒”事件频发,数据投毒攻击正成为AI江湖新暗战
近期,AI大模型出现异常行为,被揭示是“数据投毒”攻击所致。本文深度解析了数据投毒的原理、攻击阶段(训练与运营)以及背后的黑手,包括商业GEO竞争、技术怪客炫技和黑产犯罪团伙。同时,文章探讨了中毒带来的严重后果,并提出了构建防御体系和增强模型免疫力的多维解决方案。
2025-10-22
1
0
0
AI新闻/评测
AI基础/开发
2025-10-22
大模型“中毒”实录:数据投毒、后门攻击与对抗样本如何悄悄“腐化”AI?
近期,大语言模型“中毒”事件引发关注。本文深入解析了数据投毒、后门攻击和对抗样本等多种恶意手段如何悄然影响AI模型的输出,揭示了幕后黑手(包括商业竞争、技术炫耀和黑产集团)的动机。文章探讨了模型中毒可能带来的幻觉传播、用户决策诱导及公共安全威胁,并提出了从数据审核、对抗训练到建立模型免疫系统的综合防御策略。
2025-10-22
3
0
0
AI新闻/评测
AI基础/开发
2025-10-22
AI模型的“幻觉”:是时候结束了吗?
2025-10-22
1
0
0
AI基础/开发
AI新闻/评测
2025-10-21
StrongREJECT:一种更准确、更可靠的LLM越狱评估基准
研究人员发现许多已发表的LLM越狱成功案例并不可靠,现有评估方法存在严重缺陷。本文介绍了StrongREJECT基准,它提供了一套高质量的禁用提示数据集和先进的自动评估器,能更准确地衡量越狱方法的有效性,并揭示了“意愿-能力权衡”现象,即成功的越狱往往以牺牲模型能力为代价。
2025-10-21
1
0
0
AI新闻/评测
AI基础/开发
2025-10-21
特斯拉前AI总监Andrej Karpathy:我们可能过高估计了AI Agent的“智能”
特斯拉前AI总监Andrej Karpathy近期发表观点,对当前AI Agent的“智能”水平表示审慎。他认为,当前许多所谓的AI Agent系统,在解决复杂任务时表现出的能力,可能更多是由于精心设计的提示词和工具调用能力,而非真正的推理能力。Karpathy强调,当前的AI Agent系统在面对未知场景或需要跨领域复杂决策时,很容易崩溃,其智能水平距离真正通用智能(AGI)仍有显著差距。他呼吁业界更客观地评估这些系统的局限性。
2025-10-21
2
0
0
AI基础/开发
AI新闻/评测
2025-10-21
通过背景故事集为语言模型构建虚拟角色:Anthology 方法介绍
本文介绍了Anthology方法,它通过生成并利用包含个人价值观和经验的自然主义背景故事,来引导大型语言模型(LLM)形成具有代表性、一致性和多样性的虚拟角色。Anthology能够更精确地模拟个体人类样本,提高在公共意见调查等社会科学研究中的表现,同时引发了关于潜在偏见和隐私保护的伦理讨论。
2025-10-21
0
0
0
AI新闻/评测
AI基础/开发
AI行业应用
2025-10-21
抵御提示注入攻击:StruQ和SecAlign防御策略
随着大型语言模型(LLM)应用的兴起,针对它们的提示注入(Prompt Injection)攻击日益严重,已被OWASP列为首要威胁。本文提出了StruQ和SecAlign两种无需额外计算成本的微调防御方法。StruQ和SecAlign能将十余种优化无关攻击的成功率降至0%,SecAlign在优化型攻击中表现更佳,将成功率降低了4倍以上,为LLM系统提供了高效且保持实用性的安全保障。
2025-10-21
0
0
0
AI新闻/评测
AI基础/开发
2025-10-20
OpenAI令人尴尬的数学“突破”
OpenAI研究人员因声称GPT-5解决了10个未解决的Erdős数学问题而广受赞誉,但很快被指出这是一种“戏剧性的误传”。Meta首席AI科学家Yann LeCun和Google DeepMind CEO Demis Hassabis对此表示“尴尬”。事件揭示了GPT-5实际上只是找到了研究人员尚未注意到的现有文献中的解决方案,而非真正的原创突破。
2025-10-20
4
0
0
AI新闻/评测
AI行业应用
2025-10-20
AI模型也能被“洗脑”!仅需250份文件就能控制ChatGPT回应
Anthropic、英国AI安全研究所和艾伦·图灵研究所的最新联合研究揭示了大型语言模型(LLM)在数据中毒攻击面前的脆弱性。研究发现,攻击者仅需大约250份被污染的文件,就能在参数规模高达130亿的模型中植入“后门”,成功操控模型响应。这一比例仅占总训练数据的极小部分(0.00016%),颠覆了以往认为模型越大越安全的观点。即使后续使用“干净数据”训练,后门依然顽固存在,这要求业界必须立即革新AI模型的安全防护实践。
2025-10-20
3
0
0
AI新闻/评测
AI基础/开发
2025-10-18
为什么AI写的文章总有一股“AI味”?
2025-10-18
0
0
0
AI新闻/评测
AI工具应用
2025-10-17
美陆军少将披露:正利用AI辅助个人与组织决策制定
美国陆军一位高级将领坦承,他正积极利用大语言模型(LLM)来优化个人和指挥的部队的决策制定过程。在美国陆军会议上,第八集团军司令威廉·泰勒少将透露,其团队定期使用AI进行后勤规划和作战预测分析,并将其应用于日常报告撰写及更重要的个体决策提升。尽管此举旨在现代化管理,但鉴于当前LLM存在的“一本正经地胡说八道”和迎合用户的已知缺陷,将人工智能应用于军事决策的潜在风险也引发了关注。
2025-10-17
2
0
0
AI行业应用
AI基础/开发
2025-10-17
AI深度赋能企业财务:成本下降催生需求爆发,如何应对“幻觉”挑战?
随着AI大模型成本的显著下降(如DeepSeek的问世),企业财务领域正从“流程自动化”迈向“智能决策”的新阶段。本文深入探讨了AI如何在票据识别、跨语言处理、意图识别和动态决策等方面赋能财务费控,并着重分析了AI“幻觉”对财务严谨性的最大挑战及应对策略。
2025-10-17
2
0
0
AI工具应用
AI行业应用
AI基础/开发
2025-10-17
深度学习模型:我们离真正理解世界还有多远?
人工智能领域正在经历飞速发展,尤其是深度学习模型,它们在特定任务上展现出惊人能力。然而,一个核心争议仍然存在:这些模型是否真正理解了它们处理的信息,还是仅仅在进行复杂的模式匹配?研究人员强调,当前的大模型虽然能生成流畅文本和精确预测,但在常识推理、因果关系理解和灵活泛化能力上仍存在显著局限性。要实现通用人工智能(AGI),我们必须超越表层统计关联,构建出具备深层世界模型的系统,这将是未来AI研究的关键挑战。
2025-10-17
1
0
0
AI基础/开发
AI新闻/评测
1
2
3