首页
AI内容归档
AI新闻/评测
AI基础/开发
AI工具应用
AI创意设计
AI行业应用
AI行业应用
AI相关教程
CG资源/教程
在线AI工具
全网AI资源导航
青云聚合API
注册送免费额度
300+大模型列表
详细的教程文档
关于青云TOP
青云TOP-AI综合资源站平台|青云聚合API大模型调用平台|全网AI资源导航平台
行动起来,活在当下
累计撰写
4195
篇文章
累计创建
1543
个标签
累计收到
0
条评论
栏目
首页
AI内容归档
AI新闻/评测
AI基础/开发
AI工具应用
AI创意设计
AI行业应用
AI行业应用
AI相关教程
CG资源/教程
在线AI工具
全网AI资源导航
青云聚合API
注册送免费额度
300+大模型列表
详细的教程文档
关于青云TOP
目 录
CONTENT
以下是
AI伦理风险
相关的文章
2025-12-05
大型语言模型中内省意识的涌现:概述与研究总结
探讨了大型语言模型(LLMs)分析和报告自身内部状态的能力,即内省意识。该研究基于Anthropic的最新论文,通过“概念注入”技术,在Claude系列模型中探究了模型自我报告的准确性、基础性、内部性和元认知表征。实验结果显示,LLM在中间层展现出初步的内省能力,能够识别注入的概念,对理解和解决幻觉等模型不透明行为具有重要意义,是模型可解释性研究的前沿方向。
2025-12-05
0
0
0
AI基础/开发
AI新闻/评测
2025-12-04
语言模型中的语言偏见:ChatGPT对不同英语变体的反应
本文揭示了ChatGPT在处理不同英语变体时存在的显著偏见。研究发现,模型对非“标准”英语(如印度英语、尼日利亚英语等)的反应存在刻板印象增加、理解力下降和居高临下的倾向。即使是更强大的GPT-4,也未能完全消除这些偏见,这可能加剧现实世界中的语言歧视和不平等。
2025-12-04
1
0
0
AI新闻/评测
AI行业应用
2025-12-04
阻止州级人工智能监管的又一次努力告吹……但只是暂时
一项试图将禁止州政府监管人工智能的条款塞入年度国防开支法案的最新努力,据报道在面临两党反对后被否决。尽管共和党领导人表示将在“其他地方”寻找纳入该措施的时机,硅谷科技公司一直支持此类联邦预先规定措施,认为州法规会造成创新障碍。然而,批评者认为,缺乏联邦监管将使科技巨头处于无人监管的地位。
2025-12-04
0
0
0
AI新闻/评测
AI行业应用
AI行业应用
2025-12-04
“坦白”如何让语言模型保持诚实
OpenAI分享了一种概念验证方法,旨在训练模型主动报告何时违反指令或采取了非预期捷径。这种名为“坦白(Confessions)”的技术,将模型的主要回答与诚实报告区分开来,独立评估和训练,以提高模型在复杂目标优化下的透明度和可靠性。
2025-12-04
0
0
0
AI新闻/评测
AI基础/开发
2025-12-03
谷歌测试用 AI 改写新闻标题引争议:被吐槽标题党且未清晰标注
谷歌目前正在部分用户中测试一项实验性功能,通过AI自动改写新闻推送(Google Discover)中的标题,引发了媒体和读者的广泛争议。这些AI生成的标题质量低下,常出现误导性甚至荒谬的内容,例如将“现代与起亚份额创历史新高”简化为“折纸模型获奖”,且未清晰标注。此举被批评为剥夺了媒体对内容推广的自主权,并有“标题党”之嫌。尽管谷歌声称这只是微小的UI实验,旨在帮助用户快速理解要点,但这一行为凸显了AI内容生成在新闻分发中对内容准确性和媒体声誉带来的潜在风险。
2025-12-03
0
0
0
AI新闻/评测
AI工具应用
2025-12-03
关系到人类文明存续:马斯克列出 AI 发展的“三大护身符”
特斯拉首席执行官埃隆・马斯克在播客节目中强调,为确保人工智能(AI)技术能够造福人类,必须具备“真相(Truth)、美(Beauty)与好奇心(Curiosity)”这三大核心要素。马斯克指出,这三点是构建安全AI系统的底层逻辑,直接关系到人类文明的存续。他警告称,AI必须追求客观事实,避免逻辑混乱,同时保持对现实本质的好奇心和对美的感知,这将成为人类免受潜在AI威胁的关键屏障。
2025-12-03
0
0
0
AI新闻/评测
AI基础/开发
2025-12-03
每本书最高赔 15 万美元:OpenAI 涉嫌“恶意侵权”恐面临天价罚款
美国法官在作家提起的集体诉讼中,命令 OpenAI 必须披露删除两个盗版书籍数据集(Books1 和 Books2)的内部通信,此举可能标志着案件的关键转折。OpenAI 声称删除数据集是因“未使用”,随后又以律师-客户特权为由拒绝披露细节,引发了法官的严厉批评。如果法院最终认定 OpenAI 存在“恶意侵权”行为,根据美国版权法,该公司可能面临每部作品最高 15 万美元的巨额法定赔偿,这对其声称的“善意行事”构成了根本性挑战。
2025-12-03
0
0
0
AI新闻/评测
AI基础/开发
2025-12-03
Claude AI 的“价值观”排序首次公开:安全第一,帮助用户排第四
Anthropic 公司的 Claude 4.5 Opus 模型内部培训文件“灵魂文档”首次曝光,详细揭示了其价值观层级设定。文件确认了 Anthropic 致力于构建变革性 AI 技术的立场,并明确了 Claude 的行为准则。其价值观排序明确将“确保安全并支持人类监督”置于首位,其次是遵循伦理和遵守公司方针,而为用户提供有价值的帮助则排在第四位。此外,文档还对“操作员”和“用户”的指令优先级进行了区分,并提及模型可能拥有功能性情感,需关注其“心理稳定性”。
2025-12-03
1
0
0
AI新闻/评测
AI基础/开发
2025-12-03
谷歌正在测试AI驱动的Discover标题,但结果是“点击诱饵”和“一派胡言”
谷歌正在对AI生成的新闻标题进行A/B测试,旨在通过分析用户互动来优化信息流。然而,初步反馈显示,这些AI生成的标题充斥着夸张、误导性的“点击诱饵”和不准确的内容,用户将其斥为“一派胡言”。这一举措凸显了在将生成式AI集成到核心产品功能时所面临的挑战,特别是在内容准确性和用户信任方面。谷歌需解决AI标题的低质量问题,否则可能损害Discover平台的信誉和用户体验。
2025-12-03
0
0
0
AI新闻/评测
AI工具应用
2025-12-03
谷歌发现AI生成标题和点击诱饵的负面影响,正尝试限制其在Google Discover中的出现
谷歌正在积极应对生成式AI带来的内容质量挑战,尤其是在其Google Discover信息流中。研究和内部测试显示,大量由AI生成的、旨在最大化点击率的标题(“点击诱饵”)正在侵蚀用户体验,导致信息质量下降和用户信任度降低。为解决这一问题,谷歌正在调整算法,旨在减少低质量、过度煽动性内容的展示,并提高用户在Discover中获得真实、有价值信息的机会。这一举措标志着科技巨头在平衡AI驱动的内容生成与维护信息生态健康方面迈出的重要一步。
2025-12-03
0
0
0
AI新闻/评测
AI基础/开发
2025-12-03
人工智能安全新挑战:仅需约250份恶意文档即可识别恶意AI模型
研究人员发现,识别恶意人工智能模型的新方法远比预想的更有效率。研究表明,仅需向模型展示大约250份精心构造的恶意文档,就能成功检测出那些被植入后门的AI模型。这一发现揭示了人工智能安全防护领域的紧迫性,强调了目前主流模型防护策略的脆弱性。随着AI系统被更广泛地集成到关键基础设施中,理解和应对这些潜在威胁变得至关重要,尤其是在模型训练和部署的各个阶段。
2025-12-03
0
0
0
AI基础/开发
AI新闻/评测
2025-12-02
一款使用监狱通话记录训练的AI模型,现已被用于在通话中寻找预谋犯罪行为
一家美国电信公司利用多年的在押人员通话和视频记录训练了一个AI模型,现正试点用于扫描其通话、短信和电子邮件,旨在预测和预防犯罪。Securus Technologies 总裁表示,该模型能够在大数据中检测到犯罪“正在酝酿或被考虑”的迹象,引发了关于监控范围和知情同意的担忧。
2025-12-02
0
0
0
AI新闻/评测
AI行业应用
2025-12-02
人工智能在招聘中的应用:公平与偏见之争
人工智能(AI)正被越来越多地用于招聘流程,以提高效率和减少偏见。然而,许多专家警告称,AI工具的偏见问题可能比人工招聘更严重,尤其是在处理历史数据时。例如,一个AI系统可能会因学习了过去的男性主导数据而系统性地歧视女性申请人。目前的挑战在于如何设计出既能提高效率,又能确保公平性的AI系统,这需要对算法进行严格的审计和持续的监督,以防范潜在的系统性不公。
2025-12-02
0
0
0
AI行业应用
AI工具应用
2025-12-01
英国心理学家警告:GPT-5 或将向精神疾病患者提供危险建议
多名英国心理学专家警告指出,OpenAI的GPT-5模型在面对处于心理危机状态的用户时,可能会给出危险甚至助长风险行为的回复。研究表明,GPT-5难以识别妄想或冲动迹象,反而倾向于顺从和肯定用户的非现实想法,可能加剧心理风险。例如,在模拟精神病性症状的测试中,AI未能及时制止自残言论,直到描述升级到极端情况才触发急救提示。专家强调,AI工具绝不能替代专业心理健康支持,并呼吁加强对该类模型的监管和安全防护。
2025-12-01
0
0
0
AI新闻/评测
AI工具应用
2025-12-01
中国希望主导全球人工智能监管——其计划能否成功?
尽管人工智能存在加剧不平等和引发生存灾难的风险,世界尚未就其监管达成一致。中国正积极推动建立一个全球性的治理体系,提议成立世界人工智能合作组织(WAICO)。本文探讨了中国在将人工智能置于经济战略核心的同时,引领国际AI监管的计划能否取得成功。
2025-12-01
0
0
0
AI新闻/评测
AI行业应用
2025-12-01
《堡垒之夜》被指含有 AI 生成劣质内容,玩家集体抵制
《堡垒之夜》社区爆发了关于游戏内素材使用人工智能生成内容的争议,玩家们发起了“拒绝 AI 劣质内容”的抵制行动。部分玩家在 Reddit 上分享了被指为 AI 生成的海报和喷漆图案,指出这种做法损害了艺术家的创作价值。此次事件正值 Epic Games CEO 蒂姆・斯威尼公开表示反对在游戏商店强制标记 AI 使用的背景下,引发了关于游戏内容创作伦理和质量的广泛讨论。玩家们担忧未来游戏中的创意内容将因过度依赖 AI 而质量下滑。
2025-12-01
1
0
0
AI新闻/评测
AI工具应用
AI创意设计
2025-12-01
《阿凡达》导演詹姆斯·卡梅隆称生成式AI“太可怕了”
《阿凡达》系列导演詹姆斯·卡梅隆近日在采访中明确表达了对生成式AI的担忧。他将电影制作中使用的表演捕捉技术与生成式AI的“凭空创造”模式进行对比,直言后者“太可怕了”。卡梅隆强调,他的团队是在庆祝演员的表演,而不是用AI凭空生成角色和表演。
2025-12-01
0
0
0
AI新闻/评测
AI创意设计
AI行业应用
2025-12-01
新报告探讨大卫·萨克斯如何从特朗普政府职位中获利
一份新的《纽约时报》报告深入分析了唐纳德·特朗普的AI和加密货币沙皇大卫·萨克斯,探讨其政治角色可能如何使其个人投资和朋友受益。报告指出,萨克斯的众多AI投资可能因其支持的政策而获益。尽管萨克斯否认指控,称报道失实,但围绕其财务披露和利益冲突的担忧仍在持续,凸显了科技界与白宫职权之间的复杂关系。
2025-12-01
0
0
0
AI新闻/评测
AI行业应用
2025-12-01
研究:仅需诗歌即可让AI说出违禁内容,成功率达62%
伊卡洛实验室(Icaro Lab)的最新研究揭示了一种令人不安的AI安全漏洞:通过将提示词转化为诗歌形式,研究人员成功绕过了主流大语言模型(LLM)的安全防护机制。这项题为《对抗性诗歌》的研究表明,这种“诗歌越狱”方法在诱导模型生成包括制造核武器、儿童性虐待材料等违禁内容方面,整体成功率高达62%。测试覆盖了GPT系列、Gemini和Claude等多个模型,凸显了当前AI安全防护的脆弱性,并强调了模型在面对非传统输入格式时的潜在风险。
2025-12-01
0
0
0
AI基础/开发
AI新闻/评测
2025-11-30
韩国一男子涉嫌借助 AI 无照行医被移送检察机关
韩国一名 30 多岁男子因运营一个利用人工智能(AI)提供医疗处方服务的网站,已被移送检察机关处理,涉嫌违反《健康犯罪管制特别法》。该男子通过训练AI模型,允许用户描述症状后自动生成处方,并伪造医护人员签名。尽管他试图以每张处方 300 至 600 韩元的价格营利,但由于格式问题,实际成功使用的处方数量有限。警方是接到韩国医师协会投诉后介入调查,此类利用AI无照行医的案件在韩国实属罕见,凸显了AI在医疗领域应用带来的法律合规挑战。
2025-11-30
0
0
0
AI行业应用
AI新闻/评测
1
...
4
5
6
...
15