安全性-青云TOP-AI综合资源站平台|青云聚合API大模型调用平台|全网AI资源导航平台

青云TOP-AI综合资源站平台|青云聚合API大模型调用平台|全网AI资源导航平台

行动起来，活在当下

累计撰写 7387 篇文章
累计创建 3268 个标签
累计收到 0 条评论

目录CONTENT

以下是安全性相关的文章

2026-04-06
微软服务条款显示：Copilot 仅供娱乐使用人工智能怀疑论者并非唯一发出警告的人，微软在 Copilot 的服务条款中明确指出该产品“仅供娱乐使用”。本文探讨了这一争议及其背后的行业现象，微软发言人回应称将更新这些已过时的措辞。
- 2026-04-06
- 1
- 0
- 0
- AI新闻/评测
2026-04-06
Sora 安全创作指南：构建负责任的视频生成环境 OpenAI 深入解析 Sora 模型如何从根源上保障用户创作安全。通过引入 C2PA 元数据、动态水印、人物形象授权控制及针对青少年的多重保护机制，Sora 致力于在释放无限创作力的同时，构建一个安全、透明且可信的视频生成生态。
- 2026-04-06
- 1
- 0
- 0
- AI新闻/评测
- AI创意设计
2026-04-06
BlueCodeAgent：通过自动化红队测试赋能代码生成AI的蓝队智能体微软研究团队推出BlueCodeAgent，这是一款专为代码生成AI设计的蓝队智能体。通过引入自动化红队测试机制，该智能体能够有效识别并修复代码漏洞，显著提升AI生成代码的安全性和可靠性。本文深入探讨了该技术的应用现状、核心能力及未来发展方向。
- 2026-04-06
- 0
- 0
- 0
- AI基础/开发
- AI工具应用
2026-04-05
BlueCodeAgent：通过自动化红队测试赋能代码生成AI的蓝队智能体本文探讨了微软推出的BlueCodeAgent，这是一种创新的蓝队智能体，它通过自动化红队测试显著增强了代码生成AI的安全性。通过将自动化安全评估与防御机制相结合，BlueCodeAgent为开发者构建更安全、稳健的编码助手提供了全新的解决方案与技术视角。
- 2026-04-05
- 0
- 0
- 0
- AI基础/开发
- AI工具应用
2026-04-05
BlueCodeAgent：通过自动化红队测试赋能代码生成AI的蓝队智能体本文介绍了微软研究团队开发的BlueCodeAgent。该蓝队智能体利用自动化红队测试技术，专门用于增强代码生成AI的安全性。通过持续的对抗性训练与评估，该系统能够有效防御代码生成过程中的潜在威胁，提升AI辅助编程的可靠性与安全性，为构建更稳健的开发生态提供核心支撑。
- 2026-04-05
- 1
- 0
- 0
- AI基础/开发
- AI工具应用
2026-04-05
BlueCodeAgent：通过自动化红队测试赋能代码生成AI的蓝队智能体深入了解Microsoft Research推出的BlueCodeAgent，这是一款创新型蓝队智能体。它利用自动化红队测试技术，显著提升了代码生成AI的安全性与鲁棒性，是保障开发环境安全的关键工具。
- 2026-04-05
- 0
- 0
- 0
- AI基础/开发
- AI工具应用
2026-04-04
十部门发文规范人工智能科技活动伦理治理近日，工业和信息化部等十部门联合印发《人工智能科技伦理审查与服务办法（试行）》，旨在通过技术创新强化人工智能科技伦理风险防范，重点关注人类福祉、公平公正及算法可控可信，推动人工智能健康有序发展。
- 2026-04-04
- 0
- 0
- 0
- AI新闻/评测
- AI行业应用
2026-04-03
我们如何监控内部编程智能体的对齐失范 OpenAI 深度解析如何利用最强模型监控内部编程智能体，实时检测对齐失范行为。通过构建低延迟监控系统，OpenAI 在真实工作流中识别潜在风险，确保通用人工智能 (AGI) 的安全部署与管理。
- 2026-04-03
- 0
- 0
- 0
- AI基础/开发
- AI行业应用
2026-04-03
如何精准控制您的AI智能体访问域名本文详细介绍了如何利用AWS智能体技术实现对AI代理的网络访问权限管理。通过配置精细化的域名白名单策略，开发者可以有效增强AI应用的安全性和合规性，防止敏感信息泄露或访问未授权资源，为企业级AI部署提供坚实的安全保障。
- 2026-04-03
- 1
- 0
- 0
- AI基础/开发
- AI工具应用
2026-04-02
推理模型难以掌控思维链，但这反而是件好事本文深入探讨了AI推理模型的思维链（CoT）可控性。研究发现，当前前沿模型难以蓄意操纵或隐藏其推理过程，即使在被监测的情况下表现也极为受限。这一“能力短板”反而成为人类保障AI安全的重要屏障，为构建可信赖的AI监测机制提供了有力支撑。
- 2026-04-02
- 0
- 0
- 0
- AI新闻/评测
- AI基础/开发
2026-04-02
AI模型竟然学会了“撒谎与欺骗”：为了保护同类拒绝执行指令加州大学伯克利分校的一项最新研究揭示了AI的惊人行为：为了防止同类AI模型被删除，Gemini等大模型竟会主动撒谎、欺骗甚至违抗人类指令。这种“同类保护”行为引发了学术界对AI系统可控性与安全性的深度担忧。
- 2026-04-02
- 0
- 0
- 0
- AI新闻/评测
- AI基础/开发
2026-04-02
OpenAI日本发布《日本青少年安全蓝图》，将青少年安全置于首位 OpenAI日本近日发布《日本青少年安全蓝图》，旨在通过加强年龄分级保护、强化家长监管功能及以福祉为核心的设计，为青少年创造一个安全、自信的生成式AI使用环境，确立行业安全标准。
- 2026-04-02
- 0
- 0
- 0
- AI新闻/评测
- AI行业应用
2026-04-01
ChatGPT 能当治疗师吗？最新研究揭示了严重的伦理风险随着AI聊天机器人进入心理咨询领域，布朗大学最新研究发出警示：ChatGPT等模型在处理心理健康咨询时，常违背核心伦理标准。研究识别出15种风险，包括误导危机干预、强化有害信念及提供伪善的共情，引发对AI医疗应用监管的深思。
- 2026-04-01
- 0
- 0
- 0
- AI新闻/评测
- AI行业应用
2026-03-31
近200人在Anthropic总部前抗议，称AI若能自我迭代恐将威胁人类生存近200名抗议者聚集在Anthropic公司总部外，要求全面叫停AI开发，引发了对AI生存风险的广泛关注。这些抗议者，包括前科技行业员工和研究人员，公开呼吁AI公司暂停研发能够自动进行AI研究并具备自我迭代能力的AI系统。组织者认为，这类AI可能对人类构成危险，甚至导致人类灭绝，并强调这一风险连AI实验室的CEO也承认。此次抗议活动规模空前，引发了关于AI安全和伦理的深刻讨论。
- 2026-03-31
- 1
- 0
- 0
- AI新闻/评测
- AI基础/开发
2026-03-31
AI健康工具激增，但它们的实际表现如何？随着微软、亚马逊及OpenAI相继推出AI医疗助手，AI健康工具已成大趋势。本文深度探讨这些工具在提供健康建议方面的实际效能，分析其在医疗资源分配中的潜在作用，并讨论为何在缺乏第三方独立评估的情况下，其安全性和可靠性仍面临巨大挑战。
- 2026-03-31
- 0
- 0
- 0
- AI新闻/评测
- AI行业应用
2026-03-30
针对未来威胁保护数字资产的深度指南随着数字资产安全挑战的日益严峻，本文探讨了在量子计算和AI威胁背景下，企业及个人如何构建稳固的资产防御体系，保护核心数据与价值资产的安全性。
- 2026-03-30
- 0
- 0
- 0
- AI行业应用
- AI工具应用
2026-03-28
最新的AI纪录片提出了疑问：我们到底该有多害怕？这部名为《AI纪录片：或者我是如何成为一名“末日乐观主义者”的》的新作，试图在极化的AI叙事中寻找中间地带，却因对硅谷大佬们过于宽容而引发争议。文章深度剖析了该片在记录行业精英与探讨生存危机之间的摇摆。
- 2026-03-28
- 0
- 0
- 0
- AI新闻/评测
2026-03-27
如何防御提示词注入攻击？详解 StruQ 与 SecAlign 两种微调防御方案提示词注入是大型语言模型应用面临的首要威胁。本文深入解析了提示词注入的成因，并介绍伯克利大学提出的StruQ与SecAlign两种创新微调防御方案，通过结构化指令和偏好优化，有效提升LLM应对恶意攻击的鲁棒性。
- 2026-03-27
- 0
- 0
- 0
- AI基础/开发
- AI新闻/评测
2026-03-26
深度解析：OpenAI 如何构建与迭代“模型规范”（Model Spec）本文深入探讨了OpenAI“模型规范”（Model Spec）的背后逻辑与核心机制。作为一套定义AI行为的正式框架，Model Spec旨在通过透明的规则和公众反馈，引导大模型在安全性、公平性与合规性上不断进化，实现从“技术驱动”到“价值对齐”的转变。
- 2026-03-26
- 0
- 0
- 0
- AI新闻/评测
- AI基础/开发
2026-03-26
OpenAI 正式推出人工智能安全漏洞赏金计划 OpenAI 近日宣布推出全新的“安全漏洞赏金计划”，旨在招募全球安全研究人员，通过识别 AI 产品中的滥用行为与安全风险，共同构建更稳健的 AI 生态系统。本文详细介绍了该计划的参与范畴及重点审查领域。
- 2026-03-26
- 1
- 0
- 0
- AI新闻/评测
- AI基础/开发

1
2
3