安全设计-青云TOP-AI综合资源站平台|青云聚合API大模型调用平台|全网AI资源导航平台

青云TOP-AI综合资源站平台|青云聚合API大模型调用平台|全网AI资源导航平台

行动起来，活在当下

累计撰写 7387 篇文章
累计创建 3268 个标签
累计收到 0 条评论

目录CONTENT

以下是安全设计相关的文章

2026-04-10
如何防御大模型提示词注入攻击：StruQ 与 SecAlign 深度解析大模型提示词注入攻击是当前AI应用的首要威胁。本文深入探讨了StruQ与SecAlign两种创新性微调防御技术，通过安全前端与结构化指令优化，在几乎不增加计算成本的情况下，有效解决了LLM被恶意指令操纵的安全隐患。
- 2026-04-10
- 1
- 0
- 0
- AI基础/开发
- AI新闻/评测
2026-04-08
OpenAI 发布儿童安全蓝图：利用 AI 技术打击网络性剥削 OpenAI 发布了一份旨在加强人工智能领域儿童保护的政策蓝图。该方案结合了法律、技术与运营手段，重点打击 AI 生成的有害内容，并倡导通过“安全设计”原则从源头预防针对儿童的性剥削行为。
- 2026-04-08
- 0
- 0
- 0
- AI新闻/评测
- AI行业应用
2026-04-08
优化 AI 智能体设计：提升对“提示注入”的免疫力 OpenAI 深度剖析提示注入攻击的演变，指出其正向社会工程学手段靠拢。文章提出从系统架构层面构建防御体系，确保即使智能体被误导，其操作影响也能得到有效控制，从而保障用户安全。
- 2026-04-08
- 0
- 0
- 0
- AI基础/开发
- AI新闻/评测
2026-04-07
助力开发者为青少年打造更安全的 AI 体验 OpenAI 推出全新的青少年安全策略提示词包，旨在辅助开发者利用 gpt-oss-safeguard 模型，为青少年用户构建更安全、健康的 AI 使用环境。本文解析了这些策略如何帮助开发者解决内容分类难题，并促进 AI 安全标准的行业共识。
- 2026-04-07
- 0
- 0
- 0
- AI基础/开发
- AI行业应用
2026-03-27
如何防御提示词注入攻击？详解 StruQ 与 SecAlign 两种微调防御方案提示词注入是大型语言模型应用面临的首要威胁。本文深入解析了提示词注入的成因，并介绍伯克利大学提出的StruQ与SecAlign两种创新微调防御方案，通过结构化指令和偏好优化，有效提升LLM应对恶意攻击的鲁棒性。
- 2026-03-27
- 0
- 0
- 0
- AI基础/开发
- AI新闻/评测
2026-03-24
NVIDIA OpenShell 如何实现安全设计的自主AI代理 NVIDIA OpenShell 是一款专为自主AI代理设计的开源安全运行时。它通过在环境层面而非模型或应用层面实施安全策略，为企业提供了一个安全的沙箱环境，以控制和监控AI代理的行为，防止数据泄露和安全风险。
- 2026-03-24
- 0
- 0
- 0
- AI基础/开发
- AI工具应用