首页
AI内容归档
AI新闻/评测
AI基础/开发
AI工具应用
AI创意设计
AI行业应用
AI行业应用
AI相关教程
CG资源/教程
在线AI工具
全网AI资源导航
青云聚合API
注册送免费额度
300+大模型列表
详细的教程文档
关于青云TOP
青云TOP-AI综合资源站平台|青云聚合API大模型调用平台|全网AI资源导航平台
行动起来,活在当下
累计撰写
7268
篇文章
累计创建
3256
个标签
累计收到
0
条评论
栏目
首页
AI内容归档
AI新闻/评测
AI基础/开发
AI工具应用
AI创意设计
AI行业应用
AI行业应用
AI相关教程
CG资源/教程
在线AI工具
全网AI资源导航
青云聚合API
注册送免费额度
300+大模型列表
详细的教程文档
关于青云TOP
目 录
CONTENT
以下是
安全设计
相关的文章
2026-04-10
如何防御大模型提示词注入攻击:StruQ 与 SecAlign 深度解析
大模型提示词注入攻击是当前AI应用的首要威胁。本文深入探讨了StruQ与SecAlign两种创新性微调防御技术,通过安全前端与结构化指令优化,在几乎不增加计算成本的情况下,有效解决了LLM被恶意指令操纵的安全隐患。
2026-04-10
0
0
0
AI基础/开发
AI新闻/评测
2026-04-08
OpenAI 发布儿童安全蓝图:利用 AI 技术打击网络性剥削
OpenAI 发布了一份旨在加强人工智能领域儿童保护的政策蓝图。该方案结合了法律、技术与运营手段,重点打击 AI 生成的有害内容,并倡导通过“安全设计”原则从源头预防针对儿童的性剥削行为。
2026-04-08
0
0
0
AI新闻/评测
AI行业应用
2026-04-08
优化 AI 智能体设计:提升对“提示注入”的免疫力
OpenAI 深度剖析提示注入攻击的演变,指出其正向社会工程学手段靠拢。文章提出从系统架构层面构建防御体系,确保即使智能体被误导,其操作影响也能得到有效控制,从而保障用户安全。
2026-04-08
0
0
0
AI基础/开发
AI新闻/评测
2026-04-07
助力开发者为青少年打造更安全的 AI 体验
OpenAI 推出全新的青少年安全策略提示词包,旨在辅助开发者利用 gpt-oss-safeguard 模型,为青少年用户构建更安全、健康的 AI 使用环境。本文解析了这些策略如何帮助开发者解决内容分类难题,并促进 AI 安全标准的行业共识。
2026-04-07
0
0
0
AI基础/开发
AI行业应用
2026-03-27
如何防御提示词注入攻击?详解 StruQ 与 SecAlign 两种微调防御方案
提示词注入是大型语言模型应用面临的首要威胁。本文深入解析了提示词注入的成因,并介绍伯克利大学提出的StruQ与SecAlign两种创新微调防御方案,通过结构化指令和偏好优化,有效提升LLM应对恶意攻击的鲁棒性。
2026-03-27
0
0
0
AI基础/开发
AI新闻/评测
2026-03-24
NVIDIA OpenShell 如何实现安全设计的自主AI代理
NVIDIA OpenShell 是一款专为自主AI代理设计的开源安全运行时。它通过在环境层面而非模型或应用层面实施安全策略,为企业提供了一个安全的沙箱环境,以控制和监控AI代理的行为,防止数据泄露和安全风险。
2026-03-24
0
0
0
AI基础/开发
AI工具应用