目 录CONTENT

文章目录

SynthID:它是什么以及如何工作

Administrator
2026-03-21 / 0 评论 / 0 点赞 / 0 阅读 / 0 字

📢 转载信息

原文链接:https://www.kdnuggets.com/synthid-what-it-is-and-how-it-works

原文作者:Shittu Olumide


SynthID: What it is and How it Works
Image by Author

 

SynthID:它是什么以及如何工作

 
随着AI生成媒体的日益强大和普及,区分AI生成内容与人类创作内容变得愈发困难。为应对错误信息、深度伪造和合成媒体滥用等风险,Google DeepMind开发了SynthID,这是一种能够将肉眼无法察觉的数字水印嵌入AI生成内容中,并支持对该内容进行强有力的识别的工具集。

通过将水印直接包含在内容生成过程中,SynthID有助于验证内容的来源,并支持AI系统的透明度和信任。SynthID的覆盖范围包括文本、图像、音频和视频,并为每种媒体类型提供了定制化的水印技术。在本文中,我将解释SynthID是什么,它是如何工作的,以及你如何使用它为文本添加水印。

 

什么是SynthID?

 
本质上,SynthID是一个专为AI生成内容设计的数字水印和检测框架。它是一个水印框架,能够将不可察觉的信号注入到AI生成的文本、图像和视频中。这些信号能够抵抗压缩、调整大小、裁剪和常见的转换。与内容来源与真实性联盟(C2PA)等基于元数据的方法不同,SynthID在模型或像素级别运行。SynthID不是在生成后附加元数据,而是在内容本身中嵌入隐藏的签名,其编码方式对人类来说是不可见的或听不见的,但可以通过算法扫描器进行检测。

SynthID的设计目标是用户不可见、抗干扰且能被软件可靠检测。

 

SynthID的两个主要组成部分

 

SynthID已集成到Google的AI模型中,包括Gemini(文本)、Imagen(图像)、Lyria(音频)和Veo(视频)。它还支持SynthID Detector门户等工具,用于验证上传的内容。

 

为什么SynthID很重要

生成式AI可以创建高度逼真的文本、图像、音频和视频,这些内容很难与人类创作的内容区分开来。这带来了风险,例如:

  • 深度伪造视频和篡改媒体
  • 错误信息和欺骗性内容
  • 在需要透明度的场景中,AI内容被未经授权地重复使用

SynthID提供了原始标记,帮助平台、研究人员和用户追踪内容来源,并评估其是否为合成生成。

 

SynthID水印的技术原理

SynthID的水印方法根植于隐写术——一种隐藏信息的技术,在不被察觉的情况下将信号隐藏在其他数据中,但可以使用密钥或检测器进行恢复。

关键设计目标是:

  • 水印不得降低内容的面向用户质量
  • 水印必须能够抵抗常见的更改,如压缩、裁剪、噪声和滤镜
  • 水印必须可靠地表明内容是由使用SynthID的AI模型生成的

以下是SynthID在不同媒体类型中实现这些目标的具体方式。

 

文本媒体

 

基于概率的水印

SynthID在文本生成过程中,通过调整大型语言模型(LLMs)在选择下一个词元(单词或词元的一部分)时使用的概率分布来嵌入信号。

 

基于概率的水印

 

这种方法得益于文本生成固有的概率性和统计性;微小而受控的调整不会影响输出质量,同时提供了可追溯的签名。

 

图像和视频媒体

 

像素级水印

对于图像和视频,SynthID将水印直接嵌入生成的像素中。例如,通过扩散模型进行生成时,SynthID会在特定位置微妙地修改像素值。

这些更改低于人类可察觉的差异,但编码了机器可读的模式。在视频中,水印是逐帧应用的,即使在裁剪、压缩、噪声或滤波等转换后也能进行时间检测。

 

音频媒体

 

基于视觉的编码

对于音频内容,水印过程利用了音频的频谱表示。

  • 将音频波形转换为时频表示(频谱图)。
  • 使用与心理声学(声音感知)特性相符的编码技术,在频谱图中编码水印模式。
  • 从修改后的频谱图中重建波形,使嵌入的水印对人类听众来说仍然是不可察觉的,但可以被SynthID的检测器检测到。

这种方法确保即使在压缩、添加噪声或改变速度等更改后,水印仍然可以被检测到——尽管您必须知道极端更改可能会削弱可检测性。

 

水印检测与验证

 
一旦嵌入了水印,SynthID的检测系统就会检查内容,以确定是否存在隐藏的签名。

 

SynthID检测系统

 

SynthID Detector门户等工具允许用户上传媒体以扫描水印是否存在。检测结果会高亮显示具有强水印信号的区域,从而实现更细粒度的原创性检查。

 

SynthID的优势与局限性

 
SynthID旨在抵抗典型的内容转换,如裁剪、调整大小和图像/视频压缩,以及添加噪声和音频格式转换。对于文本,它也能处理轻微的编辑和改写。

然而,极端编辑、激进的改写和非AI转换等重大更改可能会降低水印的可检测性。此外,SynthID的检测主要适用于那些集成了水印系统的模型(如Google的AI模型)所生成的内容。对于缺乏SynthID集成的外部模型生成的AI内容,它可能无法检测。

 

应用与更广泛的影响

 
SynthID的核心用例包括以下几点:

  • 内容原创性验证:区分AI生成内容与人类创作材料。
  • 打击错误信息:例如,追踪用于欺骗性叙事的合成媒体的来源。
  • 媒体来源、合规平台和监管机构可以帮助追踪内容来源。
  • 研究与学术诚信:支持AI的负责任使用。

通过将恒定的标识符嵌入AI输出中,SynthID增强了生成式AI生态系统的透明度和信任度。随着采用率的增长,水印可能会成为行业和研究领域AI平台的标准做法。

 

结论

 
SynthID代表了AI内容可追溯性方面的一项重要进展,它将加密强度高、肉眼不可见的水印直接嵌入生成的媒体中。通过利用模型对文本词元概率的影响、对图像和视频的像素修改以及对音频的频谱图编码,SynthID在不影响内容质量的前提下,实现了可见性、强度和可检测性的实用平衡。

随着生成式AI的不断发展,像SynthID这样的技术将在确保负责任的部署、挑战滥用以及在一个合成内容无处不在的世界中维护信任方面发挥越来越核心的作用。
 
 

Shittu Olumide是一位软件工程师兼技术作家,热衷于利用尖端技术创作引人入胜的故事,对细节有敏锐的洞察力,并擅长简化复杂的概念。你也可以在 Twitter 上找到Shittu。




🚀 想要体验更好更全面的AI调用?

欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。

0

评论区