目 录CONTENT

文章目录

一股神秘的机器人流量正席卷网络,来自中国的流量激增引人关注

Administrator
2026-02-18 / 0 评论 / 0 点赞 / 0 阅读 / 0 字

📢 转载信息

原文链接:https://www.wired.com/story/made-in-china-niche-websites-are-seeing-a-surge-of-mysterious-traffic-from-china/

原文作者:Zeyi Yang


在十月份的一个短暂时刻,亚历杭德罗·金特罗(Alejandro Quintero)以为自己在中国取得了巨大的成功。这位居住在波哥大的数据分析师拥有并管理着一个发布有关闹鬼、外星人等超自然活动文章的网站。他说,内容是用“西班牙语夹杂英语”(Spanglish)写的,从未打算面向亚洲受众。但去年秋天,金特罗的网站突然开始收到来自中国和新加坡的大量访问。来自这两个国家的流量之高且稳定,以至于现在它们占了金特罗网站过去12个月总访问量的一半以上。

当他第一次注意到流量激增时,金特罗以为他在世界另一端找到了一个受众。金特罗回忆说,他当时想:“我现在必须去中国,因为我在那里很火爆。”但当他深入研究数据时,他意识到出了问题。网站所有者常用的网络流量分析工具 Google Analytics 显示,所有来自中国的访客都来自一个特定的城市:兰州。他们不太可能是真人,因为他们在页面上平均停留 0 秒,既不滚动也不点击。金特罗很快意识到他的网站实际上正被机器人轰炸。

金特罗后来从社交媒体上了解到,从九月份开始,他绝不是唯一一个开始看到大量来自中国和新加坡的机器人的网站运营者。一家位于印度的生活杂志、一个关于加拿大海岸边小岛的博客、几家个人作品集网站的所有者、一个拥有超过 1500 万页面的天气预报平台、由 Shopify 托管的电子商务商店,甚至是美国政府运营的域名,都报告称遭到了似乎是同一批机器人的攻击。它们很容易被发现,因为这些机器人显著扭曲了每个网站的正常分析模式。在过去 90 天里,美国政府网站 14.7% 的访问量来自兰州,6.6% 来自新加坡,根据 Analytics.usa.gov 的数据,这使它们成为世界上最渴望获取美国政府信息的两个城市。

尽管它们的 IP 地址可以追溯到中国和新加坡,但对于这次大规模自动化访问背后的真正主使,却鲜有信息。被针对的网站所有者大多得出结论,这些机器人没有造成任何直接伤害。鉴于去年互联网上与 AI 相关的机器人活动激增,许多人认为这些流量可能与那些为训练模型而收集网络数据的公司有关。

兰州到底在哪里?

当网站所有者看到来自中国的访问量突然增加时,许多人开始问:兰州在哪里?这个中国西北部的二线城市以其重工业和作为丝绸之路贸易中心的悠久历史而闻名。但它既不是科技中心,也不是大量数据中心的所在地。那为什么会有如此多的流量来自这个城市呢?

据分析自动化网络流量的公司 Known Agents 的创始人加文·金(Gavin King)说,兰州可能不是机器人的实际来源。金自己的公司网站也遭到了来自中国和新加坡的机器人的攻击。当他深入研究这些访问的具体细节时,他能确定的唯一一件事是,所有流量最终都通过新加坡路由。谷歌分析工具认为访问来自兰州,但金说那可能只是一个合理的猜测,而不是精确的位置。

但金发现的最确凿的细节是,这些流量是通过几家主要中国云公司的服务器路由的。金说,他网站收到的机器人流量都来自 ASN 132203,这是互联网路由系统中分配给中国公司腾讯运营的一个互联网服务提供商的唯一标识符。一个大型天气预报网站集团的经理安迪(Andy,为保护隐私只透露了名字)说,他检测到来自与腾讯、阿里巴巴和华为相关的 ASN 的机器人流量。这三家公司都是主要的云服务提供商,目前尚不清楚这些机器人是来自内部还是使用其服务器的客户。

许多人怀疑这些机器人是人工智能公司收集网络训练数据工作的一部分。在 2025 年,AI 机器人占了整个网络流量的很大一部分,它们抓取互联网上的文本和其他信息,以喂养给数据需求旺盛的大型语言模型

但这些中国机器人与其他 AI 机器人存在一些关键区别。首先,它们仅仅是数量太多了。金在他的网站上表示,来自中国和新加坡的流量占总流量的 22%,而所有其他 AI 机器人加起来还不到 10%。

大多数领先的 AI 公司都会向网站运营商清楚地标明它们的机器人身份,这使得它们更容易被屏蔽。互联网基础设施公司 Akamai 的安全技术和战略高级总监布伦特·梅纳德(Brent Maynard)表示,前沿 AI 实验室“不太热衷于规避”机器人屏蔽规则。他说,AI 公司通常只在网站关上大门后才会试图伪装它们的机器人。然而,据几位网站所有者告诉 WIRED,这波中国机器人从一开始就伪装成正常的网络用户,甚至绕过了常见的机器人屏蔽规则。

除了 AI 公司,其他一些企业也有动力抓取互联网内容,包括搜索引擎爬虫和情报收集公司。

不断上涨的成本和失真的数据

至少到目前为止,好消息是这些机器人似乎没有明确的恶意目的。它们尚未被公开与任何网络攻击联系起来,似乎也没有在扫描漏洞。但缺乏明确的动机也增加了困惑。

一些网站所有者担心这些机器人正在未经许可地扫描受版权保护的材料。其他人则表示,流量激增迫使他们为带宽支付更多费用,因为机器人流量挤占了人类用户,或者需要投资更复杂的防护工具。这些访问还会扭曲流量分析数据,使关于谁是真正访问他们网站的人的报告失真。

但受影响最大的是那些通过网站广告点击来盈利的人。这位超自然博客的所有者金特罗说:“这正在摧毁我的 AdSense 策略,因为他们会说[你的网站]只被机器人访问,所以你的内容对访客没有价值。”因此,像他的网站可能会被广告商视为吸引力较低,并受到谷歌的惩罚。

临时解决方案

在过去的几个月里,许多人在在线支持渠道抱怨来自中国的 AI 机器人问题,或直接向其网络托管服务提供商发送信息。但到目前为止,仍然鲜有确切的答案。

WIRED 联系后,WordPress 承认,它在最近几个月收到报告称其部分网站正经历来自可疑 AI 机器人或抓取工具的流量增加。“WordPress 网站一直拥有出色的结构,使其易于被搜索引擎查找和索引。这些相同的功能也使其容易被 AI 抓取,”该公司在一封未署名的电子邮件中表示。谷歌、Cloudflare 和 Squarespace 未回应置评请求。

一些网站运营商现在正在自己动手解决问题。在 Reddit 等社交平台上,这些机器人的受害者们交流了识别和阻止它们的临时策略。随着时间的推移,他们了解到这些机器人通常会把自己伪装成使用旧版本 Windows 操作系统和不常见的屏幕宽高比,这些特征使网站运营商能够将它们作为一个整体进行屏蔽。如果这些网站完全不关心来自中国或新加坡的流量,一些人还会选择阻止来自这些国家/地区拥有 IP 地址的任何访问。

天气网站经理安迪说,他最终屏蔽了与腾讯、阿里巴巴和华为相关的四个 ASN。他说,这足以显著减少机器人数量,但未能完全消除它们。他与 WIRED 交谈的那天,他网站上来自中国机器人的每日访问量已从峰值的 127,000 次下降到略高于 2,000 次。

随着自主 AI 工具在互联网上日益普及,弄清楚如何对抗它们可能会成为网站所有者越来越普遍的烦恼。Akamai 的梅纳德说:“在某种程度上,成为互联网的一部分就意味着要暴露在外,处于公共视野之中。”


这是 Zeyi Yang Louise Matsakis“中国制造新闻通讯”的一个版本。以前的新闻通讯请在 此处阅读。




🚀 想要体验更好更全面的AI调用?

欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。

0

评论区