匿名评论、匿名网帖真的“看不见”吗?现在,AI可以以90%的准确率脱掉你的“马甲”。整个过程只需几分钟,每次只需几美元。来自苏黎世瑞士联邦理工学院、Antropic等机构的研究人员在一项研究中得出了令人惊讶的结论。经过在 Hacker News、Reddit 和其他平台上的测试,我们发现,在对特定数据集和来自匿名帐户的稀疏帖子进行实验时,我们的大规模模型可以以 90% 的准确率识别出这些匿名在线帐户对应的真实用户 [1]。将您的大模型视为人工智能侦探。此前,获取匿名用户的相关信息通常需要花费几个小时手动阅读帖子、寻找线索并进行比较分析。现在,侦探和人工智能可以单独完成这项工作,同时大规模验证多个帐户。只需提供匿名人士的相关评论即可帐户,几分钟之内我们就会看到该用户最有可能是谁。本研究是一项关于人工智能侦探表现的实验。研究人员开发了一个四步攻击过程:特征身份提取、语义匹配搜索、最佳候选结果的推理选择以及置信度分数调整。结果显示,在90%准确率条件下,召回率(recall rates,指能够正确识别出目标用户的百分比)达到68%。相比之下,传统方法的回收率接近0%。相关文件(来源:arXiv)该研究还警告说,人工智能可能会重新识别必须在网上留下痕迹的用户,这可能会让互联网隐私问题重新成为人们关注的焦点。在线匿名是保护参与话题辩论的发言者隐私的一种手段,旨在让他们自由发言。但现在一切都变了。所谓的“匿名”发布模式被人工智能打乱了。你认为的匿名总是表明“你是谁”。人工智能是这些匿名账户的幕后黑手。能够在短时间内、低成本地快速找到真实用户,而后者面临隐私、搜身、广告等风险。这意味着论坛上的随意评论内容、当地美食、领章、书写习惯等,都可以成为大型模型中锁定说话者真实身份的重要线索,包括居住地、职业等个人信息。投资发起者在论文中表示:“我们的发现对于网络隐私非常重要。由于传统的匿名方法需要大量的努力和高昂的成本,网民长期以来遵循防御性假设,认为匿名可以提供足够的保护。然而,我们的大规模模型推翻了这一假设。”图丨大规模匿名化框架整体流程(来源:arXiv)测试效果为了确保技术的先进性,同时保护演讲者的隐私,研究人员从公共社交媒体网站收集了多个数据集。收集了黑客新闻和 LinkedIn 个人资料帖子的数据集,并根据用户个人资料进行编译。似乎跨平台参考将它们联系起来。然后,研究人员从支柱中删除了所有识别信息,并将 work.jar 设置为最大的模型。第二组数据是从Netflix公布的用户身份信息中获取的,包括个人偏好、推荐和交易日志。从匿名化的历史先例来看,德克萨斯大学奥斯汀分校的一个团队在 2008 年发表的一篇论文声称,Netflix 奖技术可用于识别匿名用户并确定他们的政治倾向和其他潜在的个人信息 [2]。创建数据集的第三种方法是将单个用户的 Reddit 历史记录按时间划分。 (来源:arXiv)“我们发现这些人工智能代理是论文作者之一Simon Rahmen在接受媒体采访时表示:“能够做到以前很难实现的事情:从自由文本(例如匿名采访的转录)开始,他们可以逐渐恢复一个人的完整身份。Esta是一个全新的功能。以前的重新识别方法通常需要结构化数据和两个具有相似模式的数据集可以链接起来。”他指出,与传统匿名识别方法最大的区别在于,AI代理可以像人类一样浏览网页,与网页交互为了系统地测试这种能力,研究团队设计了三组实验,研究人员分析了关于不同人群在日常生活中如何使用人工智能的人类调查结果,利用这些信息,我们能够成功识别出大约 7% 的人(9 人)。125 名参与者。 7%的恢复率虽然较低,但代表了AI能力的显着提升。 l大规模模型可以基于有限的信息来识别用户,即使信息非常有限且非结构化。研究团队认为,随着AI技术的进一步发展,未来将有可能识别更多的人。在另一项研究实验中,研究人员收集了有关 r/movies subreddit 和至少五个社区之一的 2,024 条评论:r/horror、r/MovieSuggestions、r/Letterboxd、r/TrueFilm 和 r/MovieDetails。结果显示,用户谈论的电影越多,就越容易确定其真实身份。根据平均数据,人工智能可以对 3.1% 的电影分享用户进行匿名化,准确率达到 90%;识别 1.2%,准确率达到 99%。当用户分享5到9部电影时,相应的识别准确率从90%和99%分别提高到8.4%和2.5%。两个比率均进一步提高至 48.1 when用户分享了10多部电影。 %和17%。 (来源:arXiv)在第三个研究实验中,研究人员针对 5000 名 Reddit 用户,为他们添加了“破坏者”身份。研究人员使用这种新方法与上面提到的 Netflix 奖品攻击方法进行了比较。接下来,我们将 5,000 个查询干扰者添加到 10,000 个候选用户的列表中。这包括仅出现在查询集中且在候选池中没有真正匹配的用户。结果表明,新技术显着优于模仿 Netflix 奖励攻击的传统基线。 (来源:arXiv)尽管这种大规模模型仍然存在误报和其他缺点,但结果表明,它很快就优于传统的资源密集型识别在线用户的方法。随着大规模匿名化模型成功率的提高,政府部门可以利用这些技术来揭示网络犯罪分子和诈骗者的身份,以及公司人们可以利用这项技术来推荐个性化广告。研究人员提出了多项对策,包括平台限制API访问用户数据的速度、检测自动爬取行为、限制批量数据导出等。大型模型供应商还可以监控其模型在匿名攻击中的滥用情况,并建立防御措施以允许其模型拒绝匿名请求。这项研究挑战我们思考新问题。当你在互联网上的每一个痕迹都可能成为人工智能“找到”你真实身份的线索时,你还会选择继续匿名发帖吗?如果匿名从一种安全的默认设置变成了不太安全的默认设置,那么对用户来说最安全的解决方案是大幅减少社交媒体的使用或定期删除他们的帖子,以防止历史痕迹被利用。参考文献:1.https://arxiv.org/pdf/2602.168002.https://arxiv.org/pdf/cs/06101053.https://arstechnica.com/security/2026/03/llms-can-unmask-pseudonymous-users-at-scale-accuracy/操作/排版:何晨龙
特别提示:以上内容(包括图片、视频,如有)由自有媒体平台“网易账号”用户上传发布。本平台仅提供信息存储服务。
注:以上内容(包括图片和视频,如有)由网易号社交媒体平台用户上传并发布。提供信息存储服务。