网络匿名时代眼看就要到头了,大语言模型正在让去匿名化变得更加容易和普遍。要是不采取更强的保护措施,网络

网络匿名时代眼看就要到头了。IT之家收到消息,外媒 Futurism 今天刊出的一篇报道指出,苏黎世联邦理工学院和 Anthropic 的研究人员搞出了一项新技术:AI 大模型可以仅凭用户在论坛上的发言和个人资料,就能在约 7% 的情况下识别出匿名者的真实身份。这其实跟《黑镜》里的剧情越来越像。 这种威胁模型一旦成立,对用户来说可不是闹着玩的。LinkedIn 上的工作经历、论坛的评论记录甚至日常调查问卷,都有可能被 AI 扒拉出蛛丝马迹。这已经不是一个需要黑客动手的活儿了。 此前人们普遍觉得匿名保护很靠谱,认为要找到背后的人得付出极高成本。可现在一切都变了。研究人员先把 Hacker News 上的帖子跟 LinkedIn 账号对上了号,然后故意删掉所有身份信息,搞了个匿名化的数据集。用这些数据训练出来的模型特别厉害,居然能自动找到帖子对应的真实作者。 论文作者之一、苏黎世联邦理工学院的 AI 工程师西蒙 · 勒尔门直言不讳:“我们研究发现,过去那种靠‘现实中的模糊性’来保护隐私的做法已经不管用了。”这个“现实中的模糊性”指的就是大家以为的那种神秘感。 这种能力不仅在论坛数据上管用,在 LinkedIn 资料或者匿名采访记录里也同样好使。只要让模型多分析几个人的聊天记录,哪怕是日常的 AI 使用情况调查问卷,它都能在大约 7% 的情况下准确指出具体是哪个用户。 而且准确率还不低。勒尔门还特意举了个例子:“这些智能体简直太厉害了。就算只给它们看一段匿名采访记录这种自由文本的内容,它们也能一步步推断出一个人的完整身份。” 除了 Reddit 电影社区里的讨论能被高精度锁定外,研究团队也承认实验存在样本量小的限制。但这已经足够说明一个问题:大语言模型正在让去匿名化变得更加容易和普遍。 要是不采取更强的保护措施,网络匿名很可能要终结。论文最后提醒道:“用户、平台还有政策制定者必须明白,支撑现在互联网的隐私假设已经不再成立了。”