# 数据识别

大型语言模型可大规模精准识别匿名用户身份

一项最新研究显示,大型语言模型(LLMs)在识别网络匿名用户方面表现出惊人准确性,远超传统方法。研究人员使用Netflix数据集进行实验,将5000名真实用户与5000名干扰用户混合,再加入5000名仅存在于查询集中的干扰身份,测试LLM的识别能力。结果显示,LLM在低精确度下仍能实现非零召回率,且通过“搜索-推理-校准”三步法可将99%精确度下的召回率翻倍。相比之下,传统攻击方法在低精确度下几乎完全失效。研究团队警告,若技术持续进步,政府、企业或攻击者可能利用LLM大规模识别用户,用于监控、精准广告或个性化网络诈骗。研究建议平台加强API访问限制、检测自动化抓取、禁止批量数据导出,LL...

2026-03-03 21:04