# 数据识别

大型语言模型可大规模精准识别匿名用户身份

一项最新研究显示，大型语言模型（LLMs）在识别网络匿名用户方面表现出惊人准确性，远超传统方法。研究人员使用Netflix数据集进行实验，将5000名真实用户与5000名干扰用户混合，再加入5000名仅存在于查询集中的干扰身份，测试LLM的识别能力。结果显示，LLM在低精确度下仍能实现非零召回率，且通过“搜索-推理-校准”三步法可将99%精确度下的召回率翻倍。相比之下，传统攻击方法在低精确度下几乎完全失效。研究团队警告，若技术持续进步，政府、企业或攻击者可能利用LLM大规模识别用户，用于监控、精准广告或个性化网络诈骗。研究建议平台加强API访问限制、检测自动化抓取、禁止批量数据导出，LL...

2026-03-03 21:04