2025年5月, 马里兰大学的Yize Cheng、Wenxiao Wang、Mazda Moayeri和Soheil Feizi在arXiv上发表了一篇创新性论文《DyePack: Provably Flagging Test Set Contamination in LLMs Using Backdoors》(arXiv:2505.23001v1)。这项研究提出了一个名为"DyePack"的框架,利用后门攻击技术来检测大型语言模型是否在训练过程中使用了基准测试的测试集,从而解决当前AI领域...