华为&北大：识别ChatGPT造假，AI打假检测器来了

2023年6月3日，近日AI造假在学术界、新闻界的问题越来越多，来自华为诺亚方舟实验室和北京大学的研究者，提出了一种可识别ChatGPT造假的可靠文本检测器，可以根据文本的特性，识别出该段文字是否由AI生成，可以有效打击AI生成假新闻、AI在学术造假上的问题，防止AI生成内容滥用！

ChatGPT
伴随着ChatGPT的推出，以及GPT-4的史诗级升级，AI生成在很多领域带来了强大的生产力，比如MidJourney和Stable Diffusion在AI绘画方面的应用，以及ChatGPT在文本生成方面的广泛应用！

在短短半年内，ChatGPT的发展，推动了GPT大语言模型与实际应用的结合，但是在很多领域，AI带来了很多从前意想不到的问题，比较出圈的例子是前几天的热搜，福州市某科技公司10分钟内被骗430万元。

利用深度学习、虚拟现实等生成合成类算法的AI换脸技术，制作图像、音频、视频等信息，模拟出该公司老板的好友，最终骗子成功通过智能AI换脸和拟声技术佯装好友对他实施了诈骗。

ChatGPT造假
官方发布警告，ChatGPT类的AI造假，正在大面积爆发，国外一位30年工作经验的资深律师也被坑，他在辩护的时候引用了ChatGPT搜集的6个案例，结果被发现这些案例全是子虚乌有，律师只能承认自己没有核实信息并为此道歉，眼下面临处罚！

尽管大模型极大地解放了职场人的双手，提高了生产力，但是如果先进技术用被不法分子利用，也会有潜在的危害，还有像律师这样因为粗心大意被AI蒙骗，所以对AI生成语料的可靠性识别，也会成为重中之重！

来自北大、华为的研究者们提出了一种识别各式AIGC语料的可靠文本检测器，根据长短文本的不同特性，通过对检测器训练过程的改进，在同等条件下能对长短ChatGPT语料的检测能力，进行了极大的提升。

AI检测器
随着大语言模型的生成效果越发逼真，各行各业迫切需要一款可靠的 AI 生成文本检测器，学术界需要对论文进行学术检测，社交平台各类假新闻假信息，也需要大量检测，不过目前许多检测器并不通用，对短文本语料检测能力很差！

针对这一痛点，华为和北大的科研人员首先观察大量AIGC的短文本语料，这些语料难以检测主要是因为人类也可能使用这些简短的词，针对这个问题，研究人员将人类 / AI 的二分类检测部分转化为了一个部分 PU（Positive-Unlabeled）学习问题。

如果是人类语言则是Positive，ChatGPT则是Unlabeled，从而对训练中的损失函数进行改进，在队多个AIGC文本数据集上测试，该检测器超越了OpenAI和DetectGPT等算法，预计未来可集成到手机和应用上，防止用户被AI生成语料欺骗，对AIGC内容进行更好地管控！

{{userData.name}}已认证