2023年6月3日,近日AI造假在学术界、新闻界的问题越来越多,来自华为诺亚方舟实验室和北京大学的研究者,提出了一种可识别ChatGPT造假的可靠文本检测器,可以根据文本的特性,识别出该段文字是否由AI生成,可以有效打击AI生成假新闻、AI在学术造假上的问题,防止AI生成内容滥用!
ChatGPT
伴随着ChatGPT的推出,以及GPT-4的史诗级升级,AI生成在很多领域带来了强大的生产力,比如MidJourney和Stable Diffusion在AI绘画方面的应用,以及ChatGPT在文本生成方面的广泛应用!
在短短半年内,ChatGPT的发展,推动了GPT大语言模型与实际应用的结合,但是在很多领域,AI带来了很多从前意想不到的问题,比较出圈的例子是前几天的热搜,福州市某科技公司10分钟内被骗430万元。
利用深度学习、虚拟现实等生成合成类算法的AI换脸技术,制作图像、音频、视频等信息,模拟出该公司老板的好友,最终骗子成功通过智能AI换脸和拟声技术佯装好友对他实施了诈骗。
ChatGPT造假
官方发布警告,ChatGPT类的AI造假,正在大面积爆发,国外一位30年工作经验的资深律师也被坑,他在辩护的时候引用了ChatGPT搜集的6个案例,结果被发现这些案例全是子虚乌有,律师只能承认自己没有核实信息并为此道歉,眼下面临处罚!
尽管大模型极大地解放了职场人的双手,提高了生产力,但是如果先进技术用被不法分子利用,也会有潜在的危害,还有像律师这样因为粗心大意被AI蒙骗,所以对AI生成语料的可靠性识别,也会成为重中之重!
来自北大、华为的研究者们提出了一种识别各式AIGC语料的可靠文本检测器,根据长短文本的不同特性,通过对检测器训练过程的改进,在同等条件下能对长短ChatGPT语料的检测能力,进行了极大的提升。
AI检测器
随着大语言模型的生成效果越发逼真,各行各业迫切需要一款可靠的 AI 生成文本检测器,学术界需要对论文进行学术检测,社交平台各类假新闻假信息,也需要大量检测,不过目前许多检测器并不通用,对短文本语料检测能力很差!
针对这一痛点,华为和北大的科研人员首先观察大量AIGC的短文本语料,这些语料难以检测主要是因为人类也可能使用这些简短的词,针对这个问题,研究人员将人类 / AI 的二分类检测部分转化为了一个部分 PU(Positive-Unlabeled)学习问题。
如果是人类语言则是Positive,ChatGPT则是Unlabeled,从而对训练中的损失函数进行改进,在队多个AIGC文本数据集上测试,该检测器超越了OpenAI和DetectGPT等算法,预计未来可集成到手机和应用上,防止用户被AI生成语料欺骗,对AIGC内容进行更好地管控!
👍