吾以ChatZero阻击ChatGPT，子如何应对？

2024-03-04 05:01:53胡澜

大学生 2024年2期

胡澜

在過去的一年里，ChatGPT所代表的人工智能当之无愧地成为互联网顶流，无数人为之欢呼沸腾。同样激动的还有学生，因为他们发现写作业这件事可以交给ChatGPT代劳了！老师们却为此大感头疼，因为他们很难分辨出学生交上来的作业到底是辛苦劳作的结果，还是人工智能的敷衍。

就在这时，一个名叫爱德华（Edward Tian）的年轻人推出了一款反击ChatGPT的应用——“GPTZero”，它可以检测出文本的来源到底是人工智能还是真人所为。在这款新软件面前，看似无所不能的ChatGPT的踪迹变得无所遁形。而爱德华——这位来自普林斯顿大学的大四学生，也成为无数学生眼中“最可恶的人”。

向人工智能发起挑战

2022年11月，校园里，几乎所有人都在感叹ChatGPT的出色之处。当时的爱德华在惊喜之余，产生了一些担忧。

这种担忧与爱德华的研究方向和经历密切相关。爱德华在普林斯顿大学主修计算机科学专业，大学期间一直在研究ChatGPT的前身——GPT-3，这同样是由ChatGPT的母公司OpenAI研发的AI系统，不过由于技术还不够成熟，并不为众人所熟知。

而就在ChatGPT发布的这个秋季学期，爱德华正在普林斯顿大学的自然语言处理实验室研究如何对AI系统编写的文本做检测和判断。在研究中，爱德华深刻地认识到AI技术的一体两面：它既可以帮助人类更好更快地完成工作，也有可能由于过快的发展速度而失控。

爱德华同时还辅修了认知科学和新闻学，并且有过在BBC的实习经历，主要负责核实新闻的真实性。他还曾是开源情报网站Bellingcat的研究员，做过被微软收购的反恐初创公司Miburo Solutions的分析师。在这些公司，他的工作主要是监测虚假信息和对机器人进行检测。“所有的这些经历，都是我研发GPTZero的动力。”

于是爱德华用寒假的空闲时间编写了一个应用程序，并命名为“GPTZero”。这款软件的使用方法和ChatGPT一样简单：你只需要把文本信息复制粘贴到对话框里，点击即可开始评估。然后程序会根据文本的复杂性、创造性和可变性，打出一个分数，并给出分析结果：该信息是由AI编写，还是来自人类的创作。

2023年1月2日，爱德华在网上发布了GPTZero，正式向ChatGPT发起了挑战。

一夜火爆

爱德华没有想到，这款应用竟然一夜暴火。发布后的几个小时内，就有超过2000人测试了GPTZero初始版本。上线仅仅一天，GPTZero吸引了超过700万人观看，应用一度因为访问流量过大而陷入崩溃。

第二天早上，爱德华的手机被无数条短信、邮件、私信疯狂轰炸了。这些信息大多来自网友和记者以及他的同龄人。前者多是出于好奇而询问，后者中则有许多没有那么礼貌——许多在校生发私信来咒骂他，因为老师以后可以用这款应用发现他们的作业是从AI那儿抄来的。爱德华因此成为了“学生公敌”。

GPTZero发布之初，最直观的受益者就是学校和教师。他们终于有了帮手，可以帮助判定学生上交的文本中，AI是“零参与还是大量参与”。

或许是教师以及有类似困扰的用户的热情推动了GPTZero的暴火。1月5日，也就是GPTZero发布后的第三天，用户量达到了1万。一周之后，访问用户超过3万人，截至2023年5月，这个数字达到了120万。

爱德华对GPTZero的火爆感到震惊，但同时他也意识到了GPTZero的真正价值所在——它不仅是帮助教师识别学生作业真实性的帮手，更是人类思想和文明的护卫者。

爱德华很快就成为了风投界的红人，a16z、 Menlo Ventures 和 Red Swan 等知名风投纷纷朝他抛出橄榄枝。爱德华拿到了350万美元的种子资金，并创办了与软件同名的公司 GPTZero。

不过这些并没有让爱德华冲昏头脑，在面对投资者的时候他仍然保持着谨慎和冷静。他表示，GPTZero仍然是一款需要持续被开发的软件，并且为了保护他口中人类写作的“美好”，他目前没有收费的打算。

用AI对抗AI

打败ChatGPT听上去有些不可思议，GPTZero到底是怎么做到的？

一个有趣的事实是：爱德华使用了一个叫做GitHub CoPilot的软件来帮助自己编写GPTZero，而对这一软件提供支持的正是GPTZero的对手ChatGPT的前身——GPT-3。在GPT-3的帮助下，爱德华仅用了3天时间就搭建起了软件，足以说明AI在软件开发上的高效和强大。而打败这一强大的对手的方法，正是“以子之矛攻子之盾”。

GPTZero的原理其实很简单，就是用AI对抗AI。

GPTZero根据“困惑性”（Perplexity）和“突发性”（Burstiness）这两项指标来对文本进行打分，然后根据分数的统计学特征来判断文本是出自人类还是AI之手。所谓的“困惑性”是指语言的随机性，这一指标可以衡量词语使用的随机程度，以及词语的搭配方式是否让GPTZero感到困惑。而“突发性”则主要是衡量语句结构变化上的复杂度，如果文本较长，则还可以衡量每个句子在变化程度上的一致性。

之所以选择“困惑性”和“突发性”这两项指标作为判断标准，是因为人类和AI创作的文本在这两点上有很大的区别。人工智能生成文本的来源是既有的数据库，因此它生成的语句会较为恒定，特别是选词的可预测性更高；而人类创作的文本则没有这种可预测性，真人的想法总是更为随机和跳脱，容易出乎AI的“预料”，也更容易令AI感到“困惑”。

同理，人工智能更倾向于使用前后一致的结构来生成的句子和段落，句式较为相近，也较少出现前后复杂度相差很大的句子。而人类创作的句式则更为多样，前后的复杂程度也不一致，复杂的长句和简单的短句会在人类创作的文本中交错出现，这种文本结构参差不齐的“突发性”也就得以成为判别是否为人类创作的重要指标之一。

GPTZero对用户给出的文本进行“文字总困惑度”“所有句子的平均困惑度”“每个句子的困惑度”的计算，GPTZero越对这些文本感到“熟悉”，得出的结果数值就越低，越说明这段文本有可能是GPTZero的同类——AI生成的。相反，当这个分数大于85时，则说明词语的随机性和句子的困惑度令GPTZero感到“陌生”，更可能是人类的创作。从这种“以己为镜”的检测方法来看，把GPTZero说成是AI界的“卧底”也不为过。

GPTZero宣称对AI文本识别的准确率为85%，对人类文本的准确率则高达99%。在爱德华发布的一段演示视频中，他将《纽约客》一篇文章和ChatGPT在领英（LinkedIn）上发表的一篇文章放在GPTZero上进行检测，GPTZero成功地做出了正确的选择。

不过，GPTZero还不完美。正如测试期许多用户反馈的那样，GPTZero也会有搞混的时候。特别是对于那些经过人工编辑的AI文本，GPTZero暂时还不具备检测能力。于是，这给了那些对GPTZero的出现心生不满的人们一丝可乘之机。

永无止尽的攻防战

AI检测一经面世，反AI检测也如影随形般粉墨登场。GPTZero刚刚发布不久，就有人发现了软件在识别上的漏洞：只需要用西里尔字母替换掉英文字母，就可以把GPTZero骗过去。一个来自TikTok的用户为此专门写了一个程序，用来帮助一些心怀不滿的学生绕过GPTZero检测。

爱德华很快就修补了这个漏洞，但是这远远不够。在互联网这个没有硝烟的战场上，一场围绕着AI检测和反AI检测的攻防战开启了。

一个名叫Joseph Semrai的斯坦福大学学生开发了一款名为“WorkNinja”的应用，这款应用上有一个显眼的“Rephrase（修改措辞）”按键，如果你的文本被GPTZero判定为“AI生成”，你只需要把这段文本“Rephrase”一下，应用就会自动对文本进行同义词替换等改写工作，再生成的文本，就会被GPTZero识别为人类创作了。

还有人在推特上告诉学生们，只要在ChatGPT 生成文本的每个“e”之前插入一个零宽度空格，也可以把GPTZero糊弄过去。还有人利用写作润色工具QuillBot来修改自己的人工智能文本，同样也能起到改头换面的作用。

为了应对这些花招，爱德华不得不不停地更新补丁，但他也清楚，这绝非长久之计。迟早有一天，会有人像爱德华当初开发AI检测工具一样，开发出一款无懈可击的反AI检测软件。只要AI技术仍然存在，AI检测与反AI检测的攻防战就不会停止。

同样对GPTZero虎视眈眈的还有它的同行。GPTZero发布不到一个月，ChatGPT的母公司OpenAI就推出了自己的检测工具；2023年4月，论文查重网站Turnitin也推出了自己的AI检测器；还有号称是“最适合教育领域的AI内容检测器”Winston AI横空出世，据称准确率达到99.6%。

在强手如云的互联网领域，爱德华想要保证GPTZero在江湖上的一席之地，就必须不断地更新迭代，并且推出更贴合市场需求的产品。在由GPTZero掀起的AI检测浪潮中，爱德华意识到，比起判断学生的作业是否抄袭，或许告知用户文本的“可信度”是一个更具广阔前景的实用功能。

于是，2023年5月，GPTZero团队发布了一款名为“Origin”的插件，这款插件可以跟踪学生在浏览器和Word中的写作过程，然后生成一个覆盖整个写作周期的报告，用以向老师证明该文本是学生独立写作而成。

同时，爱德华也认识到，AI是无法被彻底打败的，唯一的出路是合作。他的团队正在开发一个叫做HumanPrint的新写作平台，这个平台可以检测出“含AI生成”段落，提示用户用自己的语言对这些段落进行重写，以达到改进文本的目的——用爱德华的话来说，这不是帮助用户逃避AI检测，而是“检测的自然延伸”。

责任编辑：陈思