吾以ChatZero阻击ChatGPT,子如何应对?

2024-03-04 05:01:53胡澜
大学生 2024年2期
关键词:爱德华人工智能软件

胡澜

在過去的一年里,ChatGPT所代表的人工智能当之无愧地成为互联网顶流,无数人为之欢呼沸腾。同样激动的还有学生,因为他们发现写作业这件事可以交给ChatGPT代劳了!老师们却为此大感头疼,因为他们很难分辨出学生交上来的作业到底是辛苦劳作的结果,还是人工智能的敷衍。

就在这时,一个名叫爱德华(Edward Tian)的年轻人推出了一款反击ChatGPT的应用——“GPTZero”,它可以检测出文本的来源到底是人工智能还是真人所为。在这款新软件面前,看似无所不能的ChatGPT的踪迹变得无所遁形。而爱德华——这位来自普林斯顿大学的大四学生,也成为无数学生眼中“最可恶的人”。

向人工智能发起挑战

2022年11月,校园里,几乎所有人都在感叹ChatGPT的出色之处。当时的爱德华在惊喜之余,产生了一些担忧。

这种担忧与爱德华的研究方向和经历密切相关。爱德华在普林斯顿大学主修计算机科学专业,大学期间一直在研究ChatGPT的前身——GPT-3,这同样是由ChatGPT的母公司OpenAI研发的AI系统,不过由于技术还不够成熟,并不为众人所熟知。

而就在ChatGPT发布的这个秋季学期,爱德华正在普林斯顿大学的自然语言处理实验室研究如何对AI系统编写的文本做检测和判断。在研究中,爱德华深刻地认识到AI技术的一体两面:它既可以帮助人类更好更快地完成工作,也有可能由于过快的发展速度而失控。

爱德华同时还辅修了认知科学和新闻学,并且有过在BBC的实习经历,主要负责核实新闻的真实性。他还曾是开源情报网站Bellingcat的研究员,做过被微软收购的反恐初创公司Miburo Solutions的分析师。在这些公司,他的工作主要是监测虚假信息和对机器人进行检测。“所有的这些经历,都是我研发GPTZero的动力。”

于是爱德华用寒假的空闲时间编写了一个应用程序,并命名为“GPTZero”。这款软件的使用方法和ChatGPT一样简单:你只需要把文本信息复制粘贴到对话框里,点击即可开始评估。然后程序会根据文本的复杂性、创造性和可变性,打出一个分数,并给出分析结果:该信息是由AI编写,还是来自人类的创作。

2023年1月2日,爱德华在网上发布了GPTZero,正式向ChatGPT发起了挑战。

一夜火爆

爱德华没有想到,这款应用竟然一夜暴火。发布后的几个小时内,就有超过2000人测试了GPTZero初始版本。上线仅仅一天,GPTZero吸引了超过700万人观看,应用一度因为访问流量过大而陷入崩溃。

第二天早上,爱德华的手机被无数条短信、邮件、私信疯狂轰炸了。这些信息大多来自网友和记者以及他的同龄人。前者多是出于好奇而询问,后者中则有许多没有那么礼貌——许多在校生发私信来咒骂他,因为老师以后可以用这款应用发现他们的作业是从AI那儿抄来的。爱德华因此成为了“学生公敌”。

GPTZero发布之初,最直观的受益者就是学校和教师。他们终于有了帮手,可以帮助判定学生上交的文本中,AI是“零参与还是大量参与”。

或许是教师以及有类似困扰的用户的热情推动了GPTZero的暴火。1月5日,也就是GPTZero发布后的第三天,用户量达到了1万。一周之后,访问用户超过3万人,截至2023年5月,这个数字达到了120万。

爱德华对GPTZero的火爆感到震惊,但同时他也意识到了GPTZero的真正价值所在——它不仅是帮助教师识别学生作业真实性的帮手,更是人类思想和文明的护卫者。

爱德华很快就成为了风投界的红人,a16z、 Menlo Ventures 和 Red Swan 等知名风投纷纷朝他抛出橄榄枝。爱德华拿到了350万美元的种子资金,并创办了与软件同名的公司 GPTZero。

不过这些并没有让爱德华冲昏头脑,在面对投资者的时候他仍然保持着谨慎和冷静。他表示,GPTZero仍然是一款需要持续被开发的软件,并且为了保护他口中人类写作的“美好”,他目前没有收费的打算。

用AI对抗AI

打败ChatGPT听上去有些不可思议,GPTZero到底是怎么做到的?

一个有趣的事实是:爱德华使用了一个叫做GitHub CoPilot的软件来帮助自己编写GPTZero,而对这一软件提供支持的正是GPTZero的对手ChatGPT的前身——GPT-3。在GPT-3的帮助下,爱德华仅用了3天时间就搭建起了软件,足以说明AI在软件开发上的高效和强大。而打败这一强大的对手的方法,正是“以子之矛攻子之盾”。

GPTZero的原理其实很简单,就是用AI对抗AI。

GPTZero根据“困惑性”(Perplexity)和“突发性”(Burstiness)这两项指标来对文本进行打分,然后根据分数的统计学特征来判断文本是出自人类还是AI之手。所谓的“困惑性”是指语言的随机性,这一指标可以衡量词语使用的随机程度,以及词语的搭配方式是否让GPTZero感到困惑。而“突发性”则主要是衡量语句结构变化上的复杂度,如果文本较长,则还可以衡量每个句子在变化程度上的一致性。

之所以选择“困惑性”和“突发性”这两项指标作为判断标准,是因为人类和AI创作的文本在这两点上有很大的区别。人工智能生成文本的来源是既有的数据库,因此它生成的语句会较为恒定,特别是选词的可预测性更高;而人类创作的文本则没有这种可预测性,真人的想法总是更为随机和跳脱,容易出乎AI的“预料”,也更容易令AI感到“困惑”。

同理,人工智能更倾向于使用前后一致的结构来生成的句子和段落,句式较为相近,也较少出现前后复杂度相差很大的句子。而人类创作的句式则更为多样,前后的复杂程度也不一致,复杂的长句和简单的短句会在人类创作的文本中交错出现,这种文本结构参差不齐的“突发性”也就得以成为判别是否为人类创作的重要指标之一。

GPTZero对用户给出的文本进行“文字总困惑度”“所有句子的平均困惑度”“每个句子的困惑度”的计算,GPTZero越对这些文本感到“熟悉”,得出的结果数值就越低,越说明这段文本有可能是GPTZero的同类——AI生成的。相反,当这个分数大于85时,则说明词语的随机性和句子的困惑度令GPTZero感到“陌生”,更可能是人类的创作。从这种“以己为镜”的检测方法来看,把GPTZero说成是AI界的“卧底”也不为过。

GPTZero宣称对AI文本识别的准确率为85%,对人类文本的准确率则高达99%。在爱德华发布的一段演示视频中,他将《纽约客》一篇文章和ChatGPT在领英(LinkedIn)上发表的一篇文章放在GPTZero上进行检测,GPTZero成功地做出了正确的选择。

不过,GPTZero还不完美。正如测试期许多用户反馈的那样,GPTZero也会有搞混的时候。特别是对于那些经过人工编辑的AI文本,GPTZero暂时还不具备检测能力。于是,这给了那些对GPTZero的出现心生不满的人们一丝可乘之机。

永无止尽的攻防战

AI检测一经面世,反AI检测也如影随形般粉墨登场。GPTZero刚刚发布不久,就有人发现了软件在识别上的漏洞:只需要用西里尔字母替换掉英文字母,就可以把GPTZero骗过去。一个来自TikTok的用户为此专门写了一个程序,用来帮助一些心怀不滿的学生绕过GPTZero检测。

爱德华很快就修补了这个漏洞,但是这远远不够。在互联网这个没有硝烟的战场上,一场围绕着AI检测和反AI检测的攻防战开启了。

一个名叫Joseph Semrai的斯坦福大学学生开发了一款名为“WorkNinja”的应用,这款应用上有一个显眼的“Rephrase(修改措辞)”按键,如果你的文本被GPTZero判定为“AI生成”,你只需要把这段文本“Rephrase”一下,应用就会自动对文本进行同义词替换等改写工作,再生成的文本,就会被GPTZero识别为人类创作了。

还有人在推特上告诉学生们,只要在ChatGPT 生成文本的每个“e”之前插入一个零宽度空格,也可以把GPTZero糊弄过去。还有人利用写作润色工具QuillBot来修改自己的人工智能文本,同样也能起到改头换面的作用。

为了应对这些花招,爱德华不得不不停地更新补丁,但他也清楚,这绝非长久之计。迟早有一天,会有人像爱德华当初开发AI检测工具一样,开发出一款无懈可击的反AI检测软件。只要AI技术仍然存在,AI检测与反AI检测的攻防战就不会停止。

同样对GPTZero虎视眈眈的还有它的同行。GPTZero发布不到一个月,ChatGPT的母公司OpenAI就推出了自己的检测工具;2023年4月,论文查重网站Turnitin也推出了自己的AI检测器;还有号称是“最适合教育领域的AI内容检测器”Winston AI横空出世,据称准确率达到99.6%。

在强手如云的互联网领域,爱德华想要保证GPTZero在江湖上的一席之地,就必须不断地更新迭代,并且推出更贴合市场需求的产品。在由GPTZero掀起的AI检测浪潮中,爱德华意识到,比起判断学生的作业是否抄袭,或许告知用户文本的“可信度”是一个更具广阔前景的实用功能。

于是,2023年5月,GPTZero团队发布了一款名为“Origin”的插件,这款插件可以跟踪学生在浏览器和Word中的写作过程,然后生成一个覆盖整个写作周期的报告,用以向老师证明该文本是学生独立写作而成。

同时,爱德华也认识到,AI是无法被彻底打败的,唯一的出路是合作。他的团队正在开发一个叫做HumanPrint的新写作平台,这个平台可以检测出“含AI生成”段落,提示用户用自己的语言对这些段落进行重写,以达到改进文本的目的——用爱德华的话来说,这不是帮助用户逃避AI检测,而是“检测的自然延伸”。

责任编辑:陈思

猜你喜欢
爱德华人工智能软件
爱德华·马奈
幼儿100(2024年10期)2024-03-27 05:50:28
《剪刀手爱德华》(海报)
散文诗(2022年16期)2022-09-07 07:06:50
禅宗软件
英语文摘(2021年10期)2021-11-22 08:02:26
描绘孤独的画家——爱德华·霍普 下
软件对对碰
2019:人工智能
商界(2019年12期)2019-01-03 06:59:05
人工智能与就业
IT经理世界(2018年20期)2018-10-24 02:38:24
数读人工智能
小康(2017年16期)2017-06-07 09:00:59
下一幕,人工智能!
南风窗(2016年19期)2016-09-21 16:51:29
谈软件的破解与保护
精品(2015年9期)2015-01-23 01:36:01