给文学作品做“亲子鉴定”

2020-01-14 01:45朱会鑫
青年文摘(彩版) 2020年15期
关键词:弗莱彻利八世亲子鉴定

朱会鑫

隨着科技的不断进步,A I已经可以给文学作品做“亲子鉴定”,进而判定其作者是谁了。

下面,我们就以利用A I判定英国著名戏剧文学《亨利八世》的作者是谁为例。与《红楼梦》究竟是谁写的一样,《亨利八世》也存在同样的问题。可以说,在长达一个世纪里,关于《亨利八世》作者是谁的争论一直没有停息,直到最近的一项研究才使这个问题的答案变得明朗起来。

布拉格捷克科学院的研究员普列查奇最近使用了机器学习技术来识别《亨利八世》的作者,并取得了具有说服力的结果。那么,究竟是如何利用AI判定《亨利八世》的作者呢?

简单地说,就是从词汇和节奏入手,辨别文本的来源。在了解作者的风格和常用的字词与样式后,再去辨别新作品中的文本习惯样式,以判定它是不是出自同一个作者。即通过算法模型对文本常用词、常用语句和节奏模式进行分析,使算法学会辨别相关作者的写作特征。

具体来说,就是先将剧本《亨利八世》细化到多个小场景,再使用支持向量机对《亨利八世》的各个场景进行归因分析和分类。其中,以500种最常见的节奏类型的频率,以及500个最常见单词的频率作为分类器的功能集。鉴于作者在不同时期可能出现的风格差异,普列查奇采用了同时期其他戏剧的场景(如《暴风雨》《科里奥拉纳斯》)作为训练样本,对于可能的作者也同样收集了训练样本。

最终,普列查奇收集了53个莎士比亚训练样本、90个弗莱彻训练样本和46个马辛格训练样本。为了估计模型的准确性,还通过交叉验证的方式进行了检验。完成训练学习后,在《亨利八世》的文本上运行该模型,最后结合词汇和多功能化的综合分析,确定哪些作者参与了剧本的写作,以及他们的具体贡献。

最后的结果证明,这是区分莎士比亚、弗莱彻和马辛格风格非常可靠的判据。尤其是使用常用词和常用节奏的组合模型,在三位作者的风格鉴定上,准确率高于96%。当模型应用于《亨利八世》的分析时,结果清楚地表明,莎士比亚和弗莱彻都参与其中,另一位传闻的剧作家马辛格在算法的层面上表明和剧本无关。

对于文学研究者和爱好者来说,利用A I对文学作品进行“亲子鉴定”,以破解名著的作者之谜,是一件很有价值的事情,同时也提供了一个数据维度的视角,去解决此类问题。

//摘自《知识窗》2020年第2期/

猜你喜欢
弗莱彻利八世亲子鉴定
屡屡残忍灭妻,王冠换金像背后是帝王的凄凉
生态翻译学视域下唐诗《送友人》之 弗莱彻英译研究
拒做亲子鉴定,承担不利后果
一堂美国高中的世界历史课
弗莱彻的“爱即公正”论述评
有趣的、“糟糕的”历史
亲子鉴定在法律诉讼中的应用
解读你不知道的亲子鉴定
谢幕的掌声
国王离婚案引发英国宗教改革