基于机器学习的中小学书法评价研究综述及展望

2021-09-10 07:22许兵

江苏教育·书法教育 2021年4期

【摘要】当下，中小学的书法评分方法是按照一定的鉴赏标准来设计评分要点的，由评阅专家进行主观评分。但是由于不同专家的个人喜好、审美不同，所以很难解决公平、公正的问题。在书法评分标准中，所设计的评分要点看起来很细致、具体，但实际进行评分操作时，那些描述精细的评分标准很难落实到具体的评分上。而且，不同的专家和教师评分结果参差不齐，评分标准悬殊较大。目前，机器学习，特别是深度学习在图像识别、自然语言处理等方面取得了较大的进展，只要有足够大的数据集，它们在图像分类方面的精确性非常高。机器学习，特别是深度学习图像分类法，为解决中小学书法作品分级评分提供了全新的思路和解决方案。

【关键词】书法评价;机器学习;数据集;深度学习

【中图分类号】G471 【文献标志码】B 【文章编号】1005-6009（2021）30-0017-05

【作者简介】许兵，江苏省盐城市日月路小学（江苏盐城，224005）党支部书记、校长，高级教师，江苏省语文特级教师。

基于机器学习的书法评价需要大量的数据和训练才能得以验证其评价结果的有效性。目前，国内外已有不少学者在文字识别领域取得了丰硕的研究成果，并很好地应用在了印刷体和部分手写体文字识别方面。但是，目前基于机器学习的书法评价体系方面的相关研究还非常少，尚处于起步阶段。国内只有湖北工业大学的邵荣堂、西安理工大学的张福成有了一些探索和研究。实践证明，基于机器学习的书法评价方法可以发现很多传统人工评价难以观察到的规律，有很强的实用价值和现实意义。本文系统地阐述国内外书法评价体系的现状以及基于机器学习的书法评价模型，还提出一种自建数据集的全新书法评价模型和后续研究的建议。

一、中小学书法评价体系研究综述

目前常见的书法评价体系研究主要可以分为定量研究、定性研究和机器学习研究三大类型。

1.定量研究。

定量研究中最常见的指标建构方法是因子分析法：因子分析法（或称因素分析、指数分析）是定量研究中得到最普遍应用的指标建构方法，它属于社会科学实证研究方法，一般通过统计学统计软件包SPSS等软件来完成计算，其操作相对简单、易学。因子分析法包括探索性因子分析和验证性因子分析两种进路。指标建构时所采用的因子分析法一般是前者。

因子分析的前提是获得大量资料，并通过“概念化”的操作，将其转换为可分析的数据。关于这一点，白谦慎曾多次提议中国书法家协会的研究人员利用投稿登记表进行一些基础性的实证研究。

因子分析的原理是将收集到的尽可能多的各项细分标准加以量化，通过计算机“巴雷特球形检验”等检验方法，看原始数据是否具备指标建构的可能性。检验之后进行统计，将分散的要素进行归纳整理，再进行坐标轴转换，最后利用人工判断对所归纳出来的各主要成分进行因子命名。

因子分析的优势，是由计算机对各类数据进行统计归纳，所建构出的因子逻辑性较强。但此方法比较简单，且仍需经过研究者的人工命名，最终结果又具有研究者的主观性。

2.定性研究。

德尔菲法是书法评价定性研究中普遍使用的指标建构方法。在这方面，海南师范大学的代晴做了较为深入的研究。建立一个学科教学评价体系是非常复杂的过程，需要综合教育学、心理学、统计学、数学，甚至哲学等多个学科的知识来完成。闭门造车、单一化的构建方法都无法探索出一套科学的、符合客观实际的教学评价体系。在此基础上，德尔菲法作为一种匿名式的、征询多轮专家意见的、具备集体经验判断的方法，近些年受到了教育界人士的关注，并逐渐被更多的教育工作者运用到教学评价体系中。德尔菲法是建立在一个结构化的收集和提取过程基础上的方法论，通过一系列问卷调查与意见反馈交叉获取到共识目标。

3.机器学习研究。

当前对于书法字的识别大多采用轮廓相似性以及骨架相似性的方法。吴媛等人提出的一种基于数学形态学的脱机手写体汉字识别方法，此方法识别率很高，但遇到检索数据量大的情况时速度会明显变慢。俞凯等人在此基础上又提出一种基于骨架相似性的书法字检索方法，在保证查全率与查准率的基础上，检索速率方面有显著的提升。但是此方法建立的特征数据库比较大，并不能满足系统的设计要求。之后，章夏芬等人提出根据样本字特征而进行动态变化的自适应匹配法，在效率没有改变的前提下，查全率与查准率都得到了一定的提升。此方法很大程度上解决了算法计算量大、耗时长、效率低的问题。

在识别样本完成之后，书法评价系统方面的研究同样复杂。目前，绝大多数采用的是将要评价的样本与标准书法作品进行相似度计算的方法。例如，湖北工业大学的邵荣堂首先进行计算书法练习作品样本中书法字的骨架與字帖中书法字骨架的相似度，骨架提取的算法采用本文中提出的一种基于Z-S 算法改进的单像素化处理算法，从而得到基于整体结构特征的相似度值;而后采用九宫格的形式对书法字骨架进行切分，将每一部分的骨架对比字帖书法字相同位置的骨架，利用Hu矩与皮尔逊相关系数对相似度进行计算，得到基于笔画形体特征的相似度值;最后利用书法字距离边框的值与整个书法字在边框中的布局来综合计算字体布局特征面的相似度值。整体评判的标准依据书法初级考试的标准制定。

但是以上方法都没有充分利用机器学习的优势，没有采集大量的数据、建立专用数据集，更没有用深度学习的方法训练系统，从而达到自动打分的目的。

二、书法识别与评价研究综述

1.手写汉字识别国内外研究现状。

德国的Taushek首次通过实验，利用光学模板匹配的方法获得了英文光学字符识别的专利，拉开了利用机器学习进行文字识别历史的帷幕。美国IBM公司的Casey和Nagy通过基于汉字结构的匹配法来进行印刷体汉字识别的研究，同时该方法得到了广泛的应用。Pittsburgh大学的Zobark提出利用汉字笔迹的方向特征来对在线汉字进行识别。麻省理工学院的Liu等人则提出通过汉字笔画来实现在线汉字识别。受到这些技术的启发，日本也着手开始了对汉字识别技术的研究。东芝公司率先生产出第一个印刷体汉字识别系统，其所能识别的汉字达2000个。

相较于其他国家，我国开始着手汉字识别的时间较晚。20世纪70年代末，我国才开始了汉字识别的研究。在汉字识别的起始阶段，我国实现的汉字识别效果并不是很理想，往往对于已完成训练的样本的识别准确率很高，但是以现实场景的实际文字来看，识别准确率仍然达不到预期，其缘由是因为在汉字识别的起始阶段，由于技术不成熟，我国汉字识别系统的抗干扰能力以及泛化能力并不是很强。随着我国对汉字识别技术的深入研究，部分产品已经在市场中受到广泛关注。沈阳自动化研究所与清华大学计算机系研发出了可以识别3755个印刷体汉字的技术。朱夏宁团队等提出了能够识别6763个印刷体汉字的识别方法。中科院自动化研究所也研制出了可用于一定人群的脱机手写汉字识别系统。随着我国汉字识别技术研究的不断深入，许多成熟的汉字识别系统也已在市场得到了广泛的应用，例如曙光OCR、清华文通、汉王OCR等。

2.书法评价国内外研究现状。

在基于机器学习的书法评价研究方面，万华林等人提出了比较图像几何形状的方法来比较两幅图像的相似度，并将其应用在了书法字几何形状的提取上。俞凯等提出了基于骨架相似性的书法检索方法。首先提取检索字与被检索字的骨架信息，然后计算检索字上每一点像素周围规定范围内与被检索字骨架上对应点的距离，最后通过两者骨架相似度进行选择。刘洋通过提取结构等特征的方法提取出了书法字的部分及整体布局，从而提取出了书家的特征点，并将此方法用于书法字真伪鉴别。简丽琼通过文字识别的方法进行区分书法字，该方法首先提取图像的Zemike矩和Hu矩，然后通过K近邻进行识别，该方法具有很强的鲁棒性。陈颉提出了一种分层的特征匹配法，该方法基于骨架结构相似性。首先通过分层模板获取二值图像的精细骨架，然后通过形状不变矩把相似图像放在一起，最后进行第二次检索，并根据相似度来显示同一汉字的不同字体。李牧采用欧式距离法计算骨架相似度。该方法首先寻找临摹字骨架图像上每个与原帖字骨架图像上距离最小的像素点，然后通过最小距离和来评价临摹作品。需要指出的是，该方法仅适用于结构简单的书法字体，对于结构复杂的汉字效果并不理想。

三、书法评价网络模型与训练研究综述

目前，常见的有两种进行书法评价的深度学习网络模型，一种是采用Keras搭建的卷积网络模型，另一种是曲延直等人采用的深度残差网络ResNet50模型。

1.卷积网络模型。

卷积神经网络作为深度学习在计算机视觉应用上的主要方法，研究价值与应用前景与日俱增。作为区别于全连接神经网络的多层神经网络，卷积神经网络具有更高的工作效率，在图像处理，特别是大图像处理方面有着较大的优势。

卷积网络模型主要由卷积、卷积核、池化、全连接层、损失函数、激活函数等构件组成。为达成不同目的，选择构建网络的组件往往不同，构筑的模型也不同。曲延直等人主要使用Keras框架进行卷积网络模型的训练与测试实验。Keras是用Python编写的开源人工神经网络库，它能够进行模块化的程序设计，同时还能够在此基础上进行扩充，具有简易性、快速性的特点。

2.深度残差网络ResNet50模型。

卷积神经网络能够提取不同级别的特征，网络层数越多，意味着能够提取到越丰富的不同级别的特征。但当深度卷积网络达到一定深度后，再单纯地增加层数并不能带来网络性能的提高，反而会导致网络收敛变得更慢，分类准确率也会变得更差。在2014年提出的 GoogleNet仅有14层，为保证在准确率较高的前提下增加网络层数，何凯明等4名来自微软研究院的华人在2015年提出了ResNet残差网络模型，该模型具有152层。这大大提升了网络层数的数量级，同时解决了增加網络深度带来的副作用，使通过单纯增加网络深度来提高网络性能的构想成为可能。

传统网络结构是将每层的输出直接传递给相邻的下一层，作为下一层的输入值。而ResNet网络结构通过改变映射方式，降低了拟合残差的难度。实验表明，残差网络更容易优化，并且能够通过增加相当的网络深度来提高准确率。

四、书法评价系统实现与展望

目前，云服务功能强大，市场主流的云服务供应商如AWS、阿里云和腾讯云都提供了功能强大的机器学习服务，如AWS的Machine Learning、阿里云的机器学习平台PAI和腾讯云的智能钛机器学习（如图1）。三者功能大同小异，都提供基于TensorFlow的机器学习服务。

以采用亚马逊AWS服务搭建基于机器学习的书法评分体系为例，将采集的书法图片和老师人工打分上传到在AWS虚拟主机，建立的专用数据集，选用适合的模型进行训练，将书法作品按结构、书写、篇幅三个方面，各项按一定的分值评分，并将该三个评分加权综合评分，给出最终评分结果，很好地解决了公平公正和评判速度等问题。AWS服务系统操作流程如下：

1.首先在AWS注册一个账号，需要填写Visa或者Mastercard信用卡信息。

购买一个合适的实例，运行TensorFlow（如图2）。

a.登录控制台。

b.在控制台首页，选择数据准备，再选择数据集管理。

c.在数据集管理页面，单击注册数据集。

3.电脑和AWS实例配置过程如下：

在电脑上端安装Python 3.5及以上的版本（TensorFlow从1.2开始支持 Python3.6，之前的版本官方是不支持的）。

4.导入文件实现训练。

导入文件，打开winscp使用公有DNS把文件放在home→ubuntu 这个文件夹里面，上传完毕以后，查看你第一次连接实例的时候刷出的环境信息，比如打开TensorFlow环境就用source activate tensorflow_p36。最后上传数据，进行训练即可。

这种基于机器学习的采用亚马逊AWS服务的书法评价系统有很好的实用价值。但由于其使用的样本总数偏少，导致算法不够完美，所以目前机器学习系统打分打出来的分数还不够准确，后续需要进一步完善。

【参考文献】

[1]张福成. 基于卷积神经网络的书法风格识别的研究[D].西安：西安理工大学，2018.

[2]郭鹏. 深度卷积神经网络及其在手写体汉字识别中的应用研究[D].成都：四川师范大学，2016.

[3]尹成娟. 基于深度学习的手写汉字集识别方法的研究[D].天津：天津科技大学，2019.

[4]邵荣堂. 基于机器学习的书法字识别与智能评判[D].武汉：湖北工业大学，2020.

[5]周润物，李智勇，陈少淼，等.面向大数据处理的并行优化抽样聚类K-means算法[J].计算机应用，2016，36（2）：311-315，329.

[6]王民，曾宝莹，要趁红，等.中国书法的特征提取及识别[J].信息通信，2015（7）：19-20.

[7]曲延直.基于深度学习的汉字书法识别研究[J].电子测试，2019（24）：44-46，61.