基于支持向量机的笔迹心理自动分析

2015-04-15 06:26曹贺
软件导刊 2015年3期
关键词:笔迹特征支持向量机

曹贺

摘要:笔迹心理学是根据笔迹来分析书写者性格特点的一门科学,已经发展为应用心理学的一个分支,应用领域非常广泛。当前笔迹心理分析方法主要有两种:一是笔迹学专家根据实践经验,结合应用心理学来分析;二是通过性格量表问卷调查,结合笔迹样本分析。前者以经验主观判断,准确率得不到保证;而结合调查问卷法分析笔迹特征,效率不高。提出一种基于支持向量机的机器学习方法,能够自动分析笔迹,有效解决以上问题。

关键词:笔迹心理学;支持向量机;自动分析;笔迹特征

中图分类号:TP301

文献标识码:A 文章编号:1672-7800(2015)003-0032-02

0 引言

笔迹心理学是近年来国内外研究的热点,属于应用心理学的一种。它以笔迹特征为研究对象,分析书写者的心理和性格特点[1]。笔迹是人们书写活动的结果,书写的产生是客观世界的各种刺激作用于视觉、听觉,并由相应的传入神经传到中枢,然后经过大脑一系列的心理和生理综合分析,发出指令,再由相应的传出神经将指令传至手部,至此完成书写动作。由此可见,人类大脑是笔迹形成的物质基础,笔迹是人类大脑心理活动的结果。

通过笔迹来分析性格具有很高的准确率,而且应用领域很广泛[2]。在文化教育方面,可以通过一个人的笔迹,来分析其性格,通过对其性格缺陷进行有效指导,可以提高教育质量。在刑事办案方面,可以通过笔迹鉴别和分析来协助断案,降低办案难度,而且在侦查讯问中,可以通过笔迹分析嫌疑人的性格特点,有助于审问人员快速突破嫌疑人的心理防线。在心理学领域,可以通过笔迹分析一个人的心理活动,能够进行更好的心理治疗。

当前笔迹分析方法主要有两种:一是由笔迹学专家进行鉴定;二是通过性格量表调查问卷,结合笔迹样本进行分析。笔迹学专家虽然对笔迹的特征很了解,但主观因素占据主导作用,不能保证结果的准确率。通过调查问卷的方式,一方面需要对笔迹样本进行特征提取,还需要分析调查问卷的结果,虽然准确率很高,但时效性不强[3]。本文提出一种能够自动分析笔迹的方法,用调查问卷的方法得到样本,将这些样本用机器学习的方法进行训练学习,达到自动分析笔迹的目的。

1 相关技术

1.1 笔迹特征抽取

由于汉字的结构非常复杂,汉字笔迹特征也多种多样。笔迹特征之间有一定的相关性,比如行倾斜度和字倾斜度、横笔压和竖笔压。如果能够将有关联的笔迹特征进行概括,可方便研究和分析[4]。

本文选用因子分析法对笔迹特征进行整理。

因子分析是用少数几个因子描述许多指标或因素之间的联系,即将相关比较密切的几个变量归在同一类中,每一类变量就成为一个因子,以较少的因子反映原资料的大部分信息。本文笔迹特征的因子分析结果如表1所示,受篇幅限制,分析过程不作论述。

可以看出,根据笔迹特征和公因子的因子载荷(相关系数),可以将有明显因子载荷的特征概括为一类,如整篇压力、横笔压、竖笔压、粗细度与第一个公因子有明显的相关性,可将这4个特征概括为一类,定义为书写压力。利用这种方法,可以把以上特征概括为6个特征因子:书写压力、概貌、字的形态、页边、运笔和字行间距。

1.2 性格量表选取

当前大多笔迹分析在获取实验数据时都采用国外的性格量表,如EPQ、16PF、MMPI等。这些量表只能在一定程度上反映中国人的性格特点,并不是完全根据中国人的生活习惯和文化制定的[4]。所以选取这些性格量表并不合适。

北京大学心理学系的王登峰等[5]根据研究确定了一个中国人人格结构的七因素模型,并严格按照中国人性格特点编制了中国人人格量表(QZPS)。QZPS根据中国人人格结构的七因素模型把性格划分了7个维度,每一个维度都由不同因素构成,较全面地概括了中国人的人格特点。本文选取该量表获取相关实验数据。

1.3 支持向量机分类原理

支持向量机在解决小样本、非线性和高维模式识别中具有许多优势,非常符合小样本、非线性和高维度的特点,选用支持向量机来进行分类得到的结果精确度较高[6]。

支持向量机将向量映射到一个更高维的空间里,在这个空间里建立有一个最大间隔超平面。在分开数据的超平面的两边建有两个互相平行的超平面。建立方向合适的分隔超平面使两个与之平行的超平面间的距离最大化,如图1所示。平行超平面间的距离或差距越大,分类器的总误差越小。

径向基函数的作用是接受两个低维空间里的向量,计算出经过某个变换后在高维空间里的向量内积值。只要找到了这个内积值,也即找图1中的超平面,完成分类。

2 试验设计及结果

2.1 试验设计

(1)试验选取40名大学生,采用CintiQ工具(一种电脑作图工具,可以实时记录笔压、笔速、坐标等,方便笔迹特征选取)获取他们的笔迹样本。因为有些笔迹特征需要在纸质笔迹上进行获取,所以实验对象还要在统一的A4纸上,用统一的书写笔写一份样本。书写内容尽可能包含汉字的各结构字体。

(2)获得笔迹样本后,安排试验人员填写QZPS问卷(中国人人格量表)。将每个同学的笔迹样本和调查问卷进行准确匹配。

2.2 试验结果

根据笔迹样本获取笔迹特征,结合QZPS结果得到书写者的性格特点,并作相关性分析,得到初步样本数据,将三分之二样本数据结合QZPS得到心理分析结果,作为输入来学习分类系统,余下三分之一的数据对结果进行检测。准确率达到90.3%,高于利用人工神经网络方法[7]。

3 结语

本文在笔迹心理学有关研究的基础上,基于支持向量机,提出一种可以自动对笔迹特征和心理进行分析的方法,能有效解决当前笔迹分析效率低、准确率不高的问题。

参考文献:

[1] ABDUL RAHIMAN M,DIANA VARGHESE,MANOJ KUMAR G. Habit:handwritten analysis based individualistic traits prediction[J].International Journal of Image ,2013(2):209-217.

[2] 江勇.笔迹和人格的关系[D].上海:华东师范大学,2008.

[3] N M OGHARREBAN, SHAHRAM RAHIMI,M SABHARWAL. A combined crisp and fuzzy approach for handwriting analysis[J].Department of Computer Science,2004(6):351-356.

[4] CHAMPA H N, K R ANANDAKUMAR. Automated human behavior prediction through handwriting analysis[J].First International Conference on Integrated Intelligent Computing,2010(10):160-165.

[5] 王登峰,崔红.中国人人格量表(QZPS)的编制过程与初步结果[J].心理学报,2003(1):127-136.

[6] SHITALA PRASAD, VIVEK KUMAR SINGH, AKSHAY SAPRE. Handwriting analysis based on segmentation method for prediction of human personality using support vector machine[J].International Journal of Computer Applications,2010(8):25-29.

[7] CHAMPA H N,K R ANANDAKUMAR. Artificial neural network for human behavior prediction through handwriting analysis[J].International Journal of Computer Applications,2010(2):36-41.

(责任编辑:陈福时)

猜你喜欢
笔迹特征支持向量机
浅析POS机数字手写签名笔迹
阿拉伯数字笔迹鉴定之探究
基于改进支持向量机的船舶纵摇预报模型
基于SVM的烟草销售量预测
动态场景中的视觉目标识别方法分析
论提高装备故障预测准确度的方法途径
基于熵技术的公共事业费最优组合预测
基于支持向量机的金融数据分析研究
初学者在笔迹检验中应注意的问题
浅谈签名笔迹的检验要点