申泽波
(广东警官学院 刑事技术系, 广东 广州 510232)
书写者姓名与笔顺的关系
申泽波
(广东警官学院 刑事技术系, 广东 广州 510232)
收集601份有效笔迹样本,研究了书写者姓名模式与笔顺的相关性。被试姓名分为不含左阜右邑(阝)、含左耳旁、含右耳旁3类,男性姓名模式与左耳旁笔顺显著相关(p<0.01),姓名不含左阜右邑的男性对左耳旁非规范笔顺的使用率23.9%,95%置信区间[19.4%,28.4%],姓名含右耳旁的男性的使用率2.7%,95%置信区间[0,7.9%],姓名含左耳旁的男性的使用率2.2%,95%置信区间[0,6.4%]。左耳旁与右耳旁笔顺具有很高的一致性。书写者在姓名部件上比一般人更多地使用规范笔顺。姓名与笔顺的相关关系是姓名识别的科学基础。
文件检验;姓名识别;笔顺;左阜右邑
人的姓名中的字是与自己关系最密切的汉字,这种独特的关系会不会影响人对这些字笔顺的使用?汉字由部件构成[1],姓名中的部件出现在很多字中。与一般人相比,书写者在姓名上更多地使用规范笔顺,还是非规范笔顺?笔顺如果存在姓名效应,就可以通过笔迹中的笔顺来识别书写者的姓名。目前,没有文献报道姓名与笔迹的关系。
研究假设书写者在姓名部件上比一般人更多地使用规范笔顺,并在左耳旁上证实了这一假设。左耳旁是一个部件,部件在文中有时也称作字。
被试为广东省一所高校的601名本科生,男生422名,女生179名,生源地均为广东。其中,593名被试以班级为单位参加实验,8名男性被试从班级中挑选出来参加实验,他们的姓名含左阜右邑。
笔迹样本由试抄写一篇短文形成,短文用投影仪显示,被试用黑色中性笔和横栏书写纸书写。不同阶段的实验使用过4篇短文,均有大约200个汉字。4篇短文有3~4个含左耳旁的字,2篇短文有3~4个含右耳旁的字。左耳旁、右耳旁各取2个样本字,出现缺字、错字或别字的,余字递补。实验使用过的含左耳旁的字为随、限、阳、阴、阵、陈,含右耳旁的字为都、郭、邻、那。共收回601份笔迹样本,有效样本601份,其中,出现右耳旁的样本153份。笔顺数据由被试报告,以笔顺识别控制数据质量。被试报告的笔顺与研究者用专门方法识别的笔顺不一致的[2],被试书写目标字后重新报告笔顺。被试在笔迹样本上写下了自己的姓名。
卡方检验确定相关性,相对风险度量相关程度,Kappa一致性系数度量一致性程度,Kappa系数最大值为1,最小值为-1。
(一)左耳旁和右耳旁的笔顺
阜作左偏旁简写为左耳旁,邑作右偏旁简写为右耳旁[3]。左耳旁和右耳旁字形相同(阝),合称为左阜右邑。阜、邑的字义都与地理有关,古地名字常以左阜右邑为偏旁。古人以地为氏,以国为氏,这样阜、邑作偏旁的姓氏就比较多,如陈、郭、邓、郑等。
偏旁和部件是不同的概念。偏旁是从造字法上说的,是组成合体字的单位,如陪字左为形旁,右为声旁。部件是构成汉字的不可分拆的单元[1],如陪字有阝、立、口3个部件。
1997年发布的《现代汉语通用字笔顺规范》规定了左阜右邑的规范笔顺。
左阜右邑由横撇弯钩(简称折)、竖构成,有2个笔顺,折竖为规范笔顺,竖折为非规范笔顺。
我们把左耳旁、右耳旁分开研究。对于左耳旁或右耳旁是双笔顺的样本,规定这个位置的笔顺与另一个位置相同。不包括按姓名选择的8名被试,统计左耳旁与右耳旁笔顺的交叉样本频数,形成列联表,如表1。
表1 左耳旁与右耳旁笔顺列联表
对表1中的数据进行卡方检验。原假设为书写者的左耳旁笔顺与右耳旁笔顺无关,显著性水平0.01。卡方值为120.20,p<0.001,由于p<0.05,拒绝了原假设,书写者的左耳旁笔顺与右耳旁笔顺显著相关。
左耳旁与右耳旁笔顺不一致的样本有3份,占全部样本的2.1%,95%置信区间[0,4.3%]。笔顺不一致样本比例没有消除随机一致性的影响,不能在不同字之间比较。为此,我们采用Kappa一致性检验,左耳旁与右耳旁笔顺的Kappa一致性系数0.933。笔顺不一致的3名被试姓氏里都有左阜右邑,其中,一名被试姓氏有左耳旁,其左耳旁为规范笔顺,2名被试姓氏有右耳旁,其右耳旁为规范笔顺。
左耳旁与右耳旁笔顺有很高的一致性,姓名可能是造成笔顺不一致的重要原因。
(二)左阜右邑笔顺与性别的关系
有3份样本2个左耳旁笔顺不一致,没有右耳旁笔顺不一致的样本,这说明左耳旁、右耳旁的笔顺都有良好的稳定性。为了便于分析,将2个样本字笔顺不一致的样本归入规范笔顺样本。
研究性别时,不包括8名按姓名挑选的男性被试。统计被试性别与左耳旁笔顺的交叉样本频数,形成列联表,如表2。
表2 性别与左耳旁笔顺列联表
对表2中的数据进行卡方检验。原假设为书写者的性别与左耳旁笔顺无关,显著性水平0.05。卡方值为10.31,p值为0.001,由于p<0.05,拒绝了原假设,书写者的性别与左耳旁笔顺显著相关。
男性对左耳旁竖折的使用率为20.0%,95%置信区间[16.2%,23.9%],女性使用率为8.9%,95%置信区间[4.7%,13.1%]。男性对左耳旁竖折的使用率显著高于女性。
统计被试性别与右耳旁笔顺的交叉样本频数,形成列联表,如表3。
对表3中的数据进行卡方检验。原假设为书写者的性别与右耳旁笔顺无关,显著性水平0.05。卡方值为6.87,p值为0.009,由于p<0.05,拒绝了原假设,书写者的性别与右耳旁笔顺显著相关。
表3 性别与右耳旁笔顺列联表
男性对右耳旁竖折的使用率为31.9%,95%置信区间[18.6%,45.2%],女性使用率为12.2%,95%置信区间[5.7%,18.7%]。男性对右耳旁竖折的使用率显著高于女性。
(三)姓名与左耳旁笔顺的关系
右耳旁样本较少,只检验姓名与左耳旁笔顺的关系。把被试的姓名分为3类:不含左阜右邑、含左耳旁、含右耳旁。统计男性被试的姓名模式与左耳旁笔顺的交叉样本频数,形成列联表,如表4。
表4 男性姓名模式与左耳旁笔顺列联表
对表4中的数据进行卡方检验。原假设为男性的姓名模式与左耳旁笔顺无关,显著性水平0.01。卡方值19.48,p<0.001,由于p<0.01,拒绝了原假设,男性的姓名模式与左耳旁笔顺显著相关。
对于左耳旁竖折,左耳旁姓名的男性使用率为2.2%,95%置信区间[0,6.4%],右耳旁姓名的男性使用率为2.7%,95%置信区间[0,7.9%],姓名不含左阜右邑的男性使用率为23.9%,95%置信区间[19.4%,28.4%]。
含左耳旁姓名和含右耳旁姓名的男性对左耳旁笔顺的使用基本相同,把含左耳旁和含右耳旁的姓名合并,含左阜右邑的男性对左耳旁竖折的使用率为2.4%,95%置信区间[0,5.7%]。
笔顺对姓名模式的相对风险为姓名不含左阜右邑的人与含左阜右邑的人的笔顺使用率之比。男性左耳旁竖折对姓名的相对风险为9.96,95%置信区间[2.50,39.95],即姓名不含左阜右邑的男性对竖折的使用率是含左阜右邑的男性的9.96倍,95%置信区间[2.50,39.95]。
统计女性被试姓名模式与左耳旁笔顺的交叉样本频数,形成列联表,如表5。
表5 女性姓名模式与左耳旁笔顺列联表
女性样本数量少,不具备卡方检验的条件。
左阜右邑在被试姓名中的位置分布如表6所示。
表6 左阜右邑在被试姓名中的位置分布
左阜右邑主要出现在被试姓氏上,含左耳旁的被试姓氏为陈、欧阳、陆、陀,含右耳旁的为郭、邓、郑、邹、邝、邱、邢、祁。被试名中含左阜右邑的字为阳、隆、邻、娜。
根据2010年第六次全国人口普查数据,陈姓占全国人口的4.26%,在全部姓氏中排第5位,郭姓占全国人口的1.09%,排第16位,郑、邓排在前30位,陆、邹、邱、陶、郝、邵排在前100位[4]。含左阜右邑的姓氏人口合计占全国人口的10%左右。
姓氏分布具有明显的地域性。广东含左阜右邑的姓氏较为集中,其中,陈姓超过广东户籍人口的10%,郑、邓、邱、邝、阮、欧阳等姓氏人口比例也高于全国。被试生源地均为广东,代表了左阜右邑姓氏在广东户籍人口中的分布。不包括按姓名选择的8名被试,左阜右邑姓氏被试占全部被试的17.5%,95%置信区间[14.5%,20.6%]。
名用字有较强的时代性,被试不能代表左阜右邑在总体人群的名用字中的分布情况,阳、娜等字在总体人群中的使用率比被试高。
研究证实书写者在姓名部件上比一般人更多地使用规范笔顺。书写者把姓名当作自己的一个属性,希望书写的姓名能得到他人的认可,因此比一般人更多地使用规范笔顺。这个效应称作姓名的社会认可效应。
根据认可效应,姓名含左阜右邑的书写者对左耳旁规范笔顺的使用率高于不含左阜右邑的书写者。男性被试的姓名模式与左耳旁笔顺显著相关(p<0.01),左耳旁竖折对姓名的相对风险为9.96,95%置信区间[2.50,39.95],即姓名不含左阜右邑的男性被试对竖折的使用率是含左阜右邑的男性被试的9.96倍,95%置信区间[2.50,39.95]。女性样本容量较小,没有检验姓名模式与左耳旁笔顺的关系。理论上,女性姓名也与左耳旁笔顺相关,由于女性对竖折的使用率低于男性,男女的笔顺形成机制也不完全相同[5],女性姓名模式与左耳旁笔顺的相关程度很可能低于男性。
左耳旁与右耳旁笔顺有很高的一致性,二者笔顺不一致的样本仅占2.1%,95%置信区间[0,4.3%],在左耳旁上得出的结论可以推广到右耳旁。书写者姓名可能是造成左耳旁与右耳旁笔顺不一致的重要因素。
左阜右邑主要出现在姓氏上,在被试名中出现较少,姓氏和名对认可效应的负载是否相同尚不明确。
笔顺由一定的书写机制形成,不同笔顺的形成机制不同[6-7]。左阜右邑竖折的形成机制目前还不是十分清楚,其他字的笔顺形成机制可能与左阜右邑不同,如,张字的部件长是草书楷化形成的。姓名认可效应普遍存在,形成机制不同的笔顺,认可效应的强度可能不一样。
姓名与笔迹的相关性为姓名识别提供了条件,姓名识别依据笔迹把书写人的姓名归入一个类中。基于认可效应,姓名识别主要依据部件的非规范笔顺。构成常用汉字的部件有500多个[1],大约10%有多个笔顺。大多数汉字有2个以上部件,部件在字中的位置对笔顺的影响很小[8]。很多案件笔迹都能出现一个或多个非规范笔顺。但如果一个部件在姓名中很少出现,如反犬旁,对姓名分类的意义就不大。一些姓名常用字中含有多笔顺部件,如,男性名中的韦(伟)、光(辉耀),女性名中女(娟婷)、竖心旁(怡)。根据生活经验估计,大约70%的中国人的姓名中有多笔顺部件,大约20%的人姓名中有2个以上这样的部件,如娜字有3个多笔顺部件。据此,可以对姓名进行有意义的分类。如果一个案件有多个嫌疑书写人,姓名识别发挥作用的机会就更大。
姓氏和一些名用字的分布具有较强的地域性,姓名识别的应用也具有地域特点。比如,陈姓是大陆南方的第一大姓,也是台湾、香港、澳门的第一大姓,在这些地区左阜右邑对姓名识别的意义更大。
姓名是人通行的身份标识,但在法庭科学中一直没有得到利用,姓名识别是个体识别的新方法。姓名识别基于汉字特有的复杂性,利用嫌疑书写人的姓名,成本极低。姓名识别与血型鉴定类似,不能高度可能性地认定书写人。
在刑事侦查中,姓名识别可用于划定侦查范围或确定嫌疑人的嫌疑程度,优化侦查过程。比如,有的村庄以一个或几个姓氏为主,姓名识别可用于判断本村人作案的可能性。在民事案件中,特别是在笔迹样本难以得到时,如有些遗嘱鉴定,姓名识别也可以提供重要的证据。
姓名识别与笔迹鉴定的原理不同,二者是相互独立的证据,可以互相印证。姓名识别不需要嫌疑人笔迹样本,但需要知道嫌疑人的姓名。姓名识别的分析是定量的,这是笔迹鉴定目前还不具备的优势。
姓名是人的“文字基因”。书写者希望自己书写的姓名得到社会的认可,在姓名部件上比一般人更多地使用规范笔顺。姓名的认可效应的强度可能因笔顺形成机制不同而不同。姓名识别是低成本的个体识别方法,可以用于很多刑事案件和民事案件。姓名识别是法庭科学的新领域,是中国独有的法庭科学技术。今后应当研究更多部件笔顺与姓名的相关关系,并从理论上探究在认可效应之外,姓名对笔顺是否还存在别的影响。
[1]中华人民共和国教育部.现代常用字部件及部件名称规范[M].北京:语文出版社,1986.
[2]申泽波.左耳旁笔顺判断方法研究[J].广东公安科技,2009(4):18-20.
[3]谷衍奎.汉字源流字典[M].北京:华夏出版社,2003.
[4]武 洁,杨建春.张、王、李、赵谁最多[J].中国统计,2014(6):21-22.
[5]申泽波.性别与笔顺的关系[J].辽宁警察学院学报,2016,18(4):60-63.
[6]申泽波.书写方向对笔顺和笔径的影响[J].政法学刊,2014,31(3):117-119.
[7]申泽波.同笔组合对笔顺的影响研究[J].新疆警察学院学报,2016,36(01):36-38.
[8]申泽波.部件位置对笔顺的影响[J].辽宁警察学院学报,2015,17(05):62-65.
(责任编辑:李 刚)
Relation between Writer’s Name and Strokes Sequence
SHEN Ze-bo
(Department of Forensic Science, Guangdong Police College, Guangzhou Guangdong 510232, China)
To establish an approach of recognizing name pattern of the writer through his strokes sequence. After 601 valid handwriting samples were collected, and name patterns were sorted into 3 categories: containing no character component “阝”, containing component “阝” left or containing component “阝” right, association between name pattern and strokes sequence of “阝” was statistically tested. The strokes sequence of “阝” was in association with male name pattern significantly (p<0.01). When component “阝” left in non-normative strokes sequence, male with name containing no “阝” has a using rate of 23.9%, 95% CI [19.4%,28.4%], male with name containing “阝” right has a using rate of 2.7%, 95% CI [0,7.9%], and male with name containing “阝”left has a using rate of 2.2%, 95% CI [0,6.4%]. Writers are more likely to use normal strokes sequence when character components in their name in order to gain better social approval.
questioned document examination; name recognition; strokes sequence; Fu Yi left right
DF794.2
A
2096-0727(2017)02 -0064-05
2016-09-26
申泽波(1973-),男,山西平顺人,副教授,硕士。研究方向:文件检验。
广东警官学院教师创新团队(2015JSTD03)。