汉字输入法评测指标体系研究

2015-03-23 17:58
河南科技 2015年11期
关键词:码长码元输入法

祝 洁

(郑州航空工业管理学院,河南 郑州 450015)

在信息社会中,使用键盘输入汉字已经成为人们具备的基本技能之一。建立科学的汉字输入法评测指标体系,不仅可以帮助输入法的发明者和输入系统的设计人员修正和改进汉字输入法产品,而且有助于推广和应用符合规范的汉字输入法产品。

1 汉字输入法国家标准、规范简介

1.1《信息技术和数字键盘汉字输入通用要求》(GB/T18031-2000)

此标准规定了用数字键盘进行汉字输入的信息技术产品的通用要求。它适用于基于数字键盘设计的汉字输入法编码方案、汉字输入技术及其产品,是国家推荐标准。在规范性层面提出编码字符集应包括国家标准定义的全部字符,汉字笔画、笔顺、部件和字音应遵从汉字笔顺、部件规范和汉语拼音方案;在软件层面提出汉字输入平均码长、重码字词键选率等具体评测指标[1]。

1.2《信息技术通用键盘汉字输入通用要求》(GB/T18220-2003)

此标准规定了信息技术产品中用通用键盘进行汉字输入时的通用要求。它适用于基于通用键盘进行汉字输入的汉字输入法编码方案、汉字输入技术及其产品。标准中规定了通用键盘的键位设定、汉字编码字符集、编码规范和通用键盘汉字输入系统的性能指标,指标包括易学性、汉字输入平均码长和重码字词键选率。

1.3《识字教学用通用键盘汉字字形输入系统评测规则》(GF0017-2013)

它规定了识字教学通用键盘汉字字形输入系统的语言文字规范要求,以及码元、码元键位设置、码元映射规则和系统功能的基本要求,可作为相关部门、单位选用汉字输入系统的参考依据。

1.4 其他标准、规范

汉字编码字符集相关标准主要包括:GB2312-80《信息交换用汉字编码字符集基本集》、GB18030-2000《信息技术信息交换用汉字编码字符集基本集的扩充》等。相关语言文字规范主要包括:GF3001《信息处理GB13000.1字符汉字部件规范》等。

2 汉字输入法评测原则

2.1 科学性原则

汉字输入法评测的结果应能反映输入法的总体质量。主要体现在正确评测指标的选择,以及采用合理的评价方法等方面。评价必须有一定的理论基础,但是又必须以当前汉字输入法的实际情况为前提。

2.2 系统性原则

由于汉字输入法的数量众多且具有一定的复杂性,所以评测指标之间必须是相互联系、相互制约的具备层次性和系统性的整体。但是,在具体的评测活动中,每个指标又是相对独立的。

2.3 可操作性

评测指标体系必须是可操作的、可行的,具体指标的设计避免过于繁琐,要考虑到评测数据获取的难易程度和可靠性。

2.4 引导性

评测的目的是了解汉字输入法的质量情况,有助于质量较高的汉字输入法广泛应用和推广。因此,必须以输入法软件设计以及信息技术产品或单位选用汉字输入法产品提供依据为导向。

3 汉字输入法评测核心指标

3.1 易学性

汉字输入法的易学性是指初次学习和使用该输入法需要的时间、知识水平和智力水平[2]。每个用户的知识水平和知识结构都是不相同的,一个易用性强的输入法应该具有广泛的适应性,即使语言文字水平较低的用户不需要专门培训也能够快速地理解和掌握。

3.2 易用性

易用性强的输入法应该是功能性强且易理解和易操作的,能够使用户第一眼就能找到自己最关注的功能操作和字词信息。

首先,强大的词库管理功能。输入法应可以通过搜索引擎抓取大量词条、口语、专业词汇、方言俚语等,涵盖古今中外的古文、诗词歌赋、口语等,囊括政治、经济、科学、文化、体育等各个领域,形成词条丰富超大规模的词典。并且,词库能够根据用户输入的新的词条及时补充和更新;

其次,汉字输入的联想功能。汉字是音形义三者合一的统一体,输入法的联想功能多是以字义为基础,在用户输入一个字或词之后,罗列出多个可与该字或词组成词组的项目供用户选择。

再次,操作的简便性。在汉字输入的过程中,选择确定、删除编码、翻页查找、输入法状态切换等操作频繁进行。如果在输入过程中不简化这些操作,就会给用户带来额外的操作负荷,影响汉字输入的易操作性和速度。

3.3 快速性

快速性就是指输入汉字的速度,通常以一分钟输入的汉字数量来衡量。去除用户汉字输入时的个人因素,如击键速度、对输入法的熟悉程度等,影响汉字输入速度的指标主要有汉字输入平均码长和重码字词键选率。

3.3.1 汉字输入平均码长

汉字输入平均码长是在输入给定的测试样本时,测得的输入每个汉字的平均击键数。其计算公式为:平均码长=输入测试样本的击键次数/测试样本总字数(键/字)。计算码长时应当包括输入字词时的所有按键,如选择键、翻页键、状态切换键等,不能仅仅计算码本中字词编码所用的码元数。字词平均码长必须同其他因素结合才能正确地评价输入法的速度性能。这些因素包括码元的种类和数量、选择操作和联想操作的频繁程度、操作员的熟练程度、输入的持续时间等等。

3.3.2 重码字词键选率

两个或两个以上的编码相同造成重复称为重码,重码率越低越有助于用户快速选择输入。重码字词键选率是在输入给定的测试样本过程中,通过重码选择键确认的汉字字数与测试样本总字数的百分比。其计算公式为:重码字词键选率=重码选择键确认的字数/测试样本总字数*100%。音码输入法往往单字重码率较高,用户要根据提示行甚至翻页查找所输入的汉字和词组,非常影响汉字输入的速度。而形码输入法与音码输入法相比编码较为复杂,但是单字重码率较低,不需要观察提示行选择字词。用户记住拼写规则后,输入时基本可以实现盲打,输入速度较快。

3.4 规范性

汉字输入法是促进语言文字规范化的有力工具。因此,规范性是评测汉字输入法的重要标准。汉字编码和输入法要符合国家标准机构出台的输入法标准以及国家语言文字管理部门出台的有关规范。输入法的设计要采用规范化码元和规范的“兼容码”和词库,对自造词加以提示,在汉字输入时杜绝错别字和不规范用词等现象。

[1]李小庆,马晶莹,林民.汉字编码输入法评测分析[J].内蒙古师范大学学报,2009(4):17-21.

[2]周克兰,吕强,张玉华,等.试论汉字数字输入法评价[J].中文信息学报,2007(1):33-35.

猜你喜欢
码长码元输入法
基于信息矩阵估计的极化码参数盲识别算法
要命的输入法
基于ZYNQ的IRIG-B(DC)码设计与实现
LFM-BPSK复合调制参数快速估计及码元恢复
双路连续变量量子密钥分发协议的有限码长效应分析*
找回微软拼音输入法设置
输入法顺序听我使唤
环Fq[v]/上循环码的迹码与子环子码
基于极大似然准则的短猝发信号盲解调
百度被诉侵犯商标权和不正当竞争