江 南,马 健,武丽丽,孙启松
(信息工程大学地理空间信息学院,河南 郑州 450052)
JIANGNan,MAJian,WULili,SUNQisong
面向自动推荐的表示方法规则的形式化表达研究
江南,马健,武丽丽,孙启松
(信息工程大学地理空间信息学院,河南 郑州 450052)
TheFormalizationExpressionofRepresentationMethodRulesOrientedtoAutomaticRecommendation
JIANGNan,MAJian,WULili,SUNQisong
摘要:在利用专题制图软件制作统计专题地图时,普通用户由于没有表示方法知识,无法选择合适的表示方法表达专题要素。为了解决这一问题,本文将表示方法规则嵌入到制图软件中,深入研究了面向自动推荐的表示方法规则的形式化表达策略。先后介绍了表示方法规则的特征、表示方法简单规则和组合规则的形式化表达策略、表示方法规则的运行机制,最后进行了可用性试验,说明该形式化表达策略具有一定的理论和应用价值。
引文格式: 江南,马健,武丽丽,等. 面向自动推荐的表示方法规则的形式化表达研究[J].测绘通报,2015(9):36-38.DOI:10.13474/j.cnki.11-2246.2015.0273
关键词:自动推荐;表示方法规则;形式化表达;运行机制;可用性试验
中图分类号:P208
文献标识码:B
文章编号:0494-0911(2015)09-0036-03
收稿日期:2014-09-22
基金项目:国家自然科学基金(41271450)
作者简介:江南(1964—),女,教授,主要研究方向为专题地图研究。E-mail: 907502746@qq.com
一、引言
随着统计专题制图进入制图大众化时代,各种形式的专题制图软件涌现出来,网络的普及更是让没有专业制图知识的普通用户在网上能够方便地利用软件制作统计专题地图,但效果却不理想。通过将普通用户与专业制图者的地图作品进行对比发现,表示方法的选择与地图表达效果有重要的关系。专题地图表示方法是表示统计专题地图中专题要素及其各方面特征的相对稳定的图形组合方式[1]。表示方法的选择直接影响着地图信息传输的有效性。如果制图软件能够自动推荐合适的表示方法,会提高普通用户选择表示方法的合理性。但根据专家制图经验总结的表示方法知识尚不能直接移植到制图软件中,必须将表示方法知识进行有效的形式化表达。国内学者对表示方法自动推荐的研究[2-4]由于普遍忽略了表示方法的形式化表达问题,因而不是非常实用。综上,本文对表示方法规则的形式化表达方法展开系列研究。
本文首先对面向自动推荐的表示方法规则的特征进行了深入研究,在此基础上分别对表示方法规则的表达进行了详细介绍,继而以实例说明了其运行机制,并进行了可用性试验,说明本文的形式化表达策略具有一定的理论和应用价值。
二、面向自动推荐的表示方法规则特征研究
表示方法规则的研究是将其形式化表达的前提,也是实现统计专题制图表示方法自动推荐的基础。概括来说,面向自动推荐的表示方法规则有如下特点[5-6]:
1) 表示方法规则是“条件—结论”形式,规则条件与专题要素特征有关。由于表示方法规则内容的大体形式为在某种情况下选择何种表示方法,因此其描述方法是一种“条件—结论”形式。表示方法规则条件与专题要素特征有关,专题要素的特征决定了选择何种表示方法,具体可分为要素类型、要素间关系和要素数据差异度3个方面:
a. 要素类型包括单要素、复合要素和多要素。单要素是指与其他要素无相关关系的单个专题要素,又可分为数值型单要素和字符型单要素两种;复合要素是指含有某种相关关系的多个专题要素的组合;多要素是指包括多个单要素或复合要素的一组专题要素。记录表示方法能够表达的要素类型,就可以根据具体的要素类型筛选出部分表示方法。
b. 要素关系是针对复合要素的特征属性,具体可分为结构关系、时序关系、对比关系、方向关系4类[7]。记录表示方法能够表达的复合要素具体的关系类型,可作为进一步推荐合适的表示方法的依据。
c. 要素数据差异度是针对数值型单要素的特征属性。数据的差异度是一组数据的最大值与最小值的相对差距。根据差异度的大小可以分为差异度大、差异度适中、差异度小3种情况。记录表示方法能够表达的数值型单要素的具体的差异度,也可作为进一步推荐合适的表示方法的依据。
此外还需要特别指出,对于点状要素只能采用点状符号表示方法进行表达,而对于面状要素,不仅可以采用面状符号表示方法,也可采用点状符号表示方法进行表达。
2) 表示方法规则结论可采用两种推荐级别。表示方法的使用较为灵活,对于一组专题要素可能采用多种表示方法进行表达,也可用多个表示方法组合表达,但表达效果却有不同。本文将推荐的表示方法以较优和可行两种级别给出,供用户从中选择。
3) 表示方法规则采用抽象和具体两种形式。前文指出,要素关系和要素数据差异度分别是在要素类型基础上的进一步分类,规则如果没有给定具体的要素关系和数据差异度,则是抽象的,反之是具体的。具体形式的规则的表达效果分为较优与可行两种级别,而抽象形式的规则由于没有指定具体的要素特征,因而只具有“可行的表示方法”一种级别。具体规则较优与可行的表示方法的总和就是相应的抽象规则的可行表示方法的集合,如网格符号法适合表示数据差异度适中的情况,但也可适用于差异度大和差异度小的情况,只是效果不是很理想。这个规律能够在规则形式化表达时减少冗余。
4) 表示方法规则可分为简单规则和组合规则两种类型。简单规则是指结论为一个表示方法的规则,组合规则是指结论为多个表示方法相互组合共同表达专题要素的规则。但并不是任意两种表示方法都能组合,表示方法组合规律与表示方法所对应的符号类型密切相关。如果不考虑图案视觉变量及点值法使用多个类型的点子的情况(这种情况在地图作品中较少出现),表示方法组合规律为:面状符号法(非点值法)、点状符号法及点值法3类表示方法中只能选择不同类的进行组合,相同类的不能同时表达。在对表示方法规则形式化表达时顾及该规律,可大大减少规则的冗余。
三、表示方法规则的形式化表达研究
在上节对表示方法规则的特征研究的基础上,对表示方法规则的形式化表达展开研究,分别介绍了简单规则和组合规则的表达策略,并以实例介绍了其运行机制,最后简单地对其可用性进行了分析。
由于表示方法规则是“条件—结论”形式,因此可采用类似于产生式知识表示方法的结构[8-9]进行简单规则的表达。根据上文对规则条件的分析,简单规则的条件语句具体有5种类型:字符型单要素、数值型单要素、复合要素、具有差异度属性描述的数值型单要素和具有关系特征描述的复合要素。在表示方法规则的结论语句中,以“EXCELLENT”“GENERAL”两种优先级别关键字分别表示较优的表示方法和可行的表示方法。根据上文的分析,此时对于抽象形式的规则,只需以“GENERAL”关键字对可行的表示方法一一列举;而对于具体形式的规则,只需以“EXCELLENT”关键字将较优的表示方法列举出来即可,其“GENERAL”部分可动态求得,具体获取方法是以对应的抽象规则表示方法集合作为全集,求取该具体规则的较优表示方法的补集。
例如,对于复合要素的表示方法规则的抽象形式和具体形式(只列举一种),可表达为:
IF复合要素THENGENERAL{柱状符号法,饼状符号法,格网符号法,玫瑰符号法}。
IF复合指标[结构关系]THENEXCELLENT{饼状符号法}。
为了减少规则的冗余及后续编辑修改的方便,本文将表示方法的组合规则设计为在运行时能够根据简单规则和约束条件[10]自动推理生成的形式。
表示方法组合规则的约束条件是否合理有效直接决定推理结果的正确是否,根据前文的研究结果,表示方法规则的约束条件有两个:
1) 约束1:非点值法的面状符号表示法、点值法、点状符号表示法每种类型至多只能包含一种。
2) 约束2:点状要素只能采用点状符号表示法进行表达,线状要素只能采用线状符号表示法进行表达,面状要素可用面状符号表示法或点状符号表示法表示。
表示方法组合规则的推理方法直接影响推荐合适的表示方法的效率,从提高效率和准确率的角度,其具体的推理过程如图1所示,包含如下几个步骤:
1) 从制图要素中筛选是否含有字符型单要素,若存在则在约束条件限制下对该要素选择表示方法,然后对剩余的要素继续进行查找,由于字符型单要素表示方法唯一确定,首先判断。
图1 表示方法组合规则的推理
2) 从所有剩余的n个要素中,选择n-1个要素,选择原则是先选择复合要素,复合要素数目不满足n-1时,补充选择数值型单要素(优先提取复合要素,是由于无论是单个复合要素还是包含复合要素的多要素,其对应的表示方法始终属于点状符号表示法,较为明确)。
3) 对于此n-1个要素,在约束1和约束2的共同作用下选择表示方法,若不能从简单规则中找到满足条件的规则,从n-1个要素中按照步骤2)的选择原则继续选取n-2个要素,递归直到在约束1和约束2限制下从简单规则中找到合适的表示方法或确定不存在可采用的表示方法(若存在多个可选择的表示方法策略,分别进行步骤3)、步骤4),以推荐所有可采用的表示方法)。
4) 回到上一层为未选择的要素(如在n-2个要素找到表示方法,则n-1个要素中未选入n-2个要素的那个要素)在约束1和约束2限制下选择表示方法。依此类推,直到将所有可采纳的表示方法都选择出来或没有可用的表示方法时为止。
为了说明表示方法规则的生成规则,下面以在地图上同时表达“字符型单要素+数值型单要素[差异度大]”专题要素(两个专题要素均为面状要素)为例,说明其运行机制。
1) 提取字符型单要素,从简单规则中找到字符型单要素的表示方法为“质底法”,此表示方法为面状符号表示法(非点值法)。
2) 对于剩余的数值型单要素[差异度大]专题要素,从简单规则中找到具有差异度大特征的数值型单要素较优的表示方法为等值区域法、分级符号法、柱状符号法,结合数值型单要素的抽象规则可得到具有差异度大特征的数值型单要素可行的表示方法为:连续比率符号法、点值法、格网表示法。其中由于等值区域法不符合约束条件,不是可行的表示方法。由于只有一个专题要素,无须根据选取原则递归选取,因此规则运行结束。
因此,此例中对于该专题要素组合得到的结论是:较优表示方法——质底法+分级符号法、质底法+柱状符号法;其他可行的表示方法——质底法+点值法,质底法+连续比率符号法、质底法+格网表示法。
为了验证该形式化方法的有效性及对用户制图的指导意义,本文进行了简单的试验。具体方法是请10名没有制图经验的普通试验者(进行两次,分别在传统制图模式下和嵌入表示方法规则自动推荐表示方法的制图软件中)、10名有多年制图经验的专业试验者,对同一组专题要素选择表示方法,然后请制图专家对选择的表示方法表达专题要素的效果进行打分。本试验采用的人口专题数据的“人均收入”“人均消费”和“私家车总量”,见表1。
表1
3组试验中选取的表示方法方案的种类和数目,以及每种方案专家打分结果见表2。
表2 表示方法选择试验汇总
表2中,若表示方法方案中含有“+”,“+”左边为“私家车总量”字段对应的表示方法,右边为“人均收入”和“每年人均消费”字段应的表示方法。对表2数据进行处理可得3组试验者选择表示方法的能力见表3。
从表3可以看出,在自动推荐表示方法模式下普通试验者选择表示方法的能力有了较大的提高,说明本文对表示方法规则的形式化表达策略有一定的可用性和有效性。
表3 3组试验者选择表示方法的能力
四、结束语
本文针对当前制图软件缺乏指导用户有效地选择合适的表示方法的机制的情况,对面向自动推荐的表示方法规则的形式化表达技术展开研究,分别介绍了表示方法规则的特征、表示方法简单规则和组合规则的形式化表达策略、表示方法规则的运行机制,并进行了可用性试验。本文对表示方法知识的形式化表达的研究对如何进一步将多种类型的专家制图知识嵌入到制图系统、提高专题制图软件的自动化智能化水平有一定的参考价值。
参考文献:
[1]陈毓芬,江南.地图设计原理[M].北京:解放军出版社,2001.
[2]郭庆胜,周巨锁.选择专题地图表示方法的推理研究[J].测绘信息与工程,2004,29(2):31-33.
[3]廖小韵.专题地图表示方法的研究[J].测绘通报,2005(12):52-55.
[4]田晶,黄仁涛,郭庆胜.智能化专题地图表示方法选择的研究[J].测绘科学,2007, 32(5):170-172.
[5]马健.统计专题地图表示方法的自动推荐技术研究[D].郑州:信息工程大学,2014.
[6]马健,崔虎平.专题制图规则及本体表达模型的研究[J].测绘科学技术学报,2013,30(5):540-544.
[7]曹亚妮,江南,张亚军,等.电子地图符号构成变量及其生成模式[J].测绘学报,2012,41(5):784-790.
[8]年志刚,梁式,麻芳兰,等.知识表示方法研究与应用[J].计算机应用研究,2007,24(5):240-242.
[9]马俊.专题地图总体设计智能化理论与方法研究[D].郑州:信息工程大学,2013.
[10]冯涛.专题地图自动化制作的控制技术研究[D].郑州:信息工程大学,2011.