张 伟,陈晓慧,李 锋
(1. 信息工程大学 地理空间信息学院,河南 郑州 450001;2. 地理信息工程国家重点实验室,陕西 西安 710000)
浅析地理舆情的概念及相关技术
张 伟1,2,陈晓慧1,2,李 锋1
(1. 信息工程大学 地理空间信息学院,河南 郑州 450001;2. 地理信息工程国家重点实验室,陕西 西安 710000)
分别从地理舆情的基础理论、技术支撑、概念解析、分类定义及框架体系等方面,对地理舆情进行了系统的介绍,以期能研究地理舆情的体系框架,为大数据时代地理舆情的网络环境研究打下基础。
地理舆情;概念;可视分析
随着科学技术的不断发展进步,尤其是以互联网、移动互联、物联网组成的泛在网络为代表的Web2.0时代的到来,网络空间的用户数正处于一个高速增长的
时期。网络媒体已被公认是继报纸、广播、电视之后的“第四媒体”,网络成为反映社会舆情的主要载体之一。大数据时代,网络舆情表现为广泛、快速、互动、自由等特性,掌握不好也具有危害性[1,2]。因此,利用网络媒体进行网络舆情分析已经得到了广泛的关注。本文介绍和研究了大数据时代地理舆情研究的理论依据和技术支撑,以期为地理空间信息科学的研究领域拓展奠定基础。
从研究领域来看,地理舆情的研究方向是地理学、社会学和情报学交叉学科的研究领域,不属于某个单一领域,是多领域的结合;从分析方法来看,地理舆情还涉及统计数学、计算机科学等领域。因此,地理舆情的理论基础见表1。
表1 地理舆情的理论基础
①地理学的基础理论,为地理舆情的研究范围提供依据,为地理舆情的客体研究提供理论支撑。尤其是空间认知理论,为地理舆情的可视化提供了参考,地理语义的认知是地理舆情分析概念模型构建的基本依据。②社会学的基础理论,为地理舆情的分析提供方法依据。传统舆情分析过程一般包括收集、处理、分析、总结等,在此基础上地理舆情分析过程可分为数据获取、信息抽取、统计分析、可视化分析等。社会心理学的理论为舆情的情感分析提供依据。③情报学的基础理论,为地理舆情的归宿提供理论依据。地理舆情是主体对客体的主观情感进行分析,挖掘主体之间的关系、客体的分布、发展、变化的规律。地理舆情是人们(主体)对客体的主观认识的客观反映。当然,情报学中的一些标准规范、分析方法等也给地理舆情分析提供了依据。
大数据时代,地理舆情分析往往采用基于网络的形式获取数据,其最大优点是自由性。因此,地理舆情分析需要通过数据挖掘[3]、自然语言处理[4]、可视分析[5,6]等关键技术,实现对地理舆情的实时获取、统计分析、可视化表达和预测判断等,如表2所示。
表2 地理舆情分析的技术支撑
数据挖掘技术为地理舆情分析的数据处理提供了技术支撑。地理舆情中主客体都要进行特征化描述,对主体的关系进行关联分析,客体的发展过程进行演变分析及趋势分析,客体的事件分布可以用数据挖掘的聚类分析进行聚类表示。自然语言处理技术为地理舆情分析的信息处理提供技术支持。命名实体识别是自然语言处理中一个关键技术。自然语言处理中信息抽取、关系抽取、自动文摘等技术是地理舆情中进行地名事件识别、主客体关系分析、事件过程标注的基础。地理舆情分析,除统计分析外,还要依靠可视分析进行人机交互,挖掘更高级别的推理成果。地理舆情的可视分析不仅是“可视化-分析”的过程,而是“分析-可视化-分析”的一个循环过程。地理舆情分析目的是为了得到主客体相互关系及其发展规律,并预测发展趋势。
地理舆情是以地理学、社会学、情报学等理论为基础,数据挖掘、自然语言处理、可视分析等技术为支撑,人(民众)为主体,具有地理空间属性的对象或事件为客体,在一定的社会空间(包括虚拟网络空间)内,获取主体对具有地理空间特征的现象或事件的发生、发展和变化的态度、情绪、意见的主观表现,并分析具有空间、时间以及视觉特征的关于主客体关系及发展规律(分布和趋势)的情报,如图1所示。
图1 地理舆情定义结构图
地理舆情的特点为:
1)时空关联性。地理舆情研究对象是具有时空特征的舆论情报,具体表现为时空事件的主观态度、相互关系及其发展规律。
2)实时动态性。地理舆情其本质是一个情报产品,具有情报的实时性与动态性,随时间变化而不断发生变化。
3)主观不确定性。地理舆情研究的主体是人本身,信息来源是人的主观表现,因此具有主观情感特征。
4)可视性和预测性。地理舆情分析的目的是提供可视化的情报产品,预测地理舆情的发展走向,辅助决策。
地理舆情按照内容可分为:环境舆情、资源舆情、人口舆情、土地舆情、城镇舆情、水利舆情和交通舆情等[7],如表3;按照性质可分为:政治舆情、经济舆情、军事舆情、文化舆情、社会舆情和生态舆情等,如表4。
地理舆情的基本要素包括地理舆情对象(GO)、地理舆情事件(GE)、地理舆情过程(GP)和地理舆情属性(GA),是一个四元组{GO,GE,GP,GA}集合。地理舆情分析模型设计主要从数据获取、数据处理、数据分析、功能应用4个方面进行模块化设计。以地理舆情的概念模型为基础,对地理舆情的内容、分析手段及产品表现进行规范,如图2。
表3 按内容分类的地理舆情
表4 按性质分类的地理舆情
图2 逻辑框架图
大数据时代,测绘保障已经不是简单的提供数据服务,而是将数据转化为信息,从信息中提取知识,最终为用户提供智能服务。地理舆情是通过对样本数据进行分析而得出具有时空特征及发展规律的情报产品,是测绘在人文社会空间和网络空间的典型应用。随着科技的不断发展,无论从网络安全分析、研究领域的拓展,还是测绘保障的需求,地理舆情都是大数据时代地理空间信息科学领域研究的重要内容。
[1] 陆锋,张恒才.大数据与广义GIS[J].武汉大学学报:信息科学版,2014,39(6):645-654
[2] 李清泉,李德仁.大数据GIS[J].武汉大学学报:信息科学版,2014,39(6):641-644
[3] Han J W,Kamber M.数挖掘概念与技术[M].北京:机械工业出版社,2004
[4] 张素香.信息抽取中关键技术的研究[D].北京:北京邮电大学,2007
[5] Keim D, Andrienko G, Fekete J, et al. Visual Analytics: Definition, Process, and Challenges[C].In: Kerren A, Berlin,2008
[6] 华一新,曹亚妮,李响.地理空间可视分析及其研究方向综述[J].测绘科学技术学报,2012,29(4):235-239
[7] 陈俊勇.地理国情监测的学习札记[J].测绘学报,2012, 41(5):633-635
P208
B
1672-4623(2016)03-0005-02
10.3969/j.issn.1672-4623.2016.03.002
张伟,博士,工程师,研究方向为作战环境学。
2015-01-12。
项目来源:国家自然科学基金资助项目(41301428);地理信息工程国家重点实验室重点基金资助项目(SKLGIE2014-Z-4-1)。