季珏 安超 李波茵 伍雍涵
在生态文明建设的背景下,城市园林绿化行业迎来了新的发展契机。与此同时,为了满足人民日益增长的物质文化需求,以便民共享、绿色发展等为目标,各地开展了以绿地空间结构优化,绿地景观改造提升等为内容的城市园林绿地的扩容提质工作。城市园林绿化行业的管理对象日趋复杂,各类绿地资源要素种类和规模不断攀升,绿地系统结构日趋复杂,以信息化手段进行城市园林绿化的行业管理已成为城市园林绿化工作的迫切需求,也是提升园林绿化管理精细化和科学化水平的重要抓手。
目前,不少城市开展了园林绿化的数字化工作,将现有的园林绿化规划设计成果、园林绿化历史资料档案、城市重要园林苗木信息等建立了资料数据库[1]。此外,针对这些资源管理,已有学者开展了系统功能的设计和建设工作[2-3],并围绕城市园林绿化的核心重点工作,例如绿地资源调查、古树名木保护,绿线监测等重点工作研发了相应的信息管理手段[4]。当前,不少国外学者已经开始关注利用GIS和虚拟现实技术进行城市绿地景观的管理。例如2008年,澳大利亚Payam Ghadirian等利用虚拟现实和GIS相结合的技术对澳大利亚西北部城市Victoria进行景观可视化研究,以期加强决策者和非专家之间的交流,使决策过程更加高效[5]。Nyuk & Steve按照新加坡国立大学2005年规划要求构建了校园二维和三维绿化图,将校园分成11个区域,分别计算绿化容积率,进而对校园绿化状况进行评估。在泰国曼谷,政府致力于改善当地的绿化状况[6]。Bunvong等收集了曼谷各种绿色基础设施数据,包括普通绿地、街道绿化树、文物保护树等,借助GIS的分析功能,研究当前树种多样性对将来城市绿地规划中树种的选择带来的影响[7]。2001年,Kyushik Oh开发了城市景观信息系统(LSIS)用于管理城市景观信息和分析拟发展项目的视觉影响。借助GIS和图形仿真技术实现强大功能,其底层数据库使用首尔信息系统(UIS)的框架设计,极大地方便了两者的数据共享,促进了以计算机为基础的城市景观管理的效益和价值[8-9]。可见,目前国内学者在绿地资源管理建库的前端探索较多,而国际则关注管理活动的应用预测等前端需求。此外,在城市规划、地下空间管理等行业,已实现了以信息技术手段辅助行业管理的深层次应用。特别是在城市规划行业,以“统一的空间蓝图”为目标,多地建立了“多规合一”行业管理平台,实现了城市基础空间数据、各类规划数据的统一入库和空间匹配叠加[10],进而为规划审查、项目选址、环境影响评估等深层次横向及纵向行业应用服务。相比较而言,目前城市园林绿化的信息化管理仍处于面向管理者的应用阶段,并未开展纵向的行业推广。
表1 城市园林绿化信息化管理的主要内容Tab.1 Main contents of urban landscaping information management
在实地调研中发现,近50%的城市虽然敷设有园林绿化信息化管理系统,但系统处于闲置或夭折状态。其中,行业管理需求、前沿预测与系统设计、建设之间的脱节是造成系统运行效率低下的主要原因。尽管充分的需求沟通是信息化建设的前沿,但受限于沟通者的沟通方式和频率、参与人的管理经验等,导致需求分析的主观性较强,或需求分析结果过于片面,并不能充分发挥和代表行业管理的真实需求或前沿状态。本研究从信息管理系统搭建的最前端需求分析入手,基于文本挖掘的方法探讨一种科学的需求分析方法,准确反映行业管理的深层次需求和前沿状态,为系统构建和行业管理搭建沟通的桥梁。
结合城市园林绿化管理工作的内容,一般而言,城市园林绿化行业信息化管理的主要内容包括3个方面(表1)。1)园林绿化数据管理。具体是指对城市各类绿地、园林绿化设施等各类城市园林绿化管理对象的空间、属性和相关资料的信息化管理。2)园林绿化动态监管。具体是指绿线监测、绿规实施监管、古树名木保护监管等。3)园林绿化辅助决策。具体是指针对园林绿化管理工作中公园建设选址、病虫害预警等具体工作开发相关科学决策的辅助信息工具。
20世纪90年代后期,随着信息化、网络化建设进程的加快,各地也相继开发和研制了一些园林管理方面的信息系统。其中一类是基于GIS技术搭建的单一园林绿化资源的管理系统,又以城市植物或树种为主要对象[11-12]。这类系统具有树种个体信息及相关管理数据的输入和编辑以及图文展示等功能。另一类系统是集成GIS技术,搭建城市园林管理综合系统[13]。这类系统在信息建库的基础上,面向决策应用有了进一步发展。但自2010年后,城市园林绿化信息化管理的相关研究和实践工作出现了一定的停滞。此外,目前专业的园林绿化信息管理平台大多是建立在城市一级,辅助城市园林绿化工作,而对于省或国家层面的平台仍在探索期,这就使得园林绿化的行业管理工作并未在行业体系内开展深度应用。
随着物联网、大数据、云平台的大力发展,特别是城市管理平台“数字化—信息化—智慧化”的发展趋势已越发明朗,未来在新的网络时代、信息时代下,城市园林绿化信息系统的构建如何充分满足管理者、公众的用户需求,同时结合移动终端、物联网终端等多源异构数据,实现园林绿化跨业务、跨部门的精细化管理是未来行业信息系统发展的重点。
1 文本挖掘工作流设计Design of workflow of text mining
表2 城市园林绿化信息系统敷设试点城市分布Tab.2 Distribution of pilot cities applying the urban landscaping information system
在大数据时代,微博、微信等手机APP提供了新型的用户数据,如何充分挖掘这些新型的数据,分析并预测园林绿化行业管理的前沿需求,是城市绿化信息化管理的关键问题。鉴于大部分需求数据,例如用户体验、评价、记录、留言等均为文本型数据,本文作者提出可通过文本挖掘的方法,从文本型大数据中发现高频词,挖掘用户的潜在需求,进而总结形成城市信息化管理的前沿需求和功能组成。
文本数据挖掘(text mining)是指从文本数据中抽取有价值的信息和知识的计算机处理技术。它是从大量文本数据中抽取事先未知的、可理解的、最终可用的知识的过程,同时运用这些知识更好地组织信息以便将来参考。目前,文本挖掘方法已在规划方案评比[14]、网络舆情监测[15]以及目的地印象评价[16]等方面展开了应用,利用科学的方法从非结构化的文本数据中,实现了数据挖掘和潜在信息分析。
文本挖掘有3个独特的关键步骤:1)分词,通过分词可以将非结构化数据转化为结构化数据;2)情感分析,定义情感强度,从文本中挖掘用户的满意度或者观点,即一些词语的出现频率;3)去噪,即从分出的众多词中剔除干扰的无用的词,提升数据质量。
笔者在Smart Mining软件中,设计了文本挖掘的工作流(图1),主要分为4个步骤。
1)园林绿化系统的需求输入。首先,使用文本挖掘目录下的平面文件节点读取相应的文件数据。
2)对文本进行分词。分词的功能是对中文或者英文文本进行分词,进而从非结构化数据中提取结构信息。分词的结果都是按列输出词语。分词后将在输出表中追加分词、计数和词性3个字段。分词字段表示从文本字段中提取出词;计数字段表示按照每个文本,对得到的每个分词出现次数的统计,需注意统计的只是每个词所在文本中出现的次数,并不是所有文本中出现的次数;词性字段显示每个分词的词性,例如名词、动词、结构助词等。
3)噪声词过滤。噪声词过滤节点的功能是将分词字段中的无关词汇或者不重要的词过滤掉,筛选出重要的词汇。过滤的方法有5种,分别是过滤与内置的噪声词库匹配的词汇、与自定义噪声词库匹配的词汇、过滤所有的标点符号、过滤所有的数字和过滤所有字节长度小于N的词。这5种方法可以只选择一个进行过滤,也可以选择全部进行过滤。过滤后输出表中的列数保持不变,只会过滤掉匹配条件的记录。本研究对于园林绿化需求文本噪声词的过滤采用了以上第1种方法。
4)词云绘制。使用过滤后的关键词及其出现频率绘制词云。
本研究对于园林绿化信息化管理需求挖掘分析将采用3类数据。
第1类为会议记录等文字数据。研究组分别于2012—2018年持续7年在广东省阳江市、内蒙古鄂尔多斯市、河南省开封市、四川省德阳市、山东省枣庄市等地召开全国数字化园林建设会议,累积了全国多个城市的数字化建设需求及建设经验。
第2类为用户使用体验评价等文字数据。研究组研发的数字园林信息化系统已在广东省阳江、浙江省丽水、内蒙古鄂尔多斯等全国30个城市开展了试点应用(表2),并获取了30个城市的验收及使用意见。
据分析,试点城市大多分布于中东部地区,这些城市,特别是沿海的东部城市,经济普遍比较发达,城市整体的数字化基础较好,实际信息化应用水平较高,其意见反馈可充分代表用户对数字化管理的前端需求。
第3类数据为来源于各类园林绿化行业主管部门门户网站的新闻发言。本研究搜集了自2012年以来鄂尔多斯、阳江等全国15个城市园林绿化主管部门对于本城市园林绿化数字化建设系统的经验及未来的需求展望。
所获得的3类数据(word文档数据)作为需求数据,利用大数据挖掘工具Smart Mining软件进行文本挖掘分析,试图分析园林绿化主管部门关心的热点问题、系统需求及未来趋势。
笔者整理了文本挖掘软件中的挖掘结果,过滤了若干与需求关键词无关的高频词汇,例如口语化的“我们”“召开”“会议”“热烈欢迎”等。按照软件所选分词的出现频率自行绘制了词云图,图中字体越大表示出现的频率越高。为了便于区分,在自行绘制词云图时,运用了统计学的方法,各分词按照出现频率进行K-means聚类,将现有高频词分为3类,其中3类的分法是参考系统聚类的结果,当现有高频词分为3类时,类间差最小(图2)。
从词云分布图中可以看出,目前各城市园林主管部门对于信息系统的需求呈现3个明显的特征。
2 园林信息管理需求的词云分布图Word cloud distribution diagram of garden information management requirements
从词云分布图的最高频词分布中可以看出,均是与“城市”“园林绿化”“绿地”息息相关的词汇,这反映出利用园林绿化信息化管理是为更好地管理城市园林绿化资源,为城市服务,使城市更生态的初衷。在2016年修订的《国家园林城市系列标准》(建城函〔2016〕235号文,以下简称《标准》)中鼓励城市开展园林绿化管理信息技术应用,在高频词云中,“园林城市”成为最高频类词语,这反映了目前各地以园林城市创建推进各地园林信息系统建设是具有显著成效的。
从词云分布图中可以看出,在第二个圈层结构中,与系统内容相关的高频词为“数据”“数据库”“信息管理”“信息技术”“信息提取”。这间接反映出目前利用信息系统实现对城市园林绿化信息的信息化建库管理是所有城市的基本需求。
而“监督管理、管理手段、科学决策”则表达除信息建库管理之外,各地利用信息系统辅助工作的主要工作内容。此外,在文本挖掘中,出现了5个高频词:“数字化”“信息化”“规范化”“精细化”“智能化”。
数字化是所有管理对象的一个电子化入库的过程;信息化是对数字化的进一步发展,不仅完成电子入库,还包含信息之间的交换和共享等关键技术;规范化是在信息化的基础上,形成自身顺畅的管理业务流程;精细化是从管理手段到管理对象的精细化革新;智能化则是在此基础上,利用各种多源异构数据实现更高效、便捷、实时的管理。从以上5个概念的内涵来分析,反映了目前各地园林绿化管理目标在层进的转变,园林绿化的管理需求由单纯的数字化、信息化向规范化、精细化、智能化的前沿进一步转变。
分布于最外圈层的词汇,虽然频率相对较低,但却能反映出个别城市在应用领域的若干前沿想法,信息化管理的需求在数字化和标准化的前提下,进一步结合物联网等新技术,向智慧化转变。具体如下。
1)继续完善信息平台的功能属性和业务推广应用工作。
从高频词来分析,“数据共享”“查询统计”“更新”“预警”等高频词的出现,反映了各管理部门希望信息系统在功能上进行完善,不仅满足数据收集、查询统计等基本功能,更希望对于信息系统的标准能有规范的顶层设计,同时对于系统的动态性和实时性,预测预警的功能有了更高的需求。
此外,还可以看出,“技术人员”“专业”“推广”“培训”等高频词的出现,反映了各地对于利用信息技术带动整体专业管理水平和培养专业业务团队寄予了厚望。
2)增加物联网技术在园林绿化信息化领域的应用。从词云分析来看,多个地区提到了“探测器”“二维码”“传感器”“移动终端”等大数据获取的技术渠道。这充分反映了各地在信息系统构建时,希望与数字城市、智慧城市相结合的需求,尤其是引入物联网技术,使城市绿地的信息化管理能够并入到统一的城市信息化管理中,实现管理的智能化。结合实际调研,可研发移动终端(二维码、探头、探测器等)与信息化系统的结合,针对病虫害预警、智能灌溉、智能施肥、二维码管理等方面,进一步丰富系统辅助决策模块的功能。
图表来源(Sources of Figures and Tables):
图1~2由作者自绘;表1由作者整理自绘;表2试点城市数量来自前期研究团队系统敷设实际经验。