地理信息服务网络与协同研究进展

2022-07-05 08:12吴华意靳凤营梁健源张显源邢华桥桂志鹏向隆刚
测绘学报 2022年6期
关键词:服务网络语义协同

吴华意,靳凤营,梁健源,张显源,邢华桥,桂志鹏,李 锐,向隆刚

1.武汉大学测绘遥感信息工程国家重点实验室,湖北 武汉 430072;2.山东建筑大学测绘地理信息学院,山东 济南 250101

近20年来,大量的地理信息数据和服务在互联网上发布与传播,传统的地理信息系统逐渐转为基于网络的地理信息服务[1-2]。地理信息服务具有共享性、复用性、不受地域限制等特点,这些特点降低了服务资源的使用门槛,促进了地理信息服务资源跨地域、跨领域的使用[3-4]。

互联网和大数据进一步推动地理信息科学领域的发展,用户对地理信息服务的需求趋向个性化、多样化,单个地理信息服务逐渐难以满足更高层次的应用需求。为增强地理信息服务的服务能力,提高服务范围,研究者将多个服务联合使用,建立服务组合模型。但是,服务组合模型涉及多个服务的协同使用,甚至一个模型还会依赖其他模型的过程或结果[5-7]。如何有效发现需要的地理信息服务,将其构建成可高效协同的服务组合成为研究者重点关注的问题。鉴于此,开放地理信息联盟(OGC)提出基于网络服务的OWS(OGC web services)框架,提供WFS、WCS、WMS、WPS等规范,支持地理信息服务之间的互操作。然而,OWS只解决了服务组合中服务之间的信息交换问题,服务的表达与发现[8]、服务及其组合的质量[9]、服务的替换和优化等问题仍待解决。大量的地理信息服务仍以“个体”形式存在于互联网中,需要研究者发现和使用。

为促进地理信息服务组合,需要有效的组织方式管理现有的地理信息服务。文献[10]提出地理信息服务网络(geospatial service web,GSW)的概念,认为地理数据、信息、知识,甚至服务提供者、用户都是共享服务的一部分,应形成智能化、自动化的地理信息服务网络体系。文献[11—12]进一步指出建设地理信息空间信息服务网络面临的挑战包括:地理空间资源的抽象和管理,互操作性和标准化,地理空间信息和知识的表示等方面。受限于地理信息服务表达语义多样、结构化和非结构化格式混合、统一标准的覆盖率低等特点,迄今为止,地理信息服务网络仍难以形成。

近年来,面向互联网的服务架构[13]、服务计算[14]和服务协同[15-16]等技术日渐成熟。强调相关关系的网络协作[17]已在天文发现、基因测序等复杂问题分析中发挥作用。另一方面,服务实体表达能力大幅度增强,基于语义的服务表达已商业化应用,这些成果为地理信息服务协同的研究带来了新的机遇。

本文认为,众多地理信息服务具有复杂多样的关联关系,其本质是一种网络结构。基于地理信息服务实体的表达,构建动态可变、语义关联的地理信息服务网络,是组织众多地理信息服务的可行方法,与其他方法,例如知识图谱,复杂网络方法等相结合,具有广泛应用前景。本文总结地理信息服务网络及协同的研究进展,并对未来的发展进行展望。

1 地理信息服务表达与获取

地理信息服务旨在提供一个理解与访问地理信息数据与处理的接口,传递和共享具体的服务内容,解决服务互操作问题。从服务的构建与使用的角度出发,需要关注地理信息服务的表达与获取两个方面。

1.1 地理信息服务表达

地理信息服务的表达是从服务的数据、参数、操作、质量等方面建立一种计算机能够理解的语义描述,服务表达的健壮性和准确度决定了其在网络环境中被发现的可能性。其中,服务的数据、参数、操作提供了服务的功能语义信息,包括具体的服务内容,服务范围接口,输入输出等,而服务质量提供了非功能的语义信息,能额外描述服务的健壮性和可用性。

近年来,地理信息服务质量被较多地关注。文献[18]提出,地理信息服务质量(quality of GIService,QoGIS)要同时关注服务的过程和结果的质量,包括响应时间、吞吐量、数据的时效性、结果的完整性等要素。除了服务本身的质量外,还可以考虑用户的需求和偏好,用户与服务的时空特征[19-20]。文献[21]进一步归纳服务质量要素为功能可用性要素、成果要素和过程要素3大模块。

将地理信息服务质量的描述整合到OWS或其他协议中,能有效提高地理信息服务的表达能力,在对服务的检索、选择、组合优化等方面发挥了重要的作用[22]。例如,文献[9]在OWS的基础上增加了对地理信息服务质量的描述,支持基于服务质量的地理信息服务实体发布、发现与选择;文献[23]提出将语义信息嵌入服务描述文件中以提高地图服务的质量;文献[24]对OGC服务标准进行了扩展,将地理信息服务质量的评估用于服务链的选择。此外,部分研究还通过网络服务的本体语言,利用地理信息服务的元数据、配置文件、能力文档、输入输出、实体特征,主题文本等表达地理信息服务[2,25-29]。

1.2 地理信息服务获取

当前地理信息服务资源的特点是:资源众多,分布广泛[30-31],可以大致分为数据服务和处理服务。如图1所示,地理信息服务主要以服务实体存在于相关的信息门户中,或注册在基于SOA架构的注册中心[32-33]。

图1 地理信息服务门户

地理信息数据服务门户成果众多,例如全球地质一体化服务门户OneGeology[34]、美国政府的地理一站式网络门户Geospatial One Stop[35]、我国的国家地理信息公共服务平台天地图[36]。地理信息处理服务也在逐步发展,相关成果有52North[37]、GEOSS的Clearinghouse[38]、ArcGIS的处理服务[39]、GeoSquare[10]等。此外还有一些非Webservice的软件接口或模型,也提供了地理信息处理服务的能力。例如基于Google Cloud的卫星影像数据可视化计算和分析处理平台Google Earth Engine[40-41],以及一些地学应用模型[42-43]。

当前,地理信息服务的查找主要通过关键字搜索。基于通用搜索引擎(如Google、百度等)的地理信息服务检索利用关键词匹配,无法真正“理解”地理信息服务,搜索的结果需要二次甄别[8,44]。注册中心整合了地理信息服务资源,注册和发现机制能确保准确高效地发现已注册的服务[45-46]。但是,目前还没有一个权威、完整的注册中心,且缺乏更新机制,存在查不全和服务失效问题[47]。此外,注册中心依赖分类树,数据之间是语义离散的,服务组合需要额外的专家知识。

地理信息服务的获取建立在服务表达的基础上,研究者就如何有效感知服务表达的内涵以促进服务获取提出了不同方案[32,48]。其中,基于服务之间的关联关系,建立地理信息服务网络引起了广泛关注。

2 地理信息服务网络

地理信息服务网络是所有地理信息服务及其关系组成的总和。建立高性能,智能化的地理信息服务网络,将终端用户、应用、数据、服务,传感器设备等建立智能链接,是支撑复杂地理空间决策的可靠举措[10]。地理信息服务网络通过预先构建服务之间的关系,作为服务组合的基础,可以有效支撑地理信息服务协同。

目前,在服务网络领域已有很多研究成果可作为地理信息服务网络的参考。本节将服务网络领域的研究成果,应用于地理信息服务网络的建模与表达、服务网络更新与优化方面,探讨构建地理信息服务网络的可行性和潜在方法。

2.1 地理信息服务网络建模与表达

地理信息服务网络的建模与表达是依据地理信息服务的语义关系、属性关系、空间关系构建模型,利用该模型将地理信息服务连接起来,并以一个语义关联、属性关联、空间关联的服务网络形式进行表达。按照建模方法的不同,可分为3类:基于复杂网络的方法,基于异构网络的方法,其他方法。

2.1.1 基于复杂网络的方法

在Web服务网络研究领域,文献[49]基于服务语法和语义关系定义了Web服务组合的依赖网络和交互网络模型,通过对这两个网络的分析,证实了基于语义语法的网络符合复杂网络“小世界”和“幂律分布”的特点;文献[50]提出了一种通过Web服务匹配算法将Web服务作为节点,将功能相似的服务连边,构建Web服务复杂网络模型的方法并指出利用网络服务节点的语义信息可以提高服务匹配的准确率;文献[15]基于Web服务间的参数匹配关系,服务交互关系建立服务结构网络和服务行为网络,在此基础上建立了服务执行行为的演化模型,结果表明由Web服务构成的系统具有更强的模块性,需要重视服务结构网络带来的影响。

复杂网络同时可作为服务链的推荐和智能组合的基础。例如,文献[51]提出基于复杂网络的服务能利用服务集合信息逆向查找关联的服务进行服务推荐;文献[52]利用关键路径算法构建信任网络模型,提出了贝叶斯网络和小世界网络的混合模型,并利用节点之间的最佳连接来推荐最佳的合作伙伴;文献[53]研究了业务流程复杂网络的划分机制和算法,用于提升复杂云制造环境下制造服务组合的动态自适应能力。

因此,复杂网络是应用于地理信息服务网络的构建的潜在方法,通过分析地理信息服务网络的特性,挖掘关键服务节点,可以更好地应用于服务组合与服务推荐。

2.1.2 基于异构网络的方法

异构网络可将系统、功能、协议不同的网络资源连接使用,满足业务多样性的需求。基于异构网络的特点,文献[54]建模了基于服务的软件系统(SBS)、服务(service)、相关属性,以及SBS-Service的组合关系的异构网络模型,在对服务聚类的基础上,采用基于元路径和网络表示学习的方法进行服务推荐;文献[55]依据Web服务、服务属性、服务提供商、用户以及相互之间的关系构建异构网络模型,提出了一种异构服务网络聚类的算法;有文献[56]构建了服务、服务提供者和消费者的异构网络模型,在异构网络分析的基础上进行服务聚类和排序。成果表明,利用异构信息网对服务资源建模,能解决异构的服务资源组织的问题,这正好符合多源异构的地理信息服务网络组合的内在需求。

2.1.3 其他方法

整体来看,服务实体要素之间的关系是构建和使用网络的基础。例如,文献[25,57]分别根据服务之间的输入输出参数关系,操作级语义关系等,利用语义匹配方法挖掘Web服务间的关联关系建立了服务网络模型;文献[58]使用多层网络结构来表示服务之间不同的语义关系,并分析了服务网络的社团结构、节点、服务之间相关性,指出多层网络结构在Web服务研究中的重要意义;文献[59]提出了一种利用社交网络和关联数据方法构建服务网络模型的方法,形式化地表达了服务关系和属性,并定义了服务网络、服务社区,有效解决了网络服务利用率低和服务关系复杂性的问题;类似地,文献[60]提出了一种支持大规模定制需求的持久化服务网络模型,基于该模型构建了持久化服务网络。当用户定制服务时,利用服务间关系,寻找任务目标和初始状态之间的最优子网络,实现进行服务组合,降低了服务定制的成本。

在地理信息领域,文献[48]使用关联数据模型,基于语义关系将地理空间数据资源、数据服务、处理服务,地理工作流等关联,以促进异构地理空间资源的发现和使用;文献[61]提出一个从异构地理空间数据源生成、拓展和使用地理空间关联数据的框架,连接了空间基础设施SDI和语义网,有利于多种异构地理空间信息的复用和关联;此外,文献[62]构建了基于语义描述的地理信息服务网络模型,并将处理服务的输入输出参数、服务名称和服务描述并用于服务推荐,然而该研究规模较小,涉及数据类型、数据服务和处理服务较为单一,可靠性需要在更大规模的数据集中验证。

总体而言,可以借鉴服务网络领域的相关方法,构建地理信息服务网络,作为服务组合的基础,挖掘地理信息服务网络的关键节点及特性,提高服务组合效率。

2.2 地理信息服务网络更新与优化

当发现新的地理信息服务或者已有的地理信息服务发生变化或者失效时,地理信息服务网络需要进行更新与优化。根据服务网络建模方式,服务主题的不同需要指定不同的优化方法,即“具体问题,具体分析”。

一方面,服务网络的更新与优化确保网络的动态性,文献[53]在云制造业务流程复杂网络的研究中,提出了一种“制造任务-制造服务动态匹配”的复杂网络动态更新方法,优化了复杂网络的性能;文献[63]设计了基于语义信息筛选和基于类别新筛选的方法对服务网络进行增量更新的方法,使服务网络拥有实时更新,快速拓展的能力;类似地,文献[64]提出了服务网络的动态持续生长方法,包括多需求同时抵达的服务网络生长优化算法、基于需求特征的服务网络定制与生长算法,同时生成服务网络生长方案和优化的需求定制方案。

另一方面,服务网络的更新与优化是构建具体应用的基础,更新优化的好坏影响后续应用的使用。文献[65]在利用用户功能、QoS构建服务网络的基础上,采用关键节点排序方法优化服务网络的节点,降低服务网络的构造成本和使用成本;文献[66]通过对服务关系图存在的孤立节点和不合理链路问题的分析,预测网络中具有重要价值的服务,为服务组合网络的生长及服务发布者提供建议,并提出了一种基于用户历史组合案例的服务组合网络优化机制。

当地理信息服务网络作为服务组合的基础时,随着新的地理信息服务的发现、已有服务的变化或失效,地理信息服务网络也需要进行改变,需要借鉴服务计算领域的服务网络更新与优化的研究成果,对构建的地理信息服务网络进行更新与优化。地理信息服务数量和类别的增加,其质量特征(服务接口、数据吞吐和执行时间等)的变化,为地理信息服务网络的更新与优化带来新的挑战。因而引入服务网络领域的研究成果,构建地理信息服务网络,并实现基于网络的协同具有实践意义。

3 地理信息服务协同

地理信息服务协同是将发布在网络上的数量巨大但功能粒度较小的地理信息服务根据任务需求进行逻辑组合,形成地理信息服务链,对各研究领域的地理信息数据和处理服务实现分布式共享与协同互操作,以满足更高层次的应用需求,避免地理信息服务的重复建设和资源浪费等问题[67-69]。地理信息服务协同本质是服务链的构建、部署、执行和优化。与地理信息服务网络类似,地理信息服务的协同也参考了大量其他领域的协同的相关研究。除了基于已生成的地理信息服务网络构建服务链实现服务协同外,还有基于工作流编排,人工智能规划等方法的服务协同。

3.1 地理信息服务协同的构建方法

服务协同的构建目的是将地理信息服务连接成为地理信息服务链。地理信息服务链是地理信息服务的序列,对于序列中相邻的服务对,前一个服务行为的产生是后一个服务行为产生的必要条件[70]。根据设计过程中用户对服务链的控制程度,可以将服务链分为用户自定义(透明)服务链、工作流管理(半透明)服务链和集聚服务(不透明)链3种类型。

服务链构建的重点是服务的组合,强调基于服务之间逻辑顺序的协同工作,实现对复杂问题的求解[71]。基于服务组合的理论基础和构建方式,服务的组合方法分类标准不尽相同,但从服务组合的解决方案来看,广义上可以分为静态服务组合与动态服务组合[72-73],见表1。

表1 服务组合的类型,方法和特点

3.1.1 静态服务组合

静态服务组合模式通常以工作流技术为基础构建工作流管理(半透明)服务链,在服务组合模型的设计阶段确定服务的组合流程。文献[74]在工作流的参考模型和空间信息服务的架构与互操作模型的基础上提出基于工作流的空间信息服务模型、空间信息服务组合引擎的体系结构,并在矿产资源评价应用中实现了组合案例;文献[67]采用BPEL语言描述工作流业务流程,以暴雨洪灾模型开展建模实例分析,验证了基于工作流技术的地理信息服务链构建地学模型的可行性。在此基础上,基于本体思想的补偿服务[75]、基于Petri网的理论[76]、基于策略的多Agent服务容错模型[77]等研究进一步提升了基于工作流构建服务组合的准确性和容错性。尽管基于工作流技术静态构建的服务链具有业务逻辑与应用逻辑分离,处理效率较高的优点,但其扩展性较弱,也无法根据实际变化动态调整服务链,异常处理能力差。

3.1.2 动态服务组合

动态服务组合模式主要以聚集服务的形式,通过服务语义来使计算机代替专业人员,根据用户的操作需求及相邻服务的语义关系[78],在运行过程中发现和调用服务。动态服务组合的方法大致可分为基于领域本体的服务组合、基于人工智能规划的服务组合和基于网络结构的服务组合。

基于领域本体的服务组合通过对领域内的概念及概念间的关系进行精确定义,构建用户与系统之间相互理解的基础,实现对领域本体之间的服务的关系的推理,达到构建服务链的目的[79]。例如,文献[80]引入地理领域本体,基于语义接口匹配构建地理信息Web服务动态组合框架,以服务之间接口描述的语义相似度作为服务之间接口的匹配度,实现了以用户任务需求为目标的空间信息服务链自动生成算法。基于领域本体的服务组合方法能够提高服务组合的智能化和准确度,但要求用户具备较全面的领域知识。同时,基于语义推理的服务搜索效率不高,跨领域、通用性的本体缺失,降低了该方法的实用性[71]。

基于智能规划的服务组合是将服务组合看作一个AI规划的行为,利用AI规划中的模型和公理,基于服务的输入/输出参数与状态信息,动态生成符合需求的服务组合。基于智能规划方法具有良好的动态性和智能性,文献[81]认为基于智能规划的服务组合能有效地将异质异构数据与服务的语义集成和共享,实现服务动态组合与运行;此外,文献[32]基于云计算和Agent智能体的方法显著提高了分布式云环境中地理信息服务链的构建效率;文献[2]等提出了一种多智能体人工智能规划方案,将服务组合任务委托给CSW服务,通过添加新的CSW服务,服务组合执行时间显著减少。但是,这种模型的开发难度较大,服务搜索效率较低,因此当前此类组合的范围和规模都较小[2,32]。

与前两者方法不同,基于网络结构的服务组合是通过已构建的服务网络,提取符合用户需求的可执行路径生成服务链。文献[82]将Web服务及其关系建模为一个复杂的网络,应用图搜索算法来实现Web服务自动化组合,展现出该方法的高效和灵活性;文献[51]通过试验验证了对大规模的Web服务构建复杂网络模型和推荐服务链方法的可行性,同时通过计算网络中不同结构下Web服务组合的QoS值,实现了根据属性值推荐服务链。在地学领域中,文献[83]借鉴超图模型在多元关系表达中的优势,定义了地表变化检测服务关系超图,有效表达了服务间的多元关系,基于推理规则实现了服务链的按需生成。此类服务组合的优势是,只需要在已有的服务网络中查询服务节点和服务间关联关系,有助于提高服务链按需生成的效率。

3.2 地理信息服务协同的优化

地理信息服务协同的优化是从服务集合中选择最合适的服务组合,使组合后服务链整体性能最优。服务链的优化策略包括构建过程中的静态优化和执行过程中的动态优化[84]。

服务链的静态优化是服务链执行的重要基础,可分为局部优化和全局优化[85],优化方法如图2所示。局部优化对服务链中每个抽象原子服务依次从各自候选服务集中选择QoS最优的服务组件[71],局部优化仅针对每一个服务节点选择该节点的最优服务,无法保证在全局上满足执行要求。全局优化通过计算服务组件组合整体的QoS值,选择候选服务组合中QoS最高的组合,以确保服务链整体性能最优。由于服务链全局优化考虑多个QoS目标(例如响应时间、可靠性、数据质量等),是一个典型的多目标优化问题,难以在可接受时间内得到最优解,因此一般使用启发式算法寻找近似最优解。常用的全局优化算法有遗传算法[86-87]、粒子群优化算法[88-89]和蚁群算法[90-91]等。在服务数量较大时,近似全局优化的时间复杂度、不同领域间的通用性以及对环境的适应性等方面还需进一步研究[92]。服务链静态优化基于历史量测信息,还不能准确反映服务链执行时的服务状态[93]。

图2 服务链的静态优化

动态优化策略是通过动态监控服务链运行过程中QoS异常变化情况进行重新规划,确保服务链能在满足QoS约束的状态下顺利执行,如图3所示。

图3 服务链的动态优化

针对服务组合运行阶段的性能分析与优化问题,文献[94]提出了一种基于数学分析的组合服务性能模型、性能分析及优化方法,介绍了遗传算法优化服务选择的优越性;文献[95]提出了一种结合随机逼近和策略迭代的在线优化算法增强服务组合的环境自适应性。

如果出现服务组合异常,则需要在动态优化的过程中进行服务替换。文献[96]提出了一种基于改进模拟退火算法的QoS动态服务组合方法,实现了QoS达到临界值时的局部替换和环境变更时的动态重组;文献[97]基于ECA规则对BPEL语法进行扩充,设计多种GIS服务链异常处理与恢复策略;文献[72]提出一种时空优化的空间信息服务组合重规划方法,满足了动态变化的云环境中空间信息服务的准确替换和失效服务组合的快速修复。

针对基于网络构建的服务链,文献[53]设计了基于动态匹配网络的云制造服务组合自适应机制,将对最优服务组合的构建转化为对服务复杂网络性能的优化,实现了服务组合的动态自适应。这表明,通过感知服务网络上下文结构进行路径替换处理异常,能够满足服务链的动态优化需求,具有发展潜力。

4 总结与展望

大量在线的地理信息服务降低了用户获取和处理空间数据的门槛。地理信息服务的一个重要发展方向是构建多层次、面向语义关联关系的地理信息服务网络,支持上下文动态感知的地理信息服务协同,将功能简单、部署分散、难以理解的单个地理信息服务,构建成复杂且易用、耦合但不固化的智能协同服务。相关理论与技术仍亟待深入,面临的难题与挑战有:

(1)完善的地理信息服务表达体系结构,建立全面的地理信息服务语义描述及形式化表达。大量的地理信息服务以局部自治的孤岛存在,结构形式特征各异,且规模庞大,需要一个全面的标准,对不同的地理信息服务进行统一的语义描述,使不同或相同的服务之间能够进行横向对比,增强对服务实体本身的选择能力。

(2)通过语义关联形成多层次,动态的地理信息服务网络。地理信息服务网络的建立能将服务之间的关联性利用起来,为服务智能组合与协同提供基础。当前地理信息领域还没有将多源异构的地理信息服务组合成复杂网络,大多的关注点仍集中在服务链的构建与优化。如何通过地理信息服务之间的关系推理,支持服务网络分析、监测、与更新等保持服务网络的动态性也缺乏相应成果。如何构建多层次、动态的地理信息服务网络,需进一步探讨。

(3)如何实现地理信息服务协同?通过组合地理信息服务,将简单的服务组合成复杂的应用模型是推动地理信息服务发展的需求。研究如何基于地理信息服务网络构建智能化,自动化的地理信息服务协同,既需要服务网络的可靠性作为基础,也需要借鉴其他服务协同的技术,取长补短。

猜你喜欢
服务网络语义协同
家校社协同育人 共赢美好未来
蜀道难:车与路的协同进化
语言与语义
“四化”协同才有出路
浅谈新形势下县级图书馆如何做好阅读推广工作
构建江门地区公共图书馆服务网络模式的思考
服务网络协作模式下中小物流企业间利益分配研究
批评话语分析中态度意向的邻近化语义构建
三医联动 协同创新
“社会”一词的语义流动与新陈代谢