基于GeoSOT的文旅数据编码方法

2024-02-20 01:21苗茹袁欢周珂张俨娜杨阳
科学技术与工程 2024年2期
关键词:经纬度剖分文旅

苗茹, 袁欢, 周珂*, 张俨娜, 杨阳

(1.河南大学计算机与信息工程学院, 开封 475004; 2.河南省空间信息处理工程研究中心, 开封 475004; 3.河南大学实验室与设备管理处, 开封 475004)

随着人们生活质量的提高,旅游消费快速发展,旅游规模越来越大[1],促使旅游信息数据急剧增长。文化与旅游的结合实现了传统文化的有效传承和发扬,可以更好地推动国家经济发展[2]。“四川省文化和旅游资源云”[3]在2020年正式上线,其资源云里共有文化资源271.02万条,旅游资源数据24.55万条,文字记录约4.5亿字,照片约300万张,视频约1.4万部。山西省文化旅游资源丰富,其中拥有570个历史遗迹类,1 198个人文活动类旅游资源和2 644个文化旅游资源单体[4]。研究多元文旅大数据管理技术,对于提升文旅资源管理能力具有重大意义。文旅大数据是利用计算机信息技术,将文化产业与旅游业内多来源、多类型的数据进行收集和加工整理,通过有效分析,科学揭示数据内在发展规律和社会公共价值的一类数据[5]。面对海量的文旅资源数据,对数据的高效管理已经成了亟需解决的问题[6]。林仁状[7]认为文旅数据研究处于起步阶段,数据来源广泛、杂乱,不同数据源收集方对于数据收集的标准不同,缺乏统一的规范化制定和管理。吴爱云等[8]对吉林省文化旅游资源大数据平台建设研究中,指出了文旅信息数据尚未整合、数据库资源利用率不高等管理问题。孙红蕾[9]对文旅大数据的复杂性、无序性和异构性等问题,将多源异构的数据转化成结构化的数据,使文旅资源数据得到规范化组织管理。由于数据的来源不同,类型不同,其存储方式也不尽相同,对不同的数据有不同的组织管理方式。面对多而杂的数据,需要提供一个统一的框架来组织管理这些数据。这个框架不仅要满足文旅资源数据的离散性地理空间特征和多尺度性,还要使数据得到高效组织。由程承旗等[10]提出的基于2n及整型一维数组的全球经纬度剖分网格(geographical coordinates subdividing grid with one dimension integral coding on 2n-tree,GeoSOT),可以为文旅资源数据的统一组织管理提供可行的解决方案[11]。目前,有许多科学研究者运用GeoSOT剖分网格方法进行了相关领域的研究。金安等[12]针对不同平台的编码规则不一致问题,提出了基于GeoSOT剖分网格的编码方法,试验验证并有效地提高编码的空间数据检索效率。廖永丰等[13]针对大量的多元灾害信息数据,利用GeoSOT剖分网格模型,提出了“空间面片”的方法,解决了灾害数据的检索管理问题。宋树华等[14]利用GeoSOT剖分网格对不动产单元进行编码,解决了普通编码产生的空间位置信息不确定的问题。刘永杰等[15]利用GeoSOT全球剖分网格,构建了一套全国林地数据的编码模型,解决了多源林地空间数据的统一区位组织和集成管理问题。田方杰等[16]利用GeoSOT全球剖分网格,针对个人照片的数据量增多的问题,提出了结合GeoSOT编码的一种新的照片标识方法,解决了照片查询速率慢的问题。

现对海量的文旅资源数据,提出GeoSOT剖分网格方法,利用GeoSOT剖分网格对文旅资源数据编码,提供一个统一的数据组织管理方法,通过对这些数据的有效管理,提升对文旅资源数据的管理以及检索效率。

1 文旅资源数据的剖分

1.1 文旅资源数据概况

文旅资源所涉及的数据有遥感影像数据、基础地理数据、文化资源数据、旅游资源数据[17]、文本信息、图片、视频数据。这些数据来源广泛,类型多样,结构复杂,存储方式各不相同。

文旅资源数据按照格式可分为栅格数据、矢量数据和报表数据。其中,栅格数据(遥感影像数据)采用影像数据库进行组织管理;矢量数据(基础地理空间数据)一般采用标准分幅和行政区划组织管理;文化资源数据和旅游资源数据等报表类型数据,需要使用关系数据库进行组织管理;旅游资源图片和视频数据采用的是文件形式进行存储,其他的一些数据用数据库进行存储管理。对于不同类型的数据,数据的组织方式不相同,无法达到统一组织管理,增加了检索时间,降低了检索效率。GeoSOT剖分网格提供了一个统一的数据组织框架,使各种不同类型的数据得到统一的组织管理,便于数据存储和检索。对于遥感影像数据,通过遥感数据覆盖的空间范围区域,对该区域进行GeoSOT编码,建立以该区域位置为主的遥感数据统一组织机制[18]。经过对文旅资源数据的分析,采用GeoSOT剖分网格为数据的统一组织框架,其数据组织方式如图1所示。

图1 文旅资源数据组织方式Fig.1 Data organization of cultural and tourism resources

1.2 文旅资源数据剖分方案

GeoSOT剖分网格是由北京大学程承旗等[19]提出的,是一种等经纬度,严格等四叉树递归剖分的网格模型,网格中心点是赤道与0°经线的交点。为了保证能够使GeoSOT网格实现均分,达到整度、整分和整秒的目的,将地球的经纬度坐标扩展了3次:将第一次的360°×180°扩展成512°×512°,第二次将1°扩展成64′,第三次将1′扩展成64″,如图2所示。经逐级向下四叉树剖分,生成32级编码,其编码采用一维四进制方式,每一个四进制位代表不同的层级,编码方式采用Z序顺序编码[18]。第32级的网格尺度大小是1/2 048″×1/2 048″,其在赤道附近的尺度达到1.5 cm。GeoSOT剖分网格能够实现上至全球,下至厘米级的全球区域覆盖。不同类型的文旅资源数据,根据目标进行不同的分类组织,采用统一的剖分方案,达到组织管理的目的。

图2 GeoSOT网格编码规则式Fig.2 GeoSOT grid coding rules

(1)遥感影像数据剖分。近年来,遥感技术发展迅速,因其高效、大面积观测和实时的优点[20],多源遥感数据广泛应用于多种场景中。对一景遥感影像数据,由影像数据的空间分辨率特性,确定GeoSOT的剖分层级。由遥感数据覆盖GeoSOT剖分面片空间范围,遥感数据的空间地理坐标对应GeoSOT剖分面片的地理坐标,对遥感数据使用GeoSOT网格剖分面片空间范围进行“虚拟划分”[21],将遥感数据映射到GeoSOT剖分面片中,通过GeoSOT剖分网格建立与空间位置的区位联系。

(2)基础地理数据剖分。基础地理数据包含行政区划等信息,行政区划关联经纬度信息和位置信息,根据经纬度信息直接使用GeoSOT剖分网格对其进行组织管理。

(3)报表类型数据剖分。报表类型数据主要是文旅资源信息统计数据,包括文化资源数据,旅游资源数据,文本信息等数据,记录了文旅资源信息的名称,用以表示对空间位置的关联,但是没有存储经纬度坐标信息。为了使用GeoSOT模型管理报表数据,需要将报表数据与空间信息进行关联。《中华人民共和国文物保护法》规定[22],县级是文物保护的基本统计单位。所以在统计报表数据的字段内,应包含县级行政区名称、地理空间范围经纬度和GeoSOT空间面片编码。为实现对文旅资源数据统计管理,GeoSOT剖分网格的最小空间尺度必须小于县级行政区域的空间尺度,才会实现对空间区域的全覆盖。 如河南省开封市城摞城新郑门遗址,它的门址平面呈长方形[23],南北长度约160 m,东西宽度约100 m。21级的GeoSOT剖分层级,它的网格尺度大小是32 m,可以实现对该片区域的全覆盖。所以,可以将GeoSOT模型划分为21层级,网格覆盖1″空间范围,32 m的网格尺度大小完全可以满足文旅资源数据组织的需要。

(4)音频、视频数据剖分。这类数据采用二进制文件的形式存储在数据库中,数据库中通常会存储这些文件的指针或元数据。为了能使GeoSOT剖分网格管理这类数据,在数据库中添加GeoSOT字段。

2 文旅资源数据编码方法

2.1 文旅资源数据编码流程

在对文旅资源编码中,编码流程如图3所示。

图3 GeoSOT编码流程Fig.3 GeoSOT coding process

由于GeoSOT编码具有对空间位置的唯一区位标识,使用GeoSOT编码来标识全球地物的空间范围。结合GeoSOT的编码方式和文旅资源编码要素属性对文旅资源数据进行统一编码。在GB/T 18972—2017旅游资源分类、调查与评价[17]中,把旅游资源分为3个层次:主类、亚类和基本类型。

主类分为地文景观、水域景观、生物景观、天象与气候景观、建筑与设施、历史遗迹、旅游购品和人文活动;亚类是旅游资源的第二级目录,包括实用建筑与核心设施,景观与小品建筑和物质类文化遗存等。基本类型是按照旅游资源分类标准所划分的基本单位,是最小的文旅资源分类标准单位,包括建筑遗迹,独立场所和纪念地与纪念活动场所等。亚类和基本类型按照此分类表进行分类。为了凸显文化在旅游资源中的价值,突出文旅资源的重要性,同时体现出空间的特点,故选取了与空间有直接关联的主类:建筑与设施和历史遗迹,在这两大类基础上进行细分,如表1所示,表中前面的数字即为分类代码。主类作为关键属性、亚类作为次关键属性,确定文旅资源分类面。

表1 文旅资源分类表[17]Table 1 Classification table of cultural and tourism resources[17]

2.2 文旅资源数据编码结构

文旅资源数据的编码由GeoSOT剖分编码、旅游资源主类代码、亚类代码、基本类型代码、顺序码和校验码组成。GeoSOT剖分编码由21位数字组成,是四进制一维编码,第一位用字母G表示,代表全球,后面20位数字用四进制数表示,每一位数字代表不同的层级;主类和亚类代码分别由两位阿拉伯数字构成,构成代码为01~99;基本类型代码由3位数字组成,为001~999,最大值999完全可以覆盖所有的亚类下的景点;顺序码由4位数字构成,为0001~9999,用于表示基本类型下的资源序列;校验码[24]是由一位数字组成,用以检验该编码的正确性,运算规则这样定义:首先,把每一位编码转换成对应的ASCII码;然后,将转换后的ASCII码与自己对应的数字相乘,得到计算码,将每个计算码相加求和;最后,再将计算出来的结果与9取余数,得到校验码0~9,通过以上的运算步骤,可以得到一位校验码。文旅资源编码示例如图4所示。

图4 文旅资源数据编码示例图Fig.4 Example diagram of data encoding of cultural and tourism resources

2.3 文旅资源数据编码算法伪代码

输入带有度分秒形式的经纬度,截取每一部分单独运算,得到GeoSOT编码,主要代码如下。

def LngLatSegments(dms): //输入经纬度

list = re.split(‘[°′″]’,dms)

D = int(list[0].strip(‘ ’))

M = int(list[1].strip(‘ ’))

seconds = float(list[2].strip(‘ ’))

S = int(seconds)

dotSeconds = (seconds-S) * 2048

S11 = int(round(dotSeconds))

half = list[3].strip(‘ ’)

if half ==“S” or half == “W”:

G = 1

elif half == “N” or half ==“E”:

G = 0

else:

print(“输入经纬度错误\n”)

return G<<31|D<<23|M<<17|S<<11|S11

由GeoSOT编码和主类代码、亚类代码、基本类型代码、顺序码和校验码得到整个文旅资源数据的编码,代码如下。

for i in range(len(tourism_list)):

a = mainClass_list[i]

print(a)

print(a1)

b = subClass_list[i]

b1 = str(b).split(′:′)[1].split(′″)[1]//得到亚类

c = basicType_list[i]

c1 = str(c).split(′:′)[1].split(′″)[1]//得到基本类型

d = seqCode _list[i]

d1 = str(d).split(′:′)[1].split(′″)[1]//得到顺序码

e = checkCode _list[i]

我们在计算铣刨重铺措施中相应的车轮碾出痕迹的深度时,运用的是数理统计方法计算重铺范围的深度,由此可知,车轮碾压的痕迹深度RD≥18mm时,可以使用铣刨冲铺措施。2.2.3 路面结构层中面层的构造技术标准

e1 = str(d).split(′:′)[1].split(′″)[1]//得到校验码

Tourism.objects.create(tourismId=totle, mainClass=a1,subClass=b1,basicType=c1,seqCode=d1, checkCode=e1)//往数据库中存储每个字段编码

totle = GeoSOT_Code + a1 + b1 + c1 + d1 + e1//

拼接所有代码得到文旅资源数据编码

print(totle)

基于GeoSOT文旅资源的编码模型,对河南省开封市龙亭区城摞城新郑门遗址进行编码研究。城摞城新郑门遗址中心点的经度坐标:114.317 502,纬度坐标:34.800 066,转换成度分秒的格式是:114°19′3.007 2″E,34°48′0.237 6″N。它所对应的GeoSOT剖分编码是G00131003023001100001。该遗址是历史遗迹,主类代码为02;是历史遗迹下的物质类文化遗存,亚类代码是01;基本类型代码是001,顺序码是0001,代表基本类型下的资源序列为1;校验码为4。因此该遗迹的编码为G00131003023001100001020100100014。

3 文旅资源数据管理系统设计

3.1 文旅资源数据库组成

文旅资源数据传统管理方式多以文本或记录的方式,无法将更多的信息进行有机的关联,通过目标本身所携带的位置属性信息,完成各类数据基于空间信息的一致性编目,可以实现多源数据的有效关联。其中,空间信息里的基础地理信息数据主要是提供基础性数据,作为遥感影像的底图形式存在,设计各个空间数据图层的属性结构[25],包括交通分布图、水系分布图和行政区界等基础性地理数据。数据库的主要内容如表2所示,文旅资源数据库表之间的关系如图5所示。

表2 文旅资源数据库Table 2 Database of cultural and tourism resources

图5 文旅资源数据库表关系图Fig.5 Table diagram of cultural and tourism resource database

3.2 文旅资源数据信息查询检索

将以上数据存储在数据库中,需要在数据库中进行检索,检索流程如图6所示。

图6 文旅资源数据在数据库检索过程Fig.6 The process of cultural and tourism resource data retrieval in database

文旅资源数据在数据库进行检索的过程中,首先使用GeoSOT剖分网格定位到相应的层级,在本文中使用的GeoSOT剖分网格有21级,定位到的空间面片大小是32 m,即所显示的是一个32 m×32 m的区域。再根据选择的空间区域范围,判断GeoSOT网格是否小于空间范围。再用空间范围中心点编码检索GeoSOT剖分面片数据表,选择合适的GeoSOT剖分面片层级。判断中心点编码前n位是否与GeoSOT编码相同,相同即可进入第二次经纬度匹配。

当匹配到经纬度时,输出相应的GeoSOT编码,GeoSOT编码关联所在空间位置信息表和文旅资源概况表,文旅资源概况表包含遥感影像信息,列表显示文旅资源的经纬度信息、GeoSOT编码和信息简介,影像地图(图7)展示该文旅资源所在的位置情况。

图7 文旅信息记录截图Fig.7 Screenshots of cultural travel information recording

3.3 检索结果

根据上述检索方式,检索结果如图7所示。图7中的列表显示查询到的文旅资源数据记录,同时在查询结果列表中同步显示相关数据的部分重要属性字段。结果表明:GeoSOT编码既可以关联文旅属性信息,也可以关联空间信息,实现对文旅资源数据的有效组织管理。

4 结论

采用了GeoSOT剖分网格模型对多元文旅资源数据进行了有效组织管理,解决了文旅资源数据来源广泛,类型多样,结构复杂,缺乏统一组织管理的问题。得出如下结论。

(1)GeoSOT是一种剖分网格框架,它将地球划分成等网格、等尺度,是一种等经纬度,严格等四叉树递归剖分的网格模型。GeoSOT能够为数据提供一个新的组织方式,解决数据组织不统一的问题。

(2)通过对多元文旅资源数据的组织、剖分、编码和检索方式的设计,实现了用GeoSOT编码关联文旅资源数据,可以正确有效地检索到文旅资源数据,能够提供索引需求。

使用GeoSOT剖分网格模型对多元文旅资源数据的统一组织管理进行了研究。但同时也存在一些问题,GeoSOT剖分网格模型会将地球剖分成大量的网格,这可能会导致数据的过度细化,使得存储和处理大规模数据变得复杂和耗时,下一步将对文旅资源数据的存储方法进行研究,以其能够利用最小的存储空间提供更多的数据存储,使得数据得到更加有效的管理。

猜你喜欢
经纬度剖分文旅
乘风破浪的日照文旅
文旅融合,从无到无限大
基于重心剖分的间断有限体积元方法
安东:东方的幽静文旅之乡
基于经纬度范围的多点任务打包算法
二元样条函数空间的维数研究进展
文旅照明的兴起
自制中学实验操作型经纬测量仪
澳洲位移大,需调经纬度
一种实时的三角剖分算法