于贵华 杜克平 徐锡伟* 吴熙彦 王 银
1)中国地震局地质研究所,活动构造与火山重点实验室,北京 100029
2)北京师范大学地理学与遥感科学学院,北京 100875
3)宁夏回族自治区地震局,银川 750001
地震是破坏性大、对人类生存安全危害最严重的突发性自然灾害,活动断层是地震灾害之源。活动断层探察是为达到有效减轻地震灾害的基础性行业科研工作。如何科学、快速地存储、管理共享活动断层探察过程中所获得的大量科学事实数据,使其在地震灾害防御、地震应急响应、地震监测、地震预测、现今大陆动力学研究、地震科技服务等方面充分发挥其基础数据的作用,是随着活动断层探察工作的开展而亟待解决的重要问题。
国际上已建成了一些信息较全、开放性、便于使用的活动断层数据库。如美国地质调查局在互联网上公布了2010年11月3日更新的全美范围内的、最新的、多种方法确认的或推测的第四纪活动断层、褶皱汇编数据库①美国地质调查局活动断层数据库:http:∥geohazards.usgs.gov/cfusion/qfault/,2012.08.16。(Haller,2003;Kathleen et al.,2004);新西兰地质与核科学学院(GNS)建成了新西兰活动断层数据库②新西兰活动断层数据库:http:∥data.gns.cri.nz/af/index.jsp,2012.08.16。。这些数据库存储了活动断层调查的相关数据,包括断层的分段形态、野外测量特点、槽探信息、年代测试结果等。同时存储断层重复活动的平均时间间隔,断层滑动速率和最后一次活动时间等信息,用户可通过网站(http:∥data.gns.cri.nz/af/index.jsp,2012.08.16)对活动断层图形、断层性质、地震重复间隔、最近地震事件、滑动速率、地震的位移量等信息进行查询。日本活动断层研究中心(AFRC)也在网站(http:∥riodb02.ibase.aist.go.jp/activefault/index_e.html,2012.08.16)上发布了包括日本活动断层几何学和古地震相关研究结果信息的数据库。总之,随着地球科学及计算机科学的不断深入发展,国际上的发达国家均已建立起一些开放的、便于使用的活动断层数据库。
中国在1996年初步建成了第一个单机版的活动构造数据库(于贵华等,1996),基于国家“十五”重点科学工程《中国数字地震观测网络项目》6个业务系统之一的《中国地震活动断层探测技术系统》即“活断层探测与地震危险性评价”分项工程等工作的开展,以福州市活断层信息管理系统(于贵华等,2006)为首,中国相继建起了一系列活动断层数据库(柔洁等,2008;刘娜等,2009;葛孚刚等,2011)。在“中国地震活动断层探测技术系统”项目建设过程中,在基于ArcGIS的地震活动断层多源数据组织与管理等方面进行了一系列有益的探索(葛伟鹏等,2006;李策等,2008)。然而,由于多数城市活动断层信息系统的建设滞后于城市活动断层探测工作,且多数数据库系统建设人员对活动断层探测工作体系及活动断层数据库模板理解不够深入,对不同来源数据坐标系统存在差异的数据转换工作不恰当,数据库关联关系复杂、不易查找使用等多种原因,造成部分城市的活动断层数据库与活动断层探测研究成果不配套,从数据库中输出的成果图件与实际研究成果不符等问题。针对上述一系列问题,进一步强调活动断层数据库建设要与活动断层探察工作同期开展,合理优化调整数据库模板和成果制图模板,加强数据库工作培训与检测等一系列措施,以保障活动断层数据库建设的及时性、准确性与可用性,为数据共享、服务社会奠定基础。
活动断层是晚第四纪以来有过活动、未来仍有可能活动的断层[DB/T 15-2009]。活动断层探察的目标是查明断层的活动性、活动参数、空间展布及深部构造特征。活动断层探察的工作体系可分为前期准备、野外探察、分析总结等3大阶段,每一阶段数据库建设的侧重点有所不同。为方便数据库模板使用,在要素集命名时增加了2位标识其在入库工作流程中位置的前缀,第1位字母表示入库阶段,第2位数字表示每一工作阶段中的入库顺序。以A开头的部分主要存储项目准备阶段所需填写的主要内容和部分资料的录入条目,包括调查区、遥感资料、地球物理资料、工作区先期资料图、地震资料;以B开头的部分主要存储项目实施过程中野外获得的各项数据和资料信息,包括地质调查图、地貌调查、钻孔资料、样品资料、地球物理、地球化学;以C开头的部分主要存储地震危险分析资料和成果图相关信息,包括地质平面图、剖面图和绘图信息等;以其他字母开头的部分主要存储项目过程中各类成果资料、原始资料、文档数据等的信息。这样使得初接触数据库模板的建库人员也可以很轻松地找到各工作阶段所要使用的要素类模板(图1)。
前期准备阶段主要是各类资料的收集,包括文章、报告、地形图、各类地质图、高分辨遥感数据及其解译,野外踏勘与野外工作底图编制等工作。针对这些工作,设计了活动断层调查地区、基础地理、遥感、地球物理场、地震、工作底图等要素集与调查区的面状资料关联表、文献资料库、台站与小震波形数据关联表、强震与地表破裂关联表、小震波形数据记录表等属性表(图2)。
图1 活动断层探测各阶段与数据库模板、制图模板对应关系图Fig.1 Diagram showing the stages of active fault detection,and the corresponding database template and mapping template.
在活动断层调查地区要素集中,针对活动断层探察工作的不同研究范围设计了面状资料图层,用于存储收集到的各类已有面状资料,工作区、目标区、主要活动断层填图区等面状图层;在基础地理要素集中,针对工作区、目标区、主要活动断层填图区不同的工作底图需求设计了1/1万、1/5万、1/25万3种比例尺的基础地理要素集,其中1/5万、1/25万基础地理要素集组成方法参照国家测绘地理信息局发布的国家地理信息数据库标准设计;在遥感要素集中,针对高分辨遥感数据收集及其解译工作的需要设计了影像索引表、航卫片解译线、航卫片解译面等要素图层;在地球物理场要素集中,针对地球物理场资料的收集与分析工作内容设计了水平形变、垂直形变、地壳厚度、重力场、航磁、重磁解译线等要素图层;在地震要素集中,针对地震资料收集与小震重新定位分析等工作的需要设计了1970年以前强震、1970年以来地震目录、地震台站、震源机制解、小震重新定位目录等要素图层;在工作底图要素集中设计了1/1万、1/5万、1/25万3种比例尺的地层、岩体、地质调查规划要素图层。
在这个阶段的数据库建设中要特别注意不同来源数据的坐标系统、投影方式等信息,做好数据转换工作以保障数据库是在同一参考系统下建设。并完成基于已收集资料库的野外工作底图的编制工作。
图2 前期准备阶段数据库模板Fig.2 The database template of the preparatory stage.
野外探察阶段的主要工作包括地质地貌调查与测量、样品采集、钻探、槽探、地球物理探测、地球化学探测等。针对这些工作,我们设计了地质调查、地貌测量、钻探、样品分析、地球物理探测、地球化学探测等数据集,在地质调查数据集中设计了地质地貌调查观测点(可细化为断层观测点、地层观测点、地貌观测点等)、探槽、活动断层、地貌(含地震地表破裂)、地质剖面、重点地名地物等图层要素,并设计了地质调查工程表、地貌与地质调查点关联表、地貌与地震地表破裂带关联表、探槽古地震事件、断层段古地震事件与探槽关联表、断层段古地震事件、探槽与采样工程关联表等属性表(图3);在地貌测量数据集中设计了地貌测量基站点、地貌测量(点、线、面)、地貌测量切线等图层要素,及地貌测量工程属性表;在钻探要素集中设计了收集钻孔点、钻孔点、跨断层钻探剖面线、跨断层钻探断点等图层要素,及钻探工程属性表;在样品数据集中设计了采样点层要素,及采样工程表、样品数据表、样品测试结果表等属性表;在地球物理探测数据集中设计了地球物理测点(含起点、拐点、终点、炮点)、地球物理测线(含收集测线及探测测线)、地球物理探测断点等图件要素,及地球物理探测工程表、地球物理探测数据表等属性表;在地球化学探测数据集中设计了地球化学测点、地球化学测线、地球化学探测异常点、地球化学探测异常区段等图层要素,及地球化学工程表、地球化学探测数据表等属性表。
此阶段的数据库建设宜在野外活动断层探察同期开展,可以对野外工作提供及时的数据可靠性检测,及早发现问题、解决问题,提高野外工作质量。数据库建设中必须注意野外数据采集设备的坐标系统设置,保障数据入库的数据参照系的一致性。并完成基于活动断层数据库的野外实际材料图的编制工作。
图3 野外探察阶段的数据库模板Fig.3 The database template of the field exploration stage.
分析总结阶段主要是处理地球物理、地球化学探测数据,分析隐伏断层的断点位置,研究活动断层的深部构造环境及深浅构造关系等;对野外探测时采集的样品进行分选、测试;总结地质调查测量工作成果,绘制成果图件;编制分析钻孔及钻孔联合剖面图,分析地层层序及沉积旋回、编制分析槽探剖面图,分析相关古地震事件及计算获取断层活动运动学参数;分析活动断层地震危险性等。针对这一阶段的主要工作,设计了1/1万、1/5万、1/25万3种比例尺的地质数据集、辅助制图数据集、地震危险性分析数据集、成果图件表、成果报告表、大数据文件表、图像档案表、原始档案表、报告档案表、内部数据表等一系列属性表(图4)。
图4 分析总结阶段的数据库模板Fig.4 The database template of the summing up stage.
在地质数据集中针对活动构造分析研究及成果图编制需求,设计了断层、褶皱、盆地、地貌(点、线、面)、地层等厚线、地层(线、面)、岩体(线、面)、隆起等图层要素;在辅助制图要素集中设计了用于存储地层剖面图信息的地层、断层、地层接触关系、地层描述面等图层要素,及制图辅助点、线、面、注记、接图表分幅图框等辅助制图要素,用于记录野外工作底图、实际材料图、活动断层填图、活动断层分布图、区域地震构造图等成果图件成图时的一些辅助信息。地震危险性分析数据集中主要设计了用于存储断层地震危险性分析结果的地震区、带,潜在震源区分布、地表强变形带预测、断层避让带等图层要素。
这一阶段的数据库建设过程中首先要完成野外探测阶段后续的室内分析成果,包括野外观测、测量成果图件、说明文本、样品测试成果、古地震分析成果等信息的入库工作;并根据分析结果最终修订活动断层的几何位置、编制断层分布图及区域地震构造图,处理成果及文档数据、最终完成相应活动断层数据库建设工作。
活动构造数据库建设一直以数据量大、工作繁琐,且由于多数活动构造数据具有空间特征,在数据库建设中必不可少的需要使用地理信息系统软件,这使得地球科学专业人士常感到棘手而不愿参与活动构造数据库建设,但是若仅由非地球科学专业的计算机从业人员完成全部活动构造数据库建设,会因其活动构造等专业知识不足,而导致出现数据质量问题。为了解决这一难题,我们将数据库模板以ArcGIS格式(图5)、Excel格式(图6)、数据字典等3种方式给出,其目的在于使开展活动断层探测的专业人员可通过数据字典了解活动断层数据库的相关要素集、要素类内容及含义,并轻松地在Excel格式数据库模板中填写活动断层探察相关的专业信息,然后由数据库建设人员完成关联关系、数据组织等内容的建设,再利用数据库批量入库软件(图7)完成数据入库工作。
图5 以ArcGIS格式给出的活动构造数据库模板Fig.5 The active tectonic database template in ArcGIS format.
图6 以Excel格式给出的数据库模板Fig.6 The database template in Excel format.
活动构造数据库批量入库软件的主要功能包括:规范要素ID,导入档案数据,检测并处理填入Excel格式模板上的数据的格式、逻辑关系等,将填入Excel格式模板上的属性数据信息导入ArcGIS数据库中,给出运行日志及数据检查报告,便于错误定位及进一步修改完善数据库。该入库软件的使用大大降低了入库操作的难度,数据库入库人员可以不再去考虑数据库中的许多命名规则、规范标准等,直接以地学工作者熟悉的方式在Excel表中填写各类探测工作、构造几何学、运动学信息,命名及数据的规范化均由入库软件统一处理,从而显著提高了活动构造数据的入库效率和质量。
活动构造数据库建设的特色是:将活动构造数据库建设的专业知识入库工作化简为在Excel上填写专业信息表格,使得具有地球科学专业知识的活动断层探测工作者可以直接参与数据库建设,因此可达到保障数据库的专业数据质量的目的;同时,与活动断层探察同期开展数据库建设有可能及时发现问题,分析出现数据不一致性等问题的原因,确定问题是出自基础数据资料投影,还是GPS设备系统偏差,或是野外探测操作流程、室内数据处理流程等,进而有针对性地及早解决问题,最终可达到提高项目整体工作质量的目的。
数据质量的优劣是一个相对概念,并具有一定的针对性。衡量其优劣主要有以下几个指标:误差、数据的准确度、精度和不确定性。数据质量是数据整体性能的综合体现。
图7 活动构造数据库批量数据入库软件界面Fig.7 Graphic user interface(GUI)of batch data input software for active tectonic database.
数据是数据库的“血液”,是组成数据库的重要元素。数据质量的优劣是活动构造数据库成功与否的关键,直接影响到活动构造数据库的经济效益和社会效益,决定了活动构造数据库应用的价值。活动构造数据库具有空间特性、数据多源性、科学事实性等特征,因此在活动构造数据库中必然包括空间数据、属性数据、空间数据之间的关系以及空间数据与属性数据之间的关联。如若活动构造数据库不能提供正确、可靠的信息,该数据库也就失去了存在的价值。
活动构造数据库数据源多种多样,主要包括:1)地图,这是系统最主要的数据源,因为地图是地理数据的传统描述形式,是具有共同参考坐标系统的点、线、面的二维平面形式的表示,内容丰富。图上实体间的空间关系直观,而且实体的类别和属性可以用各种不同的符号加以识别和表示。2)遥感影像数据,这是一个极其重要的信息源。通过遥感影像可以快速、准确地获得大面积的、综合的各种专题信息,航天遥感影像还可以取得周期性的资料,这些都为活动构造信息系统提供了丰富的数据。3)实测、探测数据,包括GPS点位数据、差分GPS测量数据、钻探数据、地球物理与地球化学探测数据等。4)数字数据,包括数字图形数据和属性数据。5)图像数据,包括观测点照片、钻孔、探槽剖面等。6)文档数据,包括各种文字档案、成果报告等。
数据源质量问题指数据的采集和录入中可能产生的误差,建库所需各种类型数据的可靠性和精度。从活动构造数据库建设过程看,产生数据质量问题的主要因素有地图和遥感数据等的误差;由于数据库建设人员对数据及数据间关系的理解、对数据库模板的理解、数据入库操作不慎等问题均会引起属性数据误差,以及文档数据的错误等,图形数字化前的预处理(张兰凤等,2007)、手扶跟踪自动化的分辨率和矢量化精度。
为保障数据库的数据质量,研发了与数据库模板相应的活动构造数据库质量检测软件(图8)。
图8 活动构造数据库质量检测软件界面Fig.8 Graphic user interface(GUI)of data quality checking software for active tectonic database.
数据库质量检测软件集成了对数据库模板符合性,数据格式、ID规范性、域值范围、关联关系、必填字段、数据逻辑一致性,空间拓扑关系、断层及产状倾向检查、文档类数据处理、工作量统计等一系列数据检测及统计功能。
为满足城市活动断层探测与活动断层条带状填图等工作的不同需求,软件设置了通过用户界面输入6位城市代码和3位项目编码功能;针对断层、地震地表破裂、空间关系、空间距离等具有相关关系的信息设置了主外键关联关系检测;针对断层绘制过程中,经常会造成图形中由起始和终点决定的断层倾向和属性中描述的断层倾向不一致情况,考虑到倾向在制图过程中和后续研究中起着非常重要的作用,专门设计了对倾向进行计算值与属性值的对比检测;针对数据库、多表、多字段、空间关系等的计数与求和,设计了计算值与属性值的对比检测;针对具有实体含义的点与点、点与线、点与面、线与线、线与面、面与面之间的空间关系,如地质调查点与断层观测点、断层观测点与断层线、地层观测点与地层面等,设计了实体要素类之拓扑关系检查;针对可定量计算距离的空间实体关系,如断层观测点与断层,探槽采样点与探槽点等,计算并给出了最近距离数值。针对一些关键性字段不可为空,或一组关键性字段不可同时为空等检测;针对文档类数据设计了对于大文件分块入库,从数据库中批量导出时自动合并为入库前大文件的功能,可以对比、统计文件是否相同并处理分块文件等。
检测结果依据问题严重程度划分为错误级、警告级和信息级3个级别,并给出错误出现的位置在哪个要素集、要素类或属性表中,错误的类型简述等信息;错误级的问题一般是必须要进行数据库相关要素核实修改的;警告级与信息级错误提示一般要核查、分析问题出现的原因,确定是否要对相关数据库要素进行修改。
数据库质量检测软件还具有对要素集个数、要素类个数、属性表个数,内部数据量、要素个数等进行统计,并统计出入库工作量情况,包括资料收集、野外工作点、探槽、钻孔、各类测线、成果图等。
通过软件检测可以快速了解数据库建设的整体概貌及活动断层探察的工作量等情况。
在软件检测的基础上还要对从数据库中依据系统制图模板绘制出的野外工作底图、实际材料图、活动断层研究成果图进行专家检测,确认其地学信息表达是否完整、准确。
此外,还要对照工作量表检测数据入库量是否与实际工作量匹配对应,抽检数据库属性信息项填写是否完整、可靠。
活动构造数据库的数据量大,数据来源广,数据采集的任务重,在数据库建立过程中会出现许多人为和系统的误差,甚至还有可能产生数据错误,最后采集入库的数据如不能真实反映自然界中的活动构造事实,或数据不能保持一致性和完整性,那么所建立的数据库则达不到建设的初衷。
数据库模板是为了让活动断层建设者拥有一个统一的数据存储规范,从而便于最终研究成果的统一分析、交流与共享,数据批量入库软件是为了提高数据入库效率,数据质量检测软件是为了高效分析数据库中数据格式、ID规范性、域值范围、关联关系、必填字段、数据逻辑一致性,空间拓扑关系、断层及产状倾向等方面的错误,并统计数据库建设工作量。
通过活动构造数据库的建设及数据库质量的检测可以发现问题,并分析产生数据问题的根源,进而可以从根本上解决数据错误问题。与活动断层探察同期开展数据库建设并及时进行数据库检测,可以及时发现问题,及时纠正不恰当的数据采集操作流程,校准提高野外测量仪器,提高测量数据精度;明确收集图形的坐标系统、投影方式,正确设置数据化相关参数,提高数据采集精度;数据库建设过程中自检、他查、软件检测、与专家抽查相结合,做到数据质量问题早发现、精心分析、合理解决,从整体上提高活动断层探察的工作质量。
葛孚刚,王冬雷,王志才,等.2011.山东省1︰20万活断层数据库建设[J].土工基础,25(3):64—67.
GE Fu-gang,WANG Dong-lei,WANG Zhi-cai,et al.2011.1︰200000-scale active fault database in Shandong Province[J].Soil Engineering and Foundation,25(3):64—67(in Chinese).
葛伟鹏,袁道阳,郭华.2006.对城市活断层探测项目中地震地质数据建模的探讨[J].西北地震学报,28(2):134—139.
GE Wei-peng,YUAN Dao-yang,GUO Hua.2006.Discussion on seismogeologic data modeling for urban active fault surveying project[J].Northwestern Seismological Journal,28(2):134—139(in Chinese).
李策,杜云艳,于贵华,等.2008.基于ArcGIS的地震活断层多源数据组织与管理研究[J].地球信息科学,10(6):716—723.
LI Ce,DU Yun-yan,YU Gui-hua,et al.2008.A study on organizing and managing multi-source seismic active fault data based on ArcGIS [J].Ceo-information Science,10(6):716—723(in Chinese).
刘娜,张建国,毛燕,等.2009.活断层数据库在昆明市防震减灾工作中的应用研究[J].地震研究,32(B12):503—506.
LIU Na,ZHANG Jian-guo,MAO Yan,et al.2009.Application of information database of active faults in Kunming′s earthquake preparedness and disaster reduction work[J].Journal of Seismological Research,32(B12):503—506(in Chinese).
柔洁,刘云华,傅长海.2008.乌鲁木齐市活断层数据库在城市建设中的作用[J].内陆地震,22(3):193—202.
ROU Jie,LIU Yun-hua,FU Chang-hai.2008.The function of Urumqi City active fault database in urban construction[J].Inland Earthquake,22(3):193—202(in Chinese).
于贵华,邓起东,邬伦,等.1996.利用GIS系统建立中国活动断裂信息咨询分析系统[J].地震地质,18(2):156—160.
YU Gui-hua,DENG Qi-dong,WU Lun,et al.1996.Building Chinese active fault information system using GIS system[J].Seismology and Geology,18(2):156—160(in Chinese).
于贵华,徐锡伟,孙怡,等.2006,城市活断层探测信息系统的设计与实现:以福州市活断层信息管理系统为例[J].地震地质,28(4):656—662.
YU Gui-hua,XU Xi-wei,SUN Yi,et al.2006.Design and implement an urban active fault information management system[J].Seismology and Geology,28(4):656—662(in Chinese).
张兰凤,于贵华,李陈侠,等.2007.用ArcGIS实现利用1/20万地质图编绘1/25万区域地震构造图的方法[J].地震地质,29(2):412—417.
ZHANG Lan-feng,YU Gui-hua,LI Chen-xia,et al.2007.Compiling the 1︰250000 regional seismotectonic map using the 1︰200000 geologic maps with ArcGIS method[J].Seismology and Geology,29(2):412—417(in Chinese).
Haller K M.2003.Quaternary fault and fold database of the United States[A].In:CR USGS GOV,2003 Seattle Annual Meeting(November 2-5,2003),Paper No.175—6.
Kathleen M H,Michael N M,Richard L D,et al.2004.U S Quaternary fault and fold database released[J].EOS,Transactions,American Geophysical Union,85(22):218.doi:10.1029/2004EO220004.