司 莉,刘 莉
2013年9月习近平总书记首次提出“一带一路”倡议,提出要打造“政策沟通、设施联通、贸易畅通、资金融通和民心相通”新合作格局。实现“五通”必须保持信息畅通,作为“一带一路”信息基础设施建设的组成部分,“一带一路”专题数据库整合沿线国家多种数据资源,为“一带一路”数据流通和共享搭建了桥梁。政府机构、科研机构与信息服务机构也纷纷依托自身资源和技术优势,主持建设并开发具有多种服务功能的“一带一路”专题数据库。
“一带一路”专题数据库建设起步晚,研究集中在需求调研与资源建设方面。在需求调研方面,严丹等分析“一带一路”研究的学科分布与信息资源需求状况[1];李娟以西安交通大学丝路科技知识服务系统为例,探讨“一带一路”数字资源建设思路[2]。在资源建设方面,丁波涛构建了基于数据银行的“一带一路”资源整合模型[3];于施洋等归纳资源归集思路与数据资源归集类型,针对归集难点提出解决措施[4]。已有研究为“一带一路”专题数据库建设提供了一定参考,但对“一带一路”专题数据库服务功能全面调研的较少,仅调研某一个或几个数据库[5-6],或仅对某项服务功能进行调研[7]。
2015年国务院发展研究中心信息网率先推出“一带一路”研究与决策支撑平台。2017年3 月由国家信息中心主办的中国一带一路网上线,旨在为沿线企业、社团和公民参与“一带一路”建设提供信息服务[8]。随后浙江一带一路网、江苏一带一路网、陕西一带一路网、湖北省一带一路公共服务平台等地方政府部门主导建设的专题数据库平台上线。科研机构、出版社、商业公司也进行了“一带一路”专题数据库建设探索。2015年西安交通大学主导建设的一带一路专题库上线,致力于服务“一带一路”沿线工程科技人才[9]。2015 年7 月新华社推出“新华丝路”信息产品,提供一系列涵盖“一带一路”的个性化产品和服务。2016年中经网打造的“一带一路”统计数据库上线,旨在为政府部门战略决策、政策制定以及学术研究提供数据支持[10]。“一带一路”数据库功能设计是实现数据库服务的关键要素,为全面了解我国“一带一路”专题数据库服务功能开发状况,笔者采用网站调查法和内容分析法,从数据导航、数据获取、数据分析、数据服务、互动与帮助等维度入手,调研“一带一路”专题数据库服务功能开发现状,分析存在问题,提出优化策略。
“一带一路”专题数据库是相关机构着眼于服务“一带一路”倡议,利用资源优势和技术优势,通过收集和整合“一带一路”沿线国家和地区政治、经济、文化等领域的数据而搭建的数据资源服务平台。截至2020年10月20日,我国共有43个“一带一路”专题数据库上线。笔者逐一登录数据库网站,发现有5 个数据库无法访问,因此将38 个专题数据库列为最终调查对象,从数据导航、数据获取、数据分析、数据服务、互动与帮助等方面进行调研,时间为2020年10月20日-11月10日,调研结果见表1。在数据导航方面,38个(100%)数据库提供分类导航服务,17 个(45%)提供可视化导航服务。在数据获取方面,32 个(84%)提供数据检索功能,26 个(68%)提供数据下载服务。在数据分析方面,15 个(39%)具有主题数据分析功能,17 个(45%)提供检索结果分析功能。在数据服务方面,15 个(39%)提供多语种服务,8 个(21%)具有个性化服务功能,9 个(24%)通过新媒体开展服务。在交互与帮助方面,12 个(32%)提供交流互动功能,13个(34%)具有帮助功能。“一带一路”专题数据库建设已取得一定进展,少数数据库已通过多类型、多渠道的方式全方位为用户提供服务,下文具体分析数据库的服务功能建设情况。
(1)分类导航。38个数据库均提供分类导航服务,其中27个根据资源组织方式设置二级导航菜单。根据本课题组前期研究,“一带一路”专题数据库的信息组织方式可以总结为资源-主题型、区域-主题型、功能-主题型、主题-主题型以及多维度综合型5种。据此标准,对数据库的信息组织形式进行调查,结果见表2。多维度综合型是使用最多的二级分类导航方式,不采用单一资源组织标准,而是根据多维资源归集方法进行导航,类目设置灵活,可扩展性较强,多适合大型数据库平台对多区域、多领域、多类型资源的导航,目前有16个数据库采用该方式;6个采用资源-主题型二级导航方式;4个采用主题-主题型资源导航方式,香港贸发局“一带一路”资讯网采用功能-主题型导航方式。
表2 “一带一路”专题数据库二级导航设置情况(部分)
(2)可视化导航。“一带一路”数据资源涉及的国家(区域)多、时间跨度大,为使用户准确快速地定位到所需信息,17个数据库设置可视化导航功能,包括地图、时间轴、主题词云图、知识图谱4种可视化方式。地图导航可以实现某地区信息的准确查找,时间轴导航可以实现某时间节点信息的快速查找,社会科学文献出版社“一带一路”数据库采用地图导航全景展示丝路沿线国家,用户点击地图上某个国家便可了解该国的政治、经济、社会、文化等信息,用时间轴记录丝路大事记;主题词云图使热点话题更突出,“一带一路”冶金专题知识服务平台的海外资讯模块通过词云图方式可视化呈现热点内容;知识图谱可以使搜索更有深度和广度,西安交通大学“一带一路”专题库课程资源模块提供知识图谱可视化展示功能,用户使用图谱便可了解视频站点内容全貌,定位自己喜欢的课程视频[9]。
(1)数据检索。38个数据库中,32个提供数据检索功能,其中10个提供高级检索功能。一些数据库还设置其他检索方式。比如,西安交通大学“一带一路”专题库提供知识图谱智能搜索功能,实现视频、文本等异构资源的高效管理与检索[9];色诺芬(SINOFIN)一带一路专题库提供了扩展检索和关联检索等功能。未设置检索窗口的有6个平台,分别是“走出去”公共服务平台、上海市与“一带一路”国家经贸合作信息服务平台、张家港走出去服务平台、西安财经大学“一带一路”大数据平台、清华控股“一带一路”、金准“一带一路”国别经济数据平台。从检索结果处理情况看,大部分数据库没有对检索结果进行处理,只能点击检索结果进入详情页面。仅7个数据库可以对检索结果进行处理,主要包括聚类、排序、筛选等。此外,个别数据库还支持检索记录数统计、显示检索用时、相关检索等。
(2)数据下载。26个数据库提供数据免费下载、付费下载。大部分政府部门、科研机构提供免费下载服务,其中有些仅提供部分数据下载功能,如上海市与“一带一路”国家经贸合作信息服务平台中数据图表不可下载。部分出版社或商业机构数据库提供付费下载,如新华丝路网、“一带一路”投资与贸易法律服务平台、色诺芬(SINOFIN)一带一路专题库、RESSET一带一路数据库系列。
(1)主题数据分析。15个数据库具有主题数据分析功能,通过对某一主题的数据进行统计分析,使用户了解主题现状和发展趋势。上海社会科学院丝路信息网建立分类统计数据库,对“一带一路”沿线国家的产业、投资、贸易、金融、园区等数据通过折线图、柱状图、饼图进行分析。陕西一带一路网通过柱状图、折线图等方式对交通物流、对外经济、宏观基础数据进行分析。
(2)检索结果分析。该功能可实时处理用户请求,允许用户随时更改分析数据的内容约束和限制条件。有17 个数据库提供检索结果分析功能,其中15个可以对数据内容进行分析。一带一路统计数据库提供多种分析工具,用户可以根据自身需求选择分析工具对检索数据的某一指标进行分析[10]。一带一路基础知识库、一带一路资源中心数据库可以对检索结果文献类型、来源期刊、学科分布等数据的外在信息进行统计分析。
(1)多语种服务。“一带一路”涉及官方语言50多种,一些数据库通过多语种服务功能来解决语言障碍问题。15个数据库提供多语种服务,包括多语种转换界面、翻译服务、多语种资源同步提供3种方式。在多语言转换界面方面,13个数据库具有此功能,其中支持中(简体)、英文转换的数据库最多——有8个,支持中(简体、繁体)、英转换的3个,提供4种及以上语言转换的共有4个,详见表3。
表3 多语言转换界面的数据库统计表
从多语种转换界面的实现方式来看,部分数据库只对题录元数据进行语种转换,字段值及原文是原有的语言。在翻译服务方面,“一带一路”共建国家标准信息平台开发了翻译云平台,采用神经网络翻译技术和计算机辅助译后编辑技术,提供多种格式标准文本、标准化文件资料和其他领域资料的快速中英互译[11]。湖北省一带一路公共服务平台联合传神-语翼Woordee多语言在线人工翻译平台,提供一站式全场景翻译服务[12]。在多语种资源同步提供方面,西安交通大学“一带一路”专题库宏观经济数据模块提供中、英、俄、阿等语言类型的数据,新文图信区域研究数据库部分模块资源可以同时用中英文显示。
(2)个性化服务。数据库平台的个性化服务是指以用户为中心,以网络与信息技术为支撑,为用户提供满足其个体需求的一种集成性信息服务[13]。8个数据库具有个性化服务功能,服务项目主要包括数据定制、产业研究、数据库产品等。新华丝路网针对用户具体需求,提供新华丝路海外活动、新华丝路教育与培训、新华丝路产业研究等个性化服务[14]。“一带一路”研究与决策支撑平台可以针对用户的个性化需求,依托权威专家资源和专业研究团队,提供信息定制、宏观经济软件解决方案、课题研究等专项服务[15]。社会科学文献出版社“一带一路”数据库针对用户研究课题与投资方向,对内容资源进行深度整合,创建符合用户要求的个性化数据库产品[16]。
(3)新媒体服务。在38个样本中,9个建设主体专门为“一带一路”专题数据库开设新媒体服务功能。微信公众号是数据库使用最多的新媒体服务方式,已有8个数据库开通微信公众号,部分数据库还提供多种新媒体服务方式,中国一带一路网拥有App、微信公众号、微博、知乎、抖音5种新媒体服务方式。“一带一路”生态环保大数据服务平台、亚太日报一带一路服务平台具有App、微信公众号2种新媒体服务方式。陕西一带一路网、新华丝路网、“一带一路”产业地图资源平台可通过微博、微信公众号进行服务。而湖北省一带一路公共服务平台、“一带一路”工业和信息化产业资源平台仅通过微信公众号进行服务,新华丝路数据库仅通过App进行服务。
(1)交流互动。12个数据库提供交流互动功能。实现交流功能的主要方式有互动留言、在线咨询、意见反馈、话题讨论等。湖北省一带一路公共服务平台通过咨询建议、话题讨论2种方式实现与用户交流,新华丝路数据库提供记者观察、推荐专家、研究机构3类咨询服务。
(2)用户帮助。13 个数据库具有帮助功能。“一带一路”专题数据库主要通过常见问题解答FAQ、用户使用手册以及帮助中心为用户提供帮助。新华丝路网提供一带一路问答、丝绸之路问答以及海上丝绸之路问答3种常见问答。“一带一路”经济信息共享平台(BRInfo)通过视频和文档的形式为用户提供BRInfo平台概述,指导用户登录和使用。
在多维度的资源组织中,分级导航方式可以更加精确地定位到所需信息,但目前建有的“一带一路”数据库最多采用二级导航方式,有待进一步细化。可视化导航方式能更加生动形象地展现资源特征,既增加数据表示的视觉效果,又增加用户体验。虽然地图、时间轴、主题词云图以及知识图谱等可视化导航方式已在部分“一带一路”专题数据库中得到了应用,但应用的数据库数量较少,形式单一。
用户知识需求具有多元化与精细化的特点,通过细粒度的“知识单元”发现更广泛更适用的数字资源可以有效提高用户的满意度[17]。因此数据库在分类导航设置上,可根据所收录资源的内容和特点进行系统梳理,根据数据来源、数据类型、语种等进行细分,采用多重列类的导航方式,多视角、多层次、全方位地呈现数据库资源。“一带一路”数据资源具有覆盖范围广、时间跨度大、异源异构异质等属性[18]。可视化工具通过重新组织客观知识,将资源按其属种关联以层次结构展现给用户,并通过节点的展示和链接帮助用户获取具体资源[19]。为使用户迅速定位到所需信息,“一带一路”数据库可基于数据覆盖范围绘制导航地图,基于时间跨度绘制时间轴,基于主题热度绘制词云图、基于“知识图谱”组织数据生成可视化图表等多种可视化导航方式全方位展示数据库资源,如西安交通大学“一带一路”专题库。数据库还应采用分类导航与可视化导航相结合的方式,使用户对资源存储情况一目了然,更加快速地定位到所需信息。
数据获取方式直接影响用户对数据库资源的使用,便捷友好的数据获取途径更能吸引用户,满足用户的数据需求[20]。大多数据库检索功能较为简单,仅有10 个数据库提供高级检索功能,有6个数据库甚至未设置检索窗口。数据可下载率也不高,部分数据库未提供数据下载功能,因此在数据库建设时,应注重数据获取功能的开发。在数据检索方面,首先应加强对高级检索功能的开发。高级检索通过整合布尔逻辑算符、语种、显示条数、发布时间等,实现对资源内容、数据量和时间的限定,提高资源查找的准确性,提升用户体验的满意度[21]。同时,可根据数据库特点采用专业检索、对比检索、扩展检索、关联检索等多种检索功能。此外,还应引入跨语言检索功能,跨语言信息检索旨在以某一语种构建查询条件从多语种信息集合中检出另一语种的信息[22],跨语言检索系统可以帮助用户克服“一带一路”多语种数据资源检索障碍,提高信息系统检索的易用性和检索效率[23]。数据获取是数据重用的基础,因此在数据下载方面,数据库应尽可能提供数据下载链接,如不能提供可以将数据链接至所在网站;在格式方面,应尽量提供xlsx、csv、txt、xml、HTML等多种数据下载。
“一带一路”相关信息缺乏关联性,具有不连续、不系统、碎片化等特点,急需将动态资讯与结构化数据有机关联,进行深度信息挖掘和分析[24]。但当前提供数据统计分析服务的数据库较少,仅有15 个数据库提供主题统计分析功能,17个数据库可以对检索结果进行统计分析,且多是将某一主题的数据以图表方式呈现,以展现该主题的发展趋势,没有更加深入地对某一具体指标进行分析。
数据智能分析工具可实现异源异构异质数据集成,为深度挖掘和释放多源汇聚的数据资源价值提供抓手[25]。数据库可通过数据挖掘、机器学习、可视化分析等技术提升数据库分析能力,提供多维度、多指标的交叉分析功能,以多种形式呈现数据分析结果,来全面支撑用户的数据决策需求,驱动业务决策。此外,也要强化分析结果的加工,形成具有核心竞争力的“一带一路”信息产品。可参考上海社会科学院丝路信息网,发布《“一带一路”国家月度动态报告》《“一带一路”节点城市系列报告》,从而为各级政府部门、企业界、研究人员等提供兼具时效性和专业性的动态分析报告[16]。
数据服务功能是“一带一路”专题数据库的重要服务模块,也是体现“一带一路”数据库特色的重要功能。有部分数据库提供3种以上服务功能,仍存在一定问题:(1)提供的语言种类有限,仅有4 个数据库提供4 种以上语言转换服务,且提供翻译服务、实现多语种资源同步提供的数据库有限;(2)新媒体服务方式单一,大部分数据库仅使用微信、微博、App 中的一种或两种进行服务;(3)提供个性化服务的数据库较少,仅有8 个数据库具有个性化服务功能。多语种服务可以有效促进数据库的易用性[26],如Word Wide Science通过提供中、英、法等10多种语言检索和翻译服务,实现对70多个国家61 个数据库及门户的一站式搜索[23]。“一带一路”专题数据库可通过建立语料库的方式,采用智能翻译、神经网络翻译、人机交互机器翻译等技术,提供智能、交互的多语种资源供给、转换、翻译等功能。新媒体服务方式可以满足用户对服务的及时性、互动性和移动性诉求,已成为用户获取资讯、参与阅读活动的重要渠道和工具[24]。数据库可借助App、微博、微信等多个平台开展服务,同时也要注重数据库与新媒体服务内容的相互衔接和融合,实现传统数据库服务平台与新媒体服务平台之间的联动、信息互通和资源共享。此外,在信息爆炸的今天,用户需求已不仅仅满足于信息获取,而是追求更个性化的服务[27],个性化服务是提高数据库资源与每个用户之间相关度的重要途径[28]。因此数据库应根据用户需求,创新服务形式,对数据资源进行整合与深度分析,创建满足用户要求的个性化产品。如借鉴新华丝路数据库的经验,为各级党政机关、企事业单位提供企业投融资分析、行业发展趋势分析、项目风险评估与建议等个性化定制咨询服务。
在Web2.0环境下,数据库应当完善平台的交互性能,提升交互服务的完备性和多样性,采用好的交互工具、新的交互技术为用户提供高质量的服务[27]。目前数据库提供的互动交流服务大都采用留言方式,缺乏实时在线交流功能,且多为商业机构所建,数据库大部分通过用户使用指南、常见问答为用户提供帮助,缺少智能问答功能。因此,“一带一路”专题数据库要加强互动交流功能,尤其要注重交互的实时性。
数据库要提高“服务体验”,应尽量满足用户交互需求[29]。数据库可通过建立专业咨询服务团队,采用实时交流方式解答用户疑问,通过互动留言、在线咨询、意见反馈、评价等多种渠道引导用户主动参与互动,如参考湖北省一带一路公共服务平台,设置包括咨询建议、话题讨论功能的互动服务模块。在帮助功能设计上,智能问答系统由于能够理解用户自然语言提问,并将答案反馈给用户,目前已在图书馆、电商平台、公司网站等得到普遍的应用[30]。因此,数据库建设者可以在优化原有功能的基础上开发智能问答系统,将数据库常见问题及其解答整理为规范的问答库形式,以支撑各种形式问题的问答。
如何更好地为用户服务是数据库建设的关键问题,“一带一路”专题数据库功能设置是为用户服务的基础。本文对“一带一路”专题数据库的数据导航、数据获取、数据分析、数据服务、互动与帮助等功能进行调研,发现“一带一路”专题数据库建设取得了一定进展,但同时也存在一些不足。“一带一路”专题数据库建设时可采用多维度的资源导航系统,准确定位数据资源;增强数据检索功能,扩展数据获取途径;采用多样化的分析工具,多角度呈现统计分析结果;扩展数据服务形式,深化服务内容;明确数据库定位,加强互动沟通功能。在增强传统服务的基础上,“一带一路”专题数据库应基于数据库服务定位开发特色服务功能,实现由单语种服务向多语种服务,从传统的单向决策服务向双向个性化服务转变,由单渠道的数据库服务模式向多渠道的新媒体服务模式转变。