Web3.0视角下的地方志信息化平台建设构想

2018-01-11 03:27
广西地方志 2017年6期
关键词:方志语义数据库

余 璐

(上海市地方志办公室,上海 200030)

Web3.0视角下的地方志信息化平台建设构想

余 璐

(上海市地方志办公室,上海 200030)

对Web3.0的含义及特点进行介绍,并结合方志工作本身的内容,以互联网未来发展趋势的视角来审视目前方志信息化平台建设中存在的问题,并提出改进构想:进一步加强相关信息间、终端间的“互联互通”;重视用户需求,使用相关技术和方法,加强分析研判;尝试打造“个性化”的信息化服务平台。

Web3.0;地方志;信息化;平台建设

近年来,全国范围内地方志数据库(数字方志馆)规模快速扩容,地情网站群覆盖面逐步扩大,方志业务信息系统建设加速推进,方志新媒体矩阵初具规模,“互联网+地方志”已经成为开发利用地方志资源的重要手段。①《“互联网+地方志”成为开发利用地方志资源重要手段》,http://news.dahe.cn/2016/04-28/106777313.html.互联网技术本身也在日新月异,目前互联网整体向Web3.0时代转进的演变轨迹值得方志工作者们密切关注,尤其需要地方志信息化平台建设者们加以分析研究,业界应当紧跟信息技术发展趋势,以求得修志工作的与时俱进和社会服务功能的持续拓展。

一、Web3.0:含义及特征

(一)互联网演变轨迹:从Web1.0到Web3.0

计算机软件发布后会不断更新,随之有了不同的版本号,如1.0版本、2.0版本、3.0版本等,版本号越大,则该版软件越新,其功能也就越完善。互联网从业者借用这样的概念,也给互联网标上了版本号,不同的版本号代表着互联网不同的历史发展阶段。

第一代互联网,称为Web1.0。这一时期的网站以静态单向阅读为特征,网站提供给用户的内容是网站编辑处理过的,用户处于被动的地位,几乎不参与网络内容的生产。Web1.0时代的代表站点为新浪,搜狐,网易等三大门户。②《Web1.0、2.0、3.0分别是什么意思?》,https://www.zhihu.com/question/19911163.Web1.0具有精英文化属性,Web1.0时代也可称之为“聚众时代”:当人们缺乏信息的时候,发布信息的互联网门户就是最有价值的,就是网络的中心节点,这些门户网站以信息的获取、发布、整理为核心,想尽办法把各种信息汇集起来,让用户去浏览,信息传递模式就是“互联网—用户”的单向模式。

第二代互联网,称为Web2.0。这一时期的网络已发展成可读写式、互动参与的实时网络。网站的内容不再由网站编辑单向提供,而是主要基于用户提供,即所谓UGC(User Generated Content,用户生产内容),网站的兴旺发达依赖于用户的积极参与和主动建设。①《Web2.0》,来自“百度百科”,网址:https://baike.baidu.com/item/web2.0/97695?fr=aladdin.Web2.0时代的代表站点有:新浪博客、腾讯微博、Facebook(脸谱网)、Twitter(推特)等各类社交网站。另外,各种形形色色的论坛和贴吧、著名的A站(Acfun)、B站(bilibili)、Youtube等视频网站,甚至连兴盛一时但现已沉寂的开心网、chinaren校友录等均可归为Web2.0网站。Web2.0具有草根文化属性,Web2.0时代也可称之为“分众时代”:这一时期,每个网民都成为了信息的节点,每个节点充当一个信息源,出现了“去中心化”的趋势,大量的网站失去了原先对信息资源的独占权,它们对各个网络节点(通常是普通用户)上传来的信息进行汇总、梳理、筛选和再发布,信息的传递模式变成了“互联网—用户—互联网”“用户—用户”“用户—互联网”的多向模式。Web2.0是一次互联网理念的升级换代,由原来的自上而下的由少数资源控制者集中控制主导的互联网体系,转变为自下而上的由广大用户集体智慧和力量主导的互联网体系,这极大地激发了个人创作和贡献的潜能,使得互联网创造力上升到新的量级。②曹方,Web3.0的梦想与现实[J].上海信息化,2012(9):9.Web2.0相关的主要技术有RSS(新闻聚合)、Blog(博客)、Wiki(维基)、Tag(社会书签)、IM(即时通信)、SNS(社会网络服务)等。这些技术的共同特点是,进一步突出网络信息生产中普通网民的作用,并且通过各种应用方式使网民之间产生更加密切牢固的关系。③王玲芳,浅谈Web3.0时代高校图书馆的新发展[J].内蒙古科技与经济,2009(22):125.

现在正是Web2.0大行其道,方兴未艾之时,但已有不少互联网从业者对下一代互联网的发展提出了前瞻性的看法。Web3.0是何样貌,目前众说纷纭,没有统一定义。但是,几乎所有人都认为Web3.0应当包含“语义网”(Semantic Web)技术。④完颜邓邓,Web3.0环境下的公共数字文化资源整合平台建设研究[J].图书馆学研究,2015(23):20.

通俗地说,语义网就是能够根据语义进行判断的网络。也可以说,语义网是一种能理解人类语言的智能网络,它不但能够理解人类的语言,而且还可以使人与电脑之间的交流变得像人与人之间的交流一样轻松。因为语义网中的计算机能利用自己的智能软件,在搜索数以万计的网页时,通过“智能代理”从中筛选出相关的有用信息,而不像现在的万维网,只能罗列出数以万计的搜索结果(其中包含着大量无用的信息),这将使人类从繁重低效的搜索劳作中解放出来。⑤《语义网》,https://baike.baidu.com/item/语义网/118508?fr=aladdin.语义网这一Web3.0核心概念的提出,是为了因应Web2.0时代信息泛滥的困境。伴随着网民的生产力被解放,网上内容呈现爆炸式增长,人类却面临另一个尴尬的处境:我们现在已被天文数字般(而且仍然在以几何级数增长)的网络信息所淹没,即使拥有搜索引擎(机器的帮助)和相关知识类论坛、社交网络(人的帮助),还是面临“答非所问”的窘境或陷入各种意无意的误导之中(如百度医疗信息的搜索结果是以“竞价排名”的方式呈现)。在互联网上,要精确地找到对个人有价值的东西,已经越来越难。

构建语义网是一个雄心勃勃的设想,它对网络的智能化,以及网站间底层数据的标准化、开放性提出了很高的要求,目前其发展面临一些技术瓶颈⑥《语义网是什么?有什么好处?》,https://www.zhihu.com/question/19550885.,但国内外已有一些相关研究成果应用于生产和生活领域⑦⑧⑨⑩《Facebook推出Graph API:语义网的未来?》,https://news.cnblogs.com/n/62843/.,随着近年来人工智能技术的跨越式发展,语义网的未来值得期待,Web3.0时代的曙光已出现在我们面前。

(二)Web3.0的主要特征

基于“语义网”这一Web3.0的核心概念,我们可以得出关于Web3.0样貌的大致描述:Web3.0以语义网为基础,将互联网中杂乱无章的微内容标准化、信息化,整合各种底层数据库,建立庞大的底层数据库的信息交换机制,通过智能交互的信息平台将信息反馈给用户。①夏昌铭.Web3.0环境下互动学习平台构建[J].图书情报论坛,2011(5):52.Web3.0网络模式就是基于用户需求的智能过滤器和多元化需求满足平台②张扬.Web的发展与图书馆参考咨询服务“从Web1.0到Web3.0”[J].科技情报开发与经济,2009(18):8-9.,它主要有以下特征:

1.主动筛选性(或智能性)

Web3.0被视为智能网络,它会主动提取用户的上网痕迹及其产生的各种数据,来分析研究用户的需求。用户每次在网站停驻,都会让网站变得“更懂你一点”,网站的搜索引擎能不断为用户提供更有针对性的、更有价值的服务,这是Web3.0能做到对海量信息进行有效筛选、智能匹配用户需求的主要原因。

2.兼容交互性

语义网的构建,要求各网站间的底层数据(元数据)之间开放交互,这相当于将全世界的网络节点(即互联网本身)看成一个超级数据库。每个网络服务器都是这一数据库中平等的存储单元和平等的查询入口。用户上网时,只需输入查询命令即可,不用考虑本系统和其它服务器系统是否存在兼容性,以及本查询语句是否适合其他服务器的调用程序等问题。③夏昌铭.Web3.0环境下互动学习平台构建[J].图书情报论坛,2011(5):52.基于Web3.0构建的网络平台还可实现统一平台的多终端兼容访问,人们可以通过移动网络、有线电视网、互联网(特指PC端),使用独立的操作系统或应用程序随时随地访问网站。④完颜邓邓.Web3.0环境下的公共数字文化资源整合平台建设研究[J].图书馆学研究,2015(23):21.

3.个性化聚合

Web2.0时代,涌现出大量的社会网络站点、博客、微博、维基百科、视频音频点播等,Web3.0聚焦于对Web2.0时代创造的这些数据集进行聚合。它按照对于用户需求的分析结果,基于Widget(微件)、Mashup(糅合)技术等主动地对Web2.0的交流平台进行个性化组配,聚合平台的各种个性化应用。用户上网时无需暂离网页,因为浏览器已经集成了用户需要的各种exe及app,用浏览器即可以实现复杂的系统程序才具有的功能。由此,每个人上网点开浏览器时,不再是统一的界面,而是个性化的专属于个人的门户网站,你在生活中的所有需求几乎都可以在这个网站中得到“一站式”满足。⑤《Web1.0、2.0、3.0分别是什么意思?》,https://www.zhihu.com/question/19911163.

综合上述三项特征,我们可以说,Web3.0时代,将是互联网在“互联互通”“平等、自由、开放、共享”的发展道路上的自然延伸,Web3.0这一概念是互联网从业者“以人为本”的服务理念的深度体现。

二、目前国内地方志信息化平台发展现状

目前国内已建成的方志信息化平台主要分两类:一类是PC端的网站,一类是移动端的微信公众号。

PC端的网站又可分为地方志工作机构的官方网站,以及地情资料数据库(数字方志馆、地方志文本数据库)这两大类。这些信息化平台仍然停留在Web1.0时代,其信息传播模式是“互联网—用户”的单向模式,页面也只能静态阅读。即使有部分网站开设了互动交流的栏目(如广东省情网开设有“网上太史公”栏目),但用户的反馈对于网站内容的生产几乎不起任何作用。另外,全国各地的地情资料数据库无法实现共联互通。现在假设,某位用户想在社会主义新方志的记载中获取有关21世纪头几年内全国各地互联网发展状况的信息,那么他必须逐个访问全国各地已建成的地情资料数据库(用户多半不知道这些数据库的位置和收录资料情况,先要通过百度搜索到网址,再进入后细细查询)。而且,数据库中自带的搜索引擎也不能进行精准查找。今以“上海通网站”(上海市地方志办公室官网)为例,在网页上端的搜索栏中输入关键词“互联网”后,反馈结果里存在大量的无用信息,必须要用户根据自己的需求来逐个筛选(图1)。总之,目前情况下,用户若想在PC端网站完整而精确地获取地情资料,则需要耗费大量的时间和精力,虽然比没有互联网、方志文本没有数字化时的实地查询省了不少功夫,但总体效率还是较低。

图1 在上海通网站搜索栏中输入 “互联网”后得到的搜索结果

至于移动端的微信公众号,从微信本身的技术属性分析,无疑属于Web2.0范畴的信息化平台。据方志从业者研究分析,地方志微信公众号总量偏低、各地比例不均衡,而且普遍关注度低,阅读量、点赞量、转发率都不理想。究其原因有宣传力度不够,内容形式欠佳,故而无法吸引读者关注。①赵明明,吴韵.全国地方志微信公众号发展述评[J].中国地方志,2016(10):29-30.由此可见,大多数地方志微信公众号提供的内容与用户的服务需求之间不匹配。

总体而言,目前国内地方志信息化平台发展落后于时代的脚步。

三、基于Web3.0的地方志信息化平台建设设想

中国地方志指导小组办公室副主任刘玉宏在谈到“十三五”时期全国地方志信息化工作的指导思想时,曾明确指出:“(要)顺应‘互联网+’发展趋势,以应用需求为导向,以融合创新为动力,以重点工程为抓手,以新一代信息技术为支撑,按照集约发展、融合共享的工作思路,大力推进地方志信息化建设,为提升地方志事业科学化、信息化、现代化水平作出新贡献。”①《刘玉宏在全国地方志系统信息化工作会议上的讲话》http://szw.wuxi.gov.cn/doc/2016/06/01/1065244.shtml.以Web3.0的视角来审定目前地方志信息化平台建设中存在的问题,提出以下改进构想:

(一)进一步加强相关信息间、终端间的“互联互通”

前文已述,现在全国各处方志文本数据库(地情资料数据库、数字方志馆)之间的数字信息无法互联互通,造成了一个个分散封闭的“信息孤岛”,为用户深入查询带来不便。面对这一困境,《全国信息方志与数字方志建设工程实施方案》已明确提出:“依托国家数字方志馆,建成全国规模最大的地方志全文数据库(包括目录数据库、提要数据库)”“国家数字方志馆是地方志全文数据库的基础平台。通过开发全国地方志资源管理系统,把全国的数字化志书、年鉴、地情资料、旧志、史志期刊、音视频、图片等资源集中起来,建设地方志数字资源中心。”②《关于印发〈全国信息方志与数字方志建设工程实施方案〈的通知》(2017年2月10日下发),http://www.difangzhi.cn/zgdfz/zcfg/201702/6912408e509641cd86323e07734c962b.shtml.一个统一的、完整的方志文本数据库,对于用户(尤其是专业研究者)不啻为一个大福音。不过,“囊括古今”尤有缺憾,“包罗万象”才是Web3.0“互联互通”的真谛。已有使用方志文库数据库的专业学者指出:即使我们将已知已有的所有方志实现了数字化,实现了文本知识的自动抽取,简单时间的自动系年、分析,以及可视化呈现,它所面对的对象也仅仅是所有方志,超越了方志范围的其他地情信息便无能为力了。未来应注重在与其他数据库(如古代诗文数据库等文献数据库)实现数据交流的基础上,扩大文献范围、建立文献关联、发现隐含信息,进而实现自动分析。③刘京臣.他者视阈中的数字方志建设——以燕行录中的蓟州为中心[J].中国地方志,2017(5):33,41-42.

Web3.0时代的网络具有良好的兼容性,多种终端之间可以实现自由交互。其实,随着移动互联网技术和云计算技术的发展,目前方志信息资源在多种终端之间提供兼容化的服务已经不再是难题。当今社会,智能手机、平板电脑、电子阅读器等移动终端在公众之间广泛普及,广播电视也成为公众获取公共文化资源的途径之一,电脑不再是唯一的访问网络的终端设备,公众获取信息资源的习惯随之发生变化,对多终端(尤其是移动端)访问的需求越来越迫切。方志信息工作者应针对终端设备的模块性质,通过定制使用底层数据库的通信协议等方式,屏蔽不同终端设备之间的异构性,使得用户可以使用电脑、手机、平板电脑、电子阅读器、智能电视、电视机顶盒等各种终端设备访问地方志信息化平台,方便他们随时联通,随地接入,随心应用,以此来吸引用户。目前,业界已有“开发国家数字方志馆手机客户端”,打造掌上方志馆的计划,笔者期待方志工作者未来在电子阅读器(kindle等)领域、在有线电视领域(如IPTV等)也能耕耘出一片天地。

(二)重视用户需求,使用相关技术和方法,加强分析研判

Web3.0时代的网络之所以是智能网络,就是因为它会持续地获取网络用户的上网数据,不断主动地进行分析用户需求,提供高度匹配性内容。其中,基于语义检索功能的智能搜索引擎尤其令人向往。当然,目前统一、高级的语义网络并未出现,搜索引擎技术发展受限于此,以google(谷歌)、baidu(百度)为代表的主流搜索引擎整体检索效率还不能达到Web3.0时代的美妙设想。不过,一些商业服务类网站(如购物网站、视频音频播放网站)已开始采纳Web3.0精确匹配的理念,纷纷利用用户数据抓取技术、用户网上痕迹追踪技术、用户行为分析技术等,以求对用户实现精准营销。近年来有过网上购物体验的人,都会发现在浏览淘宝、天猫、京东等购物网站时,它们会自动记录下你以往的浏览信息和搜索痕迹,然后会在侧边栏中以“推荐商品”“同类商品”“精选商品”等门类呈现一些推送信息,以此作为促销手段。如喜马拉雅FM①喜马拉雅FM是中国知名的音频分享平台,海量内容包括有声书,相声段子,音乐,新闻,综艺娱乐、儿童、情感生活、评书、外语、培训讲座、百家讲坛、广播剧、历史人文、电台、商业财经、IT科技、健康养生、校园电台、汽车、旅游、电影、游戏等20多个分类,上千万条声音。的app体量并不庞大,但其中已经集成了智能推荐功能,一个移动端的用户(不管是否在喜马拉雅FM上注册过),只要使用过这款应用,收听过一些音频节目,它便会通过收集到的数据(通常是用户已听节目的门类与收听频次等),以“猜你喜欢”的形式向你推荐同类型的精彩节目,这也部分免去了用户在海量音频节目中搜索甄别的功夫。方志信息要提升传播效能,方志工作要扩大社会影响,关键在于找准目标受众,分析用户需求。“蒙眼狂奔”容易“南辕北辙”,“盲人摸象”可能“以偏概全”。以往修志者普遍不重视用户需求,多凭经验来推断甚至臆测读者对于方志文本及地情资料的阅读喜好,如此作为,怎能奢谈方志“飞入寻常百姓家”?方志工作者应当学习借鉴当今互联网商业实践领域中的先进经验,我们也可以在网页中内嵌上网痕迹追踪、用户行为分析等程序插件,运用Web3.0的理念来加强方志用户需求的分析研判工作。某个用户究竟是专业研究者(方志文本的深度用户),还是地情资料的普通读者(仅对地情信息感兴趣,并无专业学术能力),亦或是参与方志编纂的专业人员,浏览网站的人是哪类人居多、比例如何,三类人浏览时间的长短、频次、时段等等具体信息,对我们分层制定和改进传播策略都大有裨益。另外,获取用户需求的方式,除了被动地等待用户上网,还有搭建互动交流平台,组建相关网络社群这样主动引导的手段。现在很多Web2.0时代普遍的沟通互动做法,诸如针对不同的用户(专业研究者、普通读者、修志工作者)分别设立网络论坛、组建QQ群、微信群,开通微信公众号留言评论功能等,业界运用得都较少,需要我们尽快补上这些“短板”,避免工作方法上的“代差”。下面介绍一个微信公众号沟通互动实例:

2016年9月1日,微信公众号“静安方志”发布一文,名为《偶遇沪上旧影》。该文提到编辑部在搬迁整理旧物时偶然发现数本相册,内附旧照百余张,面对昔日斑驳旧痕,不禁感慨万千云云。该文结尾又说:“文中部分图片说明要素不完整,如有读者知晓正确图片信息要素(时间、地点等),请留言分享,将赠送精美礼品。”文下留言区内,有七位读者留言,或提供时间场地信息,或指正原文中照片说明文字的错误。有位叫“兔斯基”的读者在提供协助后,又满怀深情地讲:“(我)在静安生活了一辈子了。有机会再来参与辨认哦。”作者也热情地回复“兔斯基”,感谢其协助答疑解惑,并请其在微信平台留下联系方式,将有礼品奉上。由此,作者读者皆大欢喜,这就是一次颇为成功的互动。

上述实例说明,现在的互联网世界中,信息提供者(或生产者)同信息消费者之间的身份已经模糊难辨。加强与用户的互动交流,同他们形成紧密牢固的社群关系,不但能使我们更好地服务于他们,也可使用户来帮助我们生产地情信息(这就是UGC,即用户生产内容)。

(三)尝试打造“个性化”的信息化服务平台

Web3.0“智能筛选”“个性化聚合”的特征,预示着一个充分满足用户个性化需求的互联网时代即将到来。笔者由此设想,未来的方志信息化平台可以为每个用户提供个性化的信息服务,用户可以根据自己的需求来设计个人门户,自由定制资源和服务,而无需面对功能庞杂内容繁琐的统一界面:一个仅对地情信息、乡土历史感兴趣的读者,可以在自己的个人门户中聚合地情普及读物、视频等内容,干巴巴的志书文字无需出现在他面前;一个专业研究者,可以在自己的专属界面中集成其相关领域的所有地情信息,非研究领域的志书资料则自动屏蔽;一个修志工作者,可以在自己的网上工作室里组配上文字编辑模块、档案查询入口、资料整理模块、修志知识学习材料,指导信息反馈等内容。由此,大家各取所需,各得其所。

四、结语

Web3.0以其智能、个性、精准的特征引领互联网的未来发展方向。方志工作者应当顺应时势,以公众需求为核心,以Web3.0的视角来审视地方志信息化平台构建的课题,努力实现信息资源的有效联通与充分整合,为用户提供多向交互、多终端兼容、个性化的方志信息服务,扩大地方志工作的社会影响力,促进地方志工作持续发展。

K291/297

B

1003-434X(2017)06-0044-07

猜你喜欢
方志语义数据库
真实场景水下语义分割方法及数据集
Effects of O2 addition on the plasma uniformity and reactivity of Ar DBD excited by ns pulsed and AC power supplies
Development of a battery-operated floatingelectrode dielectric barrier discharge plasma device and its characteristics
The investigation of OH radicals produced in a DC glow discharge by laser-induced fluorescence spectrometry
语言与语义
黑龙江民国方志所刊名家墨迹选
数据库
批评话语分析中态度意向的邻近化语义构建
数据库
“吃+NP”的语义生成机制研究