基于大数据技术的智慧博物馆建设调查研究——以红旗渠纪念馆为例

2022-04-09 12:56刘海李昱锋王晓钰刘明阳石钊宇王宗超
电脑知识与技术 2022年6期
关键词:大数据技术数据处理

刘海 李昱锋 王晓钰 刘明阳 石钊宇 王宗超

摘要:随着信息技术的发展,互联网技术扩展了人们了解博物馆相关信息的途径,同时也为智慧博物馆的建设提供了更多的可能性。但是由于不同种类博物馆之间属性不同,侧重点不同,继而智慧化建设过程中面临的问题也存在较大差异,但是归根到底,智慧化博物馆的建设都是要以数据为基础的,并且要以受游客欢迎为目标的,因此还是要回归到对博物馆数据的规划和处理方面。该文以红旗渠纪念馆为例,利用大数据技术就智慧化红旗渠纪念馆建设进行数据来源、数据分类和数据特点的调查分析,在此基础上确定了符合大数据技术处理规则和符合功能需求的红旗渠纪念馆数据处理原则。

关键词:智慧博物馆; 大数据技术; 红旗渠纪念馆; 数据规划; 数据处理

中图分类号:TP311        文献标识码:A

文章编号:1009-3044(2022)06-0013-03

开放科学(资源服务)标识码(OSID):

1 背景介绍

信息技术的发展诞生了很多新生的行业,也在促使新的行业不断发展和壮大,例如短视频行业、电商行业、编程行业。新行业的发展一方面在冲击着传统行业走向没落,例如传统的纸质书和纸质报纸等信息载体正在逐渐从市场中消退;但在另一方面,新行业的发展也给传统行业实现变革提供了无限生机,例如随着纸质信息载体的没落,新兴的微博、抖音等信息技术载体反而给信息的衍生和传播提供了更强大的活力。

博物館是征集、典藏、陈列和研究自然和人类文化遗产实物的场所,对馆藏物品分类管理,为公众提供知识、教育和欣赏的文化教育机构、建筑物、地点或者社会公共机构[1]。纪念馆是博物馆的一种特殊类型,它具有一般博物馆的基本性质,即“博物馆是科学研究机关,文化教育机关,物质文化与精神文化遗存或自然标本的主要收藏所,基本任务——为科学研究服务,为广大人民服务”[2]。作为传统文化中最为精髓的一部分,博物馆在文化传播与文化养成方面具有十分重要的作用,然而通过作者对身边人员的简单调查却发现,在调查的117人中,有61人近一年没有去过博物馆(包括纪念馆),占比为53.51%,调查结果如图1所示。而在去过的53人里,去过1次的是18人,占比33.96%,去过两次的是19人,占比35.85%。一年大于四次的仅仅为7人,占比13.21%,调查结果如图2所示。由上述调查结果可知,在作者的调查人群中每年参观博物馆的人数不足50%,参观次数以1次和2次为主,由于调查样本过小,调查结果可能存在一定的误差,但是这也能在一定程度上反映出博物馆目前还存在很大程度的改进空间以进一步吸引更多的人群参观。

接着作者又对近一年除博物馆(包括纪念馆)外,主要通过何种途径了解到相关博物馆(包括纪念馆)馆藏品进行了简单的调查,在调查的114人中,通过抖音、快手、微视等短视频平台了解的占42.11%,通过微博、朋友圈和QQ空间等共享数据平台了解的占35.09%,调查结果如图3所示。由上述调查结果可见,随着信息技术的发展,相比较传统而言,人们获取博物馆相关信息的方式已经发生了很大的变化。

虽说信息技术所衍生的多媒体技术可以让更多的人通过更加便捷的方式获取相关博物馆(包括纪念馆)馆藏品信息,但并不是所有的馆藏品信息都能通过多媒体技术进行传播和展示,很多馆藏品由于历史和特定事件所赋予的“痕迹”,只有通过现场观看才能直面文化的魅力,例如出土于安阳的后母戊鼎,无论是视频、图片和文字怎么样去描述其宏大,都不如站在旁边切切实实地感受。

综上所述,作为传统行业的博物馆,要想在信息化时代吸引更多的游客进行参观,就需要结合信息化时代的多媒体特征和相关的信息化技术,建设更加符合时代特色、符合游客需求、符合信息化特征和符合自身特点的智慧博物馆。

2 现状分析

近年来,已经有很多博物馆结合先进的信息化技术开始了智慧博物馆的构建工作,并且也已经积累了大量的经验和数据,例如经作者调研,红旗渠纪念馆中就建设有智能振动平台1组,其可以根据振动平台前方视频中播放的火药爆破山体场景产生振动效果,给人以视觉、听觉和感官的多重体验。但是拥有经验和数据并不代表就能充分地发挥博物馆自身的价值,只有把博物馆目前的数据进行科学统一的规划和处理,才能最大限度地发挥数据自身的价值。例如经作者调研,红旗渠纪念馆中的智能振动平台,其作用目前就是振动,没有其他的作用,但是如果能在其上面加入一些传感器,例如压力传感器,那么就能根据人体脚面的尺寸和重量等数据进一步分析其受欢迎的人数,乃至于其受欢迎的性别和年龄情况等数据,同时也可以检测到振动平台自身的承载和安全情况。

而在实际的智慧博物馆运行中,博物馆数据规划和处理还存在一些较大的问题。首先是数据的多样性问题。图片数据、视频数据、文字数据和数字数据并存,类型多样化,规划和处理难度较大;其次是数据的重要性问题。馆藏品数据价值密度高,其价值随着时间流逝而降低的可能性较低,而每日的游客访问数据价值密度低,其价值随着时间流逝而降低的可能性较高;最后是数据的侧重点问题。因为博物馆(包括纪念馆)属性不同,因此其在数据的侧重点方面也存在较大差异,对于一些文物类博物馆,其侧重点应该在重点文物的保护、重点文物的突出以及重点文物的历史价值等方面,也就是说其侧重的是文物本身。而对于一些纪念类博物馆(即纪念馆),其侧重点应该在展品所延伸出来的历史事件方面,通过展品让参观者了解历史事件、感悟事件精神。不同的纪念馆历史事件的属性不同,其在数据方面的侧重点也是不同的。

3 红旗渠纪念馆大数据调查分析

3.1 整体分析

综上所述,智慧博物馆的建设要从博物馆(包括纪念馆)自身的定位和特色出发,结合目前先进的互联网技术,经实地调研,参考国内外智慧博物馆的先进建设经验展开,这样才能设计出更符合自身特色、受群众欢迎,具有较大影响力的博物馆。本章节主要从博物馆运行的各个环节出发,以博物馆运行过程中产生的海量数据为导向,结合目前先进的大数据技术,就海量数据的规划和处理展开智慧博物馆的研究。在具体研究方面,本章节以红旗渠纪念馆为研究主体,经实地调研、调查问卷和文献资料汇总得出了红旗渠纪念馆的数据来源、数据分类和数据特点,在此基础上确定了符合大数据技术处理规则和符合功能需求的红旗渠纪念馆数据处理原则。

3.2 红旗渠纪念馆数据调查

该文的目的在于利用大数据技术对红旗渠纪念馆的相关数据进行统一的规划和处理,首先要做的工作就是确定红旗渠纪念馆的数据来源和组成,经作者实地调查和研究,与红旗渠纪念馆相关的数据目前大致可以分为以下两类:

(1) 红旗渠纪念馆自身在运行过程中产生的数据,例如馆藏品数据、游客数据和售票数据。

(2) 通过红旗渠纪念馆衍生出来的数据,比如抖音上有关红旗渠纪念馆视频的点赞、观看和评论数据;微博上有关红旗渠纪念馆文字和图片的点赞、观看和评论数据。

经作者对红旗渠纪念馆数据来源进行实地调查、文献查找和多次深入讨论研究后,得出红旗渠纪念馆的相关数据来源存在以下三个特点:

(1) 数据格式多。在所有已知的数据中,存有文字数据、数字数据、图片数据、视频数据,还有相当数量的纸质数据。

(2) 数据相关性差。每一部分数据都属于一个独立的系统,彼此关联性较差,例如红旗渠纪念馆的馆藏品数据和游客数据几乎是毫不相关的,这对于研究和分析游客对馆藏品陈设的喜爱程度非常不便。

(3) 数据价值密度低。网络上每天关于红旗渠纪念馆的各类视频、图片和评论等数据非常多,并且来源也非常广,但是能从中分析得到的对红旗渠纪念馆智慧化建设的有用信息不一定最多。

对来源复杂、特点众多的红旗渠纪念馆数据进行统一的数据规划和处理,需要满足以下两个条件:

(1) 符合大数据技术的相关处理准则。就目前的大数据技术而言,对于结构化数据,例如存储于纪念馆中结构化数据库中的数据,因为其在格式上和字段上都符合计算机的数据处理规则,因此在大数据分析前的数据清洗方面无须太多工作。但是就红旗渠纪念馆的数据来源和数据特点来看,结构化数据占比并不多,更多的是一些图片、视频和文字等非结构化数据。非结构化数据无论是在格式上还是在内容上,都是杂乱无章的,要想从中分析出有价值的信息,就要结合实际的需求,在大数据分析前对非结构化数据展开大量的清洗工作。

(2) 满足智慧博物馆大数据分析的功能需求。在进行非结构化数据的数据清洗之前,一定要确定的是项目的需求分析,即大数据分析是为了满足什么样的需求,最终实现什么样的目的;不同的需求或者目的之间是否涉及多个数据集的关联。只有思考清楚这些问题,对于非结构化数据的清洗才变得有意义,才能从众多杂乱无章的数据中清洗出对智慧博物馆建设有意义的数据。

3.3 红旗渠纪念馆大数据技术研究思路

结合上述分析可知,该文的目的主要是通过智慧博物馆中的大数据技术对红旗渠纪念馆现有数据进行规划和分析,以为能建设出受广大群众欢迎、具有较强影响力的智慧红旗渠纪念馆提供一些建设性的意见。因此论文的整体需求还是要以红旗渠纪念馆受游客的喜爱度为根本,即通过大数据技术对红旗渠纪念馆现有数据进行大数据分析后,根据分析结果进一步优化纪念馆的建设。

从大数据分析全流程的角度来看,大数据技术主要包括数据采集与预处理、数据存储与管理、数据处理与分析、数据可视化和隐私保护等几个层面的内容[3],并且这几个层面是存在一个先后发展和相辅相成的关系,也就是说只有提前完成了数据的采集和预处理工作,才能进行数据的存储和分析工作,否则就相当于是无本之木,无水之源。也只有提前做好,做完备数据的采集和预处理工作,才能为后续的大数据处理和可视化提供坚强的支撑。同时,数据的采集和预处理工作也要根据数据分析和可视化的反馈结果进行适当调整,以使得整个智慧博物馆大数据系统更加完善和符合实际的需求。

本文在前期的工作中已对红旗渠纪念馆的数据来源进行了详细的分析,从上述整体分析可知红旗渠纪念馆数据来源和特点的复杂性,因此作者认为智慧化红旗渠纪念馆大数据的研究工作应主要集中于红旗渠纪念馆数据的采集和预处理工作。但是数据的采集和预处理工作并不是单独运行,与其他阶段大数据技术独立存在的工作,数据分析与可视化的要求和结果也是在数据的采集与预处理阶段需要参考的方面。

就大数据分析工作而言,常用的大數据计算模式主要有批处理计算、查询分析计算、图计算、流计算、迭代计算、内存计算等[4,5]。不同的计算模式所分析的数据种类是不尽相同的,例如批处理计算模式主要分析大规模的数据;流计算模式主要分析实时的数据,并可以实时地得出有价值的结果;图计算主要分析大规模图结构数据。因此,尽管说红旗渠纪念馆的数据来源纷繁复杂,但是大数据众多的计算模式为其智慧化建设提供了最契合的解决方案。智慧化红旗渠纪念馆大数据的研究工作应以大数据计算模式为反馈,以吸引游客为目的,结合红旗渠纪念馆的数据来源,针对不同的数据特点,对数据进行详细和完善的采集和预处理分析。基于大数据的智慧化红旗渠纪念馆整体调查研究思路框架图如图4所示。

4 总结

本文首先通过一系列调查问卷得出目前博物馆的游览情况并不理想,而通过信息技术等平台了解博物馆相关信息的占比越来越高,但是由于博物馆具有“百闻不如一见”的不可取代性,因此如能把互联网信息化技术应用于博物馆建设过程中,必将促使博物馆更具特色和受欢迎。因为不同博物馆属性不同,侧重点不同,继而智慧化建设过程中面临的问题也存在较大差异,但是归根到底智慧化博物馆的建设都是要以数据为基础的,并且要以受游客欢迎为目标展开的,因此还是要回归到对博物馆数据的规划和处理上。大数据技术具有得天独厚的数据处理优势,如果能利用大数据技术对博物馆相关数据进行收集、处理和分析,必将对智慧博物馆的建设提供坚强的支撑。其次在具体研究方面,本文以红旗渠纪念馆为例,确定了红旗渠纪念馆的数据来源,对数据进行了分类,总结出数据的三大特点,在此基础上确定了数据处理的两大原则:符合大数据技术处理原则和符合功能需求原则。最后通过分析大数据技术流程和计算模式,鉴于红旗渠纪念馆大数据研究的复杂性和重要性,主要就红旗渠纪念馆的数据采集和处理工作研究思路进行了阐述。

参考文献:

[1] 王文析.浅谈文物视频供给侧服务——河南博物院《中原藏珍》系列短片摄制推送的实践与思考[J].河南博物院院刊,2021(2):121-129.

[2] 杜丁华.试论纪念馆的性质及特点[A].湖南省博物馆学会.博物馆学文集1[C].湖南省博物馆学会:湖南省博物馆学会,1982.

[3] 林子雨,赖永炫,陶继平.Spark编程基础(Scala版)[M].北京:人民邮电出版社,2018.

[4] 龙虎,彭志勇.大数据计算模式与平台架构研究[J].凯里学院学报,2019,37(3):73-76.

[5] 姚舸.大数据平台安全架构体系研究[J].信息记录材料,2019,20(10):181-183.

【通联编辑:代影】

猜你喜欢
大数据技术数据处理
认知诊断缺失数据处理方法的比较:零替换、多重插补与极大似然估计法*
ILWT-EEMD数据处理的ELM滚动轴承故障诊断
大数据技术在电子商务中的应用
大数据技术对新闻业务的影响研究
大数据技术在电气工程中的应用探讨
大数据技术在商业银行中的应用分析
MATLAB在化学工程与工艺实验数据处理中的应用
Matlab在密立根油滴实验数据处理中的应用
基于POS AV610与PPP的车辆导航数据处理
依托陆态网的GNSS远程数据处理软件开发