陈超,吴亚东,付朝帅,童兴,李攀,褚琦凯,王雪楠
1. 四川轻化工大学计算机科学与工程学院,四川 自贡 643000;2. 四川省大数据可视化分析技术工程实验室,四川 宜宾 644000;3. 四川轻化工大学自动化与信息工程学院,四川 自贡 643000
中国白酒文化因其悠久的历史、丰富的内涵,在世界文化之林中独领风骚。其与诗词歌赋、文学典籍、书法绘画、散文戏曲以及影视音乐等艺术形式相辅相成[1],对中国历史文化、文学艺术、绘画艺术、宗教文化、民风民俗、科学技术、社会心理、军事研究等各个领域产生了巨大的影响,已经渗透到社会生活的各个方面。然而,中国白酒文化数据具有数据源广泛、多元化、复杂度高等特点,将可视化技术应用到中国白酒文化中,对于传播和弘扬中国白酒文化的丰富内涵、增强文化自信、促进国际文化交流具有重要作用。利用可视化技术的直观、易于理解、分析和交互等特性,可有效地支撑和推动中国白酒文化的表达、研究和传播。采用先进的数据可视化技术提高中国白酒文化的影响力、服务中国白酒文化建设成为一项重要课题。
自20世纪60年代以来,在计算机媒介的支撑下,人文知识的获取、分析、集成和展示方式都在发生重大变化。海量的图书、报纸、期刊、照片、绘本、乐曲、视频等资料被数字化,并上传到互联网供大众获取和使用,随之出现了许多优秀的历史信息化项目,例如中国历代人物传记数据库(CBDB)提取、整理了与近百万名历史人物相关的时空事件和关系信息。面对这种日益强化的数字化现状,2016年IEEE VIS会议将数字人文和可视化两个领域的专家聚在一起进行研讨,打破了传统文理学科与技术之间的壁垒,为可视化技术在数字人文领域的应用开辟了新的思路。数字人文为中国白酒文化可视化研究提供了强有力的数据支撑,数字人文和可视化技术的交叉融合为中国白酒文化可视化的发展奠定了重要的基础。
面向公众的中国白酒文化可视化应用主要采用可视化技术将与白酒文化相关的诗词歌赋、古籍文本、古迹文物及戏曲书画等晦涩枯燥的数据以直观生动的方式呈现出来,并借助交互技术吸引公众主动探索白酒文化,从而实现白酒文化的传播与传承。比如,酒具酒器可视化能帮助受众了解古今煮酒器、盛酒器、饮酒器、贮酒器的具体类型,制作材质从陶器、青铜器、漆器到瓷器的历史变迁过程,以及酒具酒器作为重要礼器所承载的礼仪文化。酒诗、酒词可视化能帮助受众了解中国白酒对诗词文化创作的影响,从咏诵古人诗词作品到探知古人“酒中赋诗、诗中有酒”的诗酒生活,进而感知古人创作诗词的情感。酒礼、酒俗可视化从民风民俗的角度展现历朝历代不同地区民族的农事节令、婚丧嫁娶、庆功祭奠、奉迎宾客等民俗活动中白酒的中心地位。酒令可视化从娱乐的角度全方位地展现劝酒行为的文明化和艺术化,打破公众对划拳行令的单一认知,举凡世间事物、人物、花木、虫禽、曲牌、诗文、中药以及种种风俗、节令,无不入令。
面向领域专家的中国白酒文化可视化应用借助可视化技术对专业领域知识进行分析,辅助决策。比如,可视分析技术可以帮助中国白酒文化研究专家系统地梳理中国白酒文化的研究现状、研究主题变迁、研究热点和研究方向,并在此基础上,分析、预测未来的发展趋势等。白酒文化可视化可以帮助领域专家分析中国白酒文化发展的历史脉络,建立白酒文化发展的知识谱系。中外白酒文化对比分析能帮助行业专家分析中西方的白酒文化差异,提升中国白酒的国际影响力。
中国白酒文化可视化流程可以分为4个层次:白酒文化数据采集层、白酒文化数据处理和分析层、白酒文化数据资源汇聚层、白酒文化可视化应用与交互层,如图1所示。
图1 中国白酒文化数据可视化流程
(1)白酒文化数据采集层
白酒文化数据具有碎片化、信息覆盖范围广等特点,因此,白酒文化数据主要从诗词歌赋、古籍文献、戏曲书画和古迹文物等信息源获取。获取的数据大多是多媒体数据,少有结构化数据,其中文本数据是最主要的数据类型,此外还有音频、图片、视频等文件数据。
(2)白酒文化数据处理和分析层
由于采集到的数据碎片化严重,需要先经过数据清洗等预处理,再进入信息分析提取阶段。基于自然语言处理算法(如长短期记忆(long short-term memory,LSTM)网络和卷积神经网络(convolutional neural network,CNN)等)实现文本信息分类和文本信息自动化提取[2-3],最终提取出关键信息,如时间、地点、人物、事件等。涉及古籍文本数据的,还需要借助古籍文本语料库进行文本挖掘[4-5]。
(3)白酒文化数据资源汇聚层
根据数据类型的不同,数据资源汇聚层可实现多种数据存储方式。结构化数据以文件的形式存储,如JSON、CSV、XML等,也可以以表结构的形式存储在结构化数据库中,如MySQL、Oracle等;非结构化数据可存储在非结构化数据库中,如MongoDB等,若信息量巨大,还需要采用大数据分布式存储技术,如Hadoop分布式文件系统(Hadoop distributed file system,HDFS)等。
(4)白酒文化可视化应用与交互层
通过可视化技术将白酒文化数据映射到图像空间,比如,采用文本数据可视化、多维数据可视化、时空数据可视化以及网络数据可视化等相关技术,为用户提供直观、可交互的图形化界面。
文化数据可视化技术很早就有应用,如Charles Minard将拿破仑1812年侵俄战争的行军图用流式地图的形式绘制出来,该图涵盖了地点、行军路线、人数、重大事件、温度等多个维度的信息[6]。2010年,北得克萨斯大学和斯坦福大学联合开发了由美国国家基金资助的数字人文可视化项目Mapping Texts[7],针对北得克萨斯大学图书馆数字化的约232 500页历史报纸进行文本挖掘,将其与地理空间分析结合起来进行可视化呈现。
中国的文化数据可视化应用尚在起步阶段,直接将可视化技术应用到中国白酒文化领域的研究更加稀少。随着近年来可视化技术在国内的推广普及,在一些文化领域有不少可视化研究成果涌现。
中国白酒文化与诗词歌赋、文学典籍、书法绘画和散文戏曲等文学作品密切融合。中国诗酒文化之滥觞的《诗经》中共提到“酒”62次(39篇),体现了人际心灵沟通和审美等多个精神层面的融合[8]。《水浒传》中出现饮酒场面647次,《三国演义》中出现饮酒场面319次,《西游记》中出现饮酒场面103次,《红楼梦》中出现饮酒场面152次[9]。“酒”在《白居易全集》中共出现840次,《杜甫全集》中出现204次,《李白全集》中出现250次,《韩愈全集》中出现138次,《柳宗元全集》中出现65次,《苏东坡全集》中出现1 151次。《唐诗三百首》中涉及酒的诗有46首;《宋词三百首》中与酒相关的词有126篇;《全元散曲》中近三分之二的篇章涉及“酒”,其中“酒”出现了1 121次,“醉”出现了936次,“饮”出现了211次,“杯”出现了259次,“樽”出现了192次[10]。此外,酒与书法、绘画、戏曲等文学作品更是相辅相成。
随着大量文学作品的完全数字化以及人工智能处理技术的发展,大批学者开始采用先进的可视分析技术对文学作品进行全新解析。2014年,张建立等人[11]在解析古诗词文本空间信息的基础上,基于地理信息系统(geographic information system,GIS)进行了空间可视化分析。2015年,阎思瑶等人[12]首次尝试将自然语言处理、计算数学和计算机动画等相关研究成果结合,用来解决古典诗词的动画自动生成问题。2016年,李欣哲[13]运用可视化技术将《诗经》中抽象的情感内容转换为可感知的形式,探索了在数字媒介环境下传播优秀传统文化经典的新途径。2017年,李舒迪[14]以可视化的形式展现了《红楼梦》诗词活动中的时序分布、人物关系、地理路线、诗词活动组织形式,该研究是文本可视化技术在中国古典文学上应用的新尝试。2018年,胡华华[15]通过可视化技术对宋词风格和词人流派演变历程进行了呈现,有助于人们从宏观层面对宋词风格流派演变进行认知和理解。2019年,张玮等人[16]提出了一套基于文本关联与时空可视分析的方法,通过对宋词文本的音律情感可视化与文本意象进行关联分析,让文学研究者可以从多个维度了解宋词文本的特性。2019年,吴潇等人[17]利用文本挖掘技术对近400首描写关中(现陕西省中部)风貌的唐代诗词进行筛选梳理,对人文景观情感特征、景观空间分布特征和空间语义网络特征展开多维信息可视分析。2020年,侯文军等人[18]设计并完成了包含京剧剧本列表、京剧剧本概览图、京剧剧本指纹图和京剧剧本情节图4个可视化模块在内的京剧剧本可视化系统,帮助对京剧了解程度不同的人更好地了解京剧剧本,有益于京剧文化的传播。
显而易见,文学作品分析与可视化在数字化后经历了3个阶段的探索:简单的统计分析阶段(如词频统计)、可视化阶段(信息提取后直接可视化呈现,如空间信息可视化、文本信息可视化)、可视分析阶段(文本挖掘后进行可视分析,如情感分析可视化、关联信息可视分析等)。
中国文明进化史与白酒文化的发展密不可分,在河南省贾湖遗址发现的9 000年以前的酿酒痕迹是最好的证据[19]。国内与白酒文化相关的考古遗存非常丰富,这些遗迹和遗物种类多样,从不同角度反映了当时人们的酿酒、饮酒等生活细节,为后人研究酿酒技术、酒礼、酒俗、经济、艺术等提供了宝贵资料。
目前与白酒文化相关的考古遗址及历史文物可视化研究还未起步,但是在考古领域,可视化技术并未缺席。覃京燕[20]提出了运用信息思维方法指导数字化文化遗产项目的整体策划,基于信息可视化模型和信息可视化设计原则,进行数字化文化遗产中信息管理、信息呈现和信息传播的设计。Jang M H[21]采用三维可视化技术为韩国延三河流域的历史文化遗产绘制了情感地图。Han J G等人[22]利用增强现实技术对文化遗产地、建筑文化遗产和历史遗迹修复数字内容的开发进行了研究,建立了户外文化遗址三维模型可视化系统。Gupta N等人[23]提出的适合考古数据的地理可视化以及地理可视化分析工具能很好地解决考古现象的复杂性和多样性。Gómez J M N等人[24]使用全景球面摄影和地面激光扫描技术,建立了卡塞雷斯省历史和文化遗产的交互式三维可视化系统。Wang B S等人[25]采用虚拟现实技术建立了二维地图和三维城市模型,以及可视化叙事平台,以提升公众的文化遗产保护意识。张加万团队借助图像分析、机器学习与摄影测量学等技术,建立了一套“本体监测-关联分析-实验室研究-反向控制”的预防性保护风险管理预控系统,实现了敦煌壁画病害的可视分析。
考古遗址及历史文物领域的可视化研究主要集中在采用三维建模还原考古遗址和文物、运用虚拟现实技术和增强现实技术实现交互性方面。对文物情感可视分析以及基于图像分析技术的文物病害的可视分析等新兴领域的研究有待进一步深入。
历史变迁与历史人物之间是相互依存的关系,人类在历史长河中不断地书写着历史。从微观视角审视历史,能看到一个个历史人物的人生历程,其中不少历史人物饮酒后留下了文学佳作或传奇故事,他们本身也成为白酒文化的一部分;从宏观视角审视历史,可以看得到文化中心、城镇中心的变迁以及文化流派的演变过程。
在宏观的历史变迁可视分析方面,国内外学者进行了初步探索[16,26-32]。Schich M等人[26]使用大规模可视化技术追溯了欧洲和北美2 000多年来的文化叙事,描绘了历史名人的迁徙模式及文化中心的历史趋势。Cho I等人[27]开发的VAiRoma系统对罗马历史中的重大事件、时间、地点等信息进行了可视分析。胡华华[15]采用散点图从宋词词人的分期迭代和词人所属的流派分类两个角度呈现宋词词人流派的历史演变进程,呈现词人流派群体随着历史推进而出现盛衰涨落的变化轨迹。
国内学者更加关注微观视角的历史人物可视分析。吴旻家等人[28]从地理空间分析的角度对李白的漫游轨迹以及诗歌中的地理空间进行了研究,从而分析李白的行为空间与诗歌空间。刘菊等人[29]建立了古琴名人时空信息采集系统,动态展示古琴名人的二维轨迹与三维轨迹,并结合古琴知识图谱,实现古琴名人相关信息的智能化查询。邹亚国等人[30]提出了首都距、家乡距、迁徙指数、前台指数、轨迹透视图等人生轨迹分析指标,并结合核密度、标准差椭圆等空间分析方法,对历史名人的人生轨迹进行探索性分析。张玮等人[16]参照基于词典的情感分析算法,设计了词人人生起伏视图,并与词作数量相关联,分析了词人一生的跌宕起伏。王妮满等人[31]基于WebGIS进行了地图叙事性的可视化尝试,探索了历史人物轨迹数据由文本格式到地图空间可视化的方法,对历史名人的行为轨迹、社交关系进行空间化和可视化。黄娟等人[32]基于异构名人文化数据,构建了名人文化数字化框架,着重解决名人文化数据的组织与可视化问题。
在历史变迁可视分析方面,国外学者大多聚焦在庞大、多维度的历史数据宏观分析,国内学者更多侧重研究小数据集的、单一领域的数据分析。历史人物可视分析是国内学者较关注的领域,目前多数研究成果集中在基于时空可视化技术的人物行迹可视化方面,但是也有不少深入的探索分析,如人物轨迹与作品风格的关系[28]、人物社交网络的关系[32]、人物人生起伏与作品数量的关系[16]等。
目前可视化技术在中国白酒文化领域的研究尚在起步阶段,研究成果主要集中在知识图谱可视化领域。陈于后[33]对四川酒文化研究的现状、研究主题的变迁、研究热点、研究方向和研究趋势等方面进行了探讨,并采用可视化方法构建了知识图谱。蒋玉石等人[34]绘制了白酒企业经济研究学者、研究机构和研究主题的知识图谱,使用数据可视化的方法还原了近15年来中国白酒企业经济研究的发展历程。与白酒文化密切相关的文化数据可视化技术研究较为全面,从技术角度可以划分为四大类:文本数据可视化、网络数据可视化、时空数据可视化、多维数据可视化。
文本数据可视化综合了文本分析、数据挖掘、数据可视化、计算机图形学、人机交互、认知科学等学科的理论和方法,将文本中复杂的或者难以通过文字表达的内容和规律以视觉符号的形式表达出来,同时向人们提供与视觉信息进行快速交互的功能,使人们能够利用视觉感知的并行化处理能力,快速获取文本信息中蕴含的主题、结构或情感态度等方面的关键信息[35]。
(1)基于词频的文本可视化
词频是一种进行情报检索和文本挖掘的常用加权技术,用于评估一个词在一个文件或者一个语料库中的一个领域文件集中的重复程度。统计文本中的词频能直观地体现其重要性,从而展现文本特征。目前基于词频的文本可视化技术主要集中在词云及其变种等方面。参考文献[32]采用经典词云图展示了民国时期关键名人的热度,如图2(a)所示;参考文献[36]采用聚类词云图展现了世界五百强企业,通过企业所在国家进行聚类,体现五百强企业的分布情况,如图2(b)所示;参考文献[16]通过改进的区域词云视图,展现了词人在不同时期的作品词频,如图2(c)所示;参考文献[37]通过气泡图展现某一朝代姓氏的占比排行情况,气泡越大表示该姓氏的占比越大,如图2(d)所示。
(2)基于词义的文本可视化
基于词频的可视化无法表现文档关键词语义之间的联系,基于语义的文本可视化主要关注文本的内在语法结构和语义关系。目前经典的基于词义的文本可视化技术主要有语义网(phrase net)[38]、语义树(word tree)[39]和DocuBurst[40]等。Van Ham F等人[38]分析 了简·奥斯汀的小说《傲慢与偏见》中“X and Y”结构,并构造了语义网。Wattenberg M等人[39]为马丁·路德·金的历史性演讲“I have a dream”构建了语义树。Collins C等人[40]的研究中采用DocuBurst的形式来显示文本内容的结构,并通过径向布局体现了词的语义等级。
(3)多信息文本数据可视化
文本数据视化在文化领域的应用不仅是对关键词及其语义关系的信息提取,更重要的是对文本中包含的情感、意图等不同维度的信息的处理。许多文本数据可视化方法[13,16,18]通过对文本中多维信息的处理来形成联合数据可视化。目前多信息文本数据可视化的呈现方式主要有桑基图、多图关联以及信息叠加等多种形式。如参考文献[13]通过关键词提取、情感识别的文本分析结果,直观反映《诗经》的主题、情感分布情况,如图3(a)所示。参考文献[16]用颜色代表情绪,用折线代表字音节的语调值,展示宋词的情感音律,构造情感音律视图,再通过关系图将情感音律视图与语言运用视图关联起来,如图3(b)所示。参考文献[18]采用京剧剧本指纹图对京剧剧本的文本结构进行辅助标识,通过方形像素块的颜色代表的句长及白线代表的方差值标识出念白、唱词等,以便快速定位到文本片段,如图3(c)所示。
图2 词云图
图3 多信息文本数据可视化
通过抽取出与白酒文化相关的诗词文本,笔者将文本数据可视化方法应用于白酒文化可视化,通过统计不同作者的酒诗、酒词中的词频,使用随机词云图实现白酒诗词文本可视化,如图4(a)所示;并通过机器学习的分类算法对诗、词体裁进行分类,以桑基图呈现诗词作者、派别及体裁之间的联系,如图4(b)所示。
图4 白酒文化之诗词文本数据可视化
网络数据可视化指在有限空间中对具有海量节点和边的大规模网络进行可视化。网络数据关系是文化可视化中常见的数据类型,如事物之间的关联、人物之间的社交网络等,常用树形图、圆形树图、力导向图和关系图等方式呈现。网络数据可视化中的每个节点代表一个对象,节点间的连线代表对象之间的关联关系。如参考文献[13]通过树形图由内而外的层次关联属性,形象、高效地表示出《诗经》的章节、小节、题目、内容等层次化数据的关系,如图5(a)所示。参考文献[41]通过树形图展现中华烹饪文化知识库中文本的分布情况和关键主题之间的关系,如烹饪知识包含推荐菜谱和食材简介,饮食文化包含文化故事和美食攻略。参考文献[14,31-32,42-44]使用力导向图和关系图等分析了历史名人的人际关系网,如图5(b)所示。
图5 网络数据可视化
笔者将网络数据可视化方法应用于白酒文化可视化,采用力导向图分析不同作者所作作品的题材分类。力导向图中第一层节点代表诗或词,第二层节点代表作者,第三层节点代表题材类型,各节点的大小代表作品数量,可直观地呈现每位作者的题材偏好,如图6所示。
(1)地理空间数据可视化
地理空间数据可视化是指运用地图学、计算机图形学和图像处理技术,将地学信息输入、处理、査询、分析以及预测的数据及结果采用图形符号、图形、图像,并结合图表、文字、表格、视频、音频等可视化形式显示,进行交互处理的理论、方法和技术。目前地理空间数据可视化从维度上可以分为二维和三维地理空间维度,从形式上可以分为基于点、基于点线结合、基于区域的地理空间形式。参考文献[11,28-31]采用不同的核密度分析方法,基于地理信息系统标注了历 史人物低、中、高轨迹点核密度,实现了对名人活动轨迹的核密度分析及可视化。
参考文献[16]先采用基于区域的地理空间可视化技术渲染出宋朝时期历史疆域范围,再采用基于点的地理空间数据可视化技术展示了宋朝词人的地理空间分布情况。参考文献[5,14-15,31,37]采用基于点线结合的地理空间数据可视化技术,实现了历史人物活动轨迹的可视化。参考文献[37]采用基于区域的地理空间数据可视化技术及图层叠加技术,清晰地展示了唐朝、宋朝、元朝、明朝和清朝等不同历史时期中国疆域的变迁过程。参考文献[13]的国风情感地图采用基于区域的地理空间数据可视化技术,诠释了《诗经》国风篇中不同风格的民间诗歌类别所涉及的疆域范围,并在此基础上用区域边界的颜色表示喜怒哀乐等不同的诗歌情感。
(2)时间序列数据可视化
图6 白酒文化之诗词题材分类力导向图
时间序列数据可视化是针对具有时间属性的数据集进行的呈现形式,当前主流的呈现形式有 河流图、散点图、时间轴等多种样式。参考文献[13]的时间情感河流图采用主题河流图技术,以君主时期为横轴时间坐标,呈现《诗经》整个创作周期的情感变化趋势,如图7(a)所示。参考文献[14]中的创作诗词时序图采用散点时序图形式,展现《红楼梦》诗词活动中林黛玉等人创作诗词的先后顺序,如图7(b)所示。
(3)时空立方体可视化
图7 时间序列可视化
时空立方体可视化是指将地理空间信息和时间序列信息融合在一起,构造的三维立体可视化效果,其可以帮助用户理解复杂空间信息的时间变化规律,主流的时空展现形式有组图对比型、二维平面叠加时间轴型以及三维时空立方体等。参考文献[30]中的人生轨迹点时空格局 图采用平铺成组的西汉、唐、北宋、元、明、清6个朝代的二维地图,分别呈现该朝代历史名人聚集区域,通过对比方法,直观呈现了各朝代历史名人聚集区域的变迁过程,这种可视化方法能展现离散的时间节点上的空间数据。参考文献[29,45]构建了三维的时空立方体,纵轴为时间序列,横轴所在平面为地理空间维度,分别刻画了古琴名人的三维时空运动轨迹和红军四渡赤水的时空立方体。
参考文献[16]将词人按照地点和时间划分成几个人生阶段,通过地图视图中地点经纬度和时间序列视图中事件的时间之间的关联,以二维形式呈现词人在不同人生阶段停留的地区。参考文献[27]同样采用二维地理空间视图叠加时间轴的方式,呈现了罗马历史中战争时期热度中心的迁移过程。
笔者将时空数据可视化方法应用于白酒文化可视化,基于历史名人轨迹数据库,建立了白酒诗词作者的人生轨迹时空可视化,在二维地图上采用点线结合的方式描绘作者的人生轨迹,辅以时间图例显示作者不同年龄段的线段颜色,在浮框中以时间轴的方式显示作者不同时间段的生平介绍,地图与浮框以联动方式实现交互,如图8所示。
图8 白酒文化之诗人生平轨迹可视化
多维数据可视化指的是同时将具有多个维度属性的数据变量进行可视化展现,多维数据可视化的呈现形式多样,根据数据的维度不同,设计方案各不相同,典型的代表有地理空间信息叠加其他信息、时间序列信息关联多种维度信息,呈现形式有单图可交互式(一个图集成多个维度信息,通过交互聚焦某一维度数据)、多维空间立体式(如地理空间叠加情感、时间等),更多的用法是多视图联动式(通过不同视图呈现不同维度的信息,但视图之间存在关联)。参考文献[27]中设计的圆形主题视图从时间、热度排行、占比等维度呈现主题的变化过程。参考文献[46]设计的语义时空立方体采用多视图联动的形式同时展示时间序列、地理空间分布和语义变化趋势。
参考文献[17]采用三维立体方式,在二维地理信息基础上叠加纵轴方向的情感分类,呈现了关中地区正面、中性、负面人文景观情感空间分布,如图9(a)所示。参考文献[47]通过基于时间序列的散点图的设计,分析了史诗《英雄格萨尔》中热点人物出场的频率及章节分布情况,其中横轴代表史诗的章节,纵轴代表人物信息,散点的大小代表人物出场的频率,将横轴与纵轴结合起来还能体现同一章节中人物之间的关联信息,如图9(b)所示。参考文献[15]将散点图和主题河流图结合起来,散点代表该时期的代表性词人,主题河流图中的横轴是年代,同时标注了重要历史事件,纵轴代表文学风格流派。多维信息叠加既能呈现某个时间区域内在宋词词坛文学风格流派的影响力强弱的对比变化,又能将宋词风格流派的演变与词人作者相关联,体现词人对流派的影响,如图9(c)所示。
笔者将多维数据可视化方法应用于白酒文化可视化,基于以酒具酒器为主题的数据库(包括酒具酒器的类型、用途、材质、朝代以及古籍文献出处等多个维度的数据),采用桑基图关联酒具、酒器的类型与用途、材质和朝代,并采用桑基图与动画联动的交互方式,动态书写该类酒具酒器的古籍文献出处,如图10(a)所示。同时,基于酒具酒器的文物数据和交互数据,采用树状图动态呈现酒类器具名称与类型之间的关系,如图10(b)所示。
中国白酒文化大数据具有数据源广泛、多元化、数据离散型大、数据边界模糊性强、复杂度高等特点,当前的可视化方法主要集中在数据缩放技术、多视图联动技术以及查询和过滤技术等支持可视化推理与人机交互的重要技术[48]。比如,在时间序列视图中,数据缩放技术能关注历史长河中某一朝代甚至某一年代的细节信息;在多维数据可视化视图中,通常用多视图联动技术关联不同视图中不同维度的数据,通过交互能够帮助用户感知同一条件下不同维度的信息之间的关系和规律;对于中国白酒文化的海量数据,可以通过查询和过滤技术帮助用户快速聚焦感兴趣的信息。
这些具有交互能力的可视化方法可以帮助用户关注细节信息和少量维度的关联信息,但是不利于从宏观层面将多元、离散的数据进行关联,进行数据分析和挖掘,更无法解决边界模糊性和复杂性问题。同时,从文化传播的需求出发,中国白酒文化的可视化效果需要兼具艺术观赏性,因此从中国白酒文化数据属性出发,研究满足需求的可视分析方法将成为该领域的研究热点。
可交互的白酒文化可视化应用研发是提高新生代对白酒文化兴趣的关键。可视分析采用的交互技术应是贴近用户认知心理的、支持直接操做的、自然的交互技术[49],因此基于触摸屏、写字笔甚至手势感应的自然交互技术也应该被合理地运用到中国白酒文化可视化的应用研究中。
图9 多维数据可视化
图10 白酒文化之酒具酒器多维数据可视化
增强现实和虚拟现实都具备较强的交互性,可作为白酒文化可视化的交互手段使用,比如通过增强现实技术构造全仿真的三维酒文化博物馆,体验者足不出户即可随意参观;通过虚拟现实技术虚拟仿真少数民族酒文化场景,融合少数民族服装、节日、祝酒歌、舞蹈等多维元素,给体验者沉浸式的文化感受。
中国白酒文化大数据具有多样性、碎片化等特点,这给数据的预处理和挖掘分析带来了很大困难。有效地实现文本分类,提升自动化信息提取的准确性,都是近年来学者研究的热点[2,3,50-51]。文本情感分析、人物关系推理等深入挖掘分析的算法有待进一步探索。此外,古籍文本的文本分析难度远高于白话文文本分析,构建全面的语料库并不断优化分析算法也将成为学者面临的重大课题。大规模、多维度的历史数据宏观分析仍是国内研究的未来热点,云计算与大数据技术的高速发展为该领域的研究提供了技术支撑。
当前主流的可视化技术的研究主要集中在数字文本数据可视化层面,中国白酒文化数据的多媒体属性意味着可视化技术需要展示的不仅仅是数字文本数据,还包含更多元的信息,如考古发掘的酒具酒器以图片方式传播、民风民俗中存在的祝酒歌以音频为载体、与白酒文化相关的戏曲以视频为载体、白酒香型以嗅觉形式感知等。因此,研究多媒体信息的可视化技术也将成为中国白酒文化可视化主要的研究方向之一。
本文从中国白酒文化可视化应用研究的视角出发,分析了中国白酒文化可视化的应用场景,阐述了中国白酒文化可视化的流程,并从文学作品分析与可视化、考古遗址及历史文物可视化、历史变迁及历史人物可视分析3个维度入手,分析了中国白酒文化数据的特点,探讨了中国白酒文化可视化应用研究的现有成果与未来方向。通过对相关文献的可视化技术进行进一步的分类整理,总结了文本数据可视化、网络数据可视化、时空数据可视化和多维数据可视化4个技术类别分别在文化可视化领域的应用情况,并给出了中国白酒文化可视化未来的研究热点。当前中国白酒文化可视化的研究尚在起步阶段,相信不断改进的数据分析技术能实现对中国白酒文化更深、更广的挖掘和分析;通过多媒体可视化技术的研究,能实现多种感知信息的可视化,提升用户的全方位学习和体验;采用先进的人机交互技术,能让公众对中国白酒文化有更深入的体验。