张 倩
(南京艺术学院,江苏南京,210013)
进入web2.0 时代,互联网具有了互动功能,用户通过注册身份可以参与信息的制造和流通,特别是用户行为大数据分析的应用价值,迅速得到了各行各业的青睐。大数据技术不仅发现了用户基本信息资料记录的使用价值,而且研发出了用户行为数据增值的“智能挖掘系统”。
本文通过深入考察互联网“用户行为大数据分析”的技术创新案例,试图在揭示其基本涵义、研究意义和数据源集成机制的基础上,探究高校档案用户行为大数据分析的应用前景,并提出模式创新的设计重点与技术要领,以利驱动高校档案机构不断推出增值服务。
大数据技术之所以迅速得到各行各业的青睐和热捧,就是因其能够利用“用户行为大数据分析”的技术手段,为互联网“数据废气”变废为宝提供机遇与途径。为了解和掌握“档案用户行为大数据分析”的基本内涵与应用价值,笔者作了如下考察:
首先,何为“档案用户行为信息”?笔者认为,其主要是指:档案用户在档案网站或档案信息管理系统等环境中发生的检索、浏览、下载等行为(数据痕迹),并包括用户在第三方网站上与档案实践活动相关的行为,如社交媒体上的交流、参与讨论、查看相关评价、与好友互动等产生的行为。
其次,什么是“档案用户行为大数据分析”?笔者认为,其主要是指:通过把淹没在档案用户行为海量数据中杂乱无章的数据经过数据收集和提炼,获取有效数据,并挖掘隐藏在用户行为数据背后的信息,研究其数据价值的过程。这项技术的核心价值在于:能够事先根据不同档案用户在线发生的行为事件,分析出不同用户的行为特性,并将智能数据服务平台集成的用户需求预测结果与其优化匹配(Match),进而达到不断发掘数据潜在价值之目的。
第三,为什么要进行“档案用户行为大数据分析”?笔者认为,其主要是指:在看似毫无用处的“数据垃圾”背后,隐藏着宝贵的使用价值,即“数据持有人可以从历史数据中推测判断出行为人的下一步动作——个人的行动轨迹、行为轨迹,甚至思维轨迹[1]。”档案管理机构利用“大数据X光机”探究各类行为轨迹背后的本质,不仅能够通过串联基于档案用户行为的参考数据,对在线用户进行360 度视角的剖 析 ,最 终 提 供 可 视 化(Visualization)的解决方案,以便更好地服务用户、留住用户;而且有利于不断提升数据分析能力,使后续业务活动更加有的放矢,以期实现与用户在线智能互动、精准匹配。
“数据源”(Data Source)是大数据之母。在大数据来源中,用户行为数据曾很少被人问津,但其却是最为重要、最有价值的一种数据源。尤其值得重视的是:用户行为数据的丰富度与集成机制将决定大数据技术的发展方向与进程。目前,高校档案管理机构已积累了大量的用户行为数据,这为开发档案用户行为大数据分析提供了良好的资源基础,但要实现原创数据转换为“增值数据”(premium data)[2]的“最后一跃”,尚需具备三项基本技术支撑条件。条件一:构建档案用户行为原创数据资源库;条件二:构建档案用户行为“增值数据”集成模块(智能集成机制);条件三:构建档案用户行为“增值数据”匹配服务平台(智能分析系统)。需要指出的是,在这三项技术支撑条件中,寻找合适的档案用户行为原创数据源进行“ 清洗”(Data Scrubbing,即对数据资源进行优选凝练),并将“增值数据”输入匹配服务平台,是档案用户行为大数据分析过程的最大挑战之一[3]。通过深入考察,笔者认为:构建档案用户行为数据源的凝练集成机制,必须对关键性影响因素做好充分的技术分析,以利明确智能集成系统设计的研究内容和重点。
首先,要从时间维度了解和掌握档案用户的行为轨迹。借鉴“现代营销学之父”菲利普·科特勒(Philip Kotler)的营销学理论,剖析档案用户的行为轨迹可以发现其主要包括:产生需求、信息收集、方案选择、需求决策、后续行为五个阶段。其中,后续行为包括:档案用户的使用习惯、使用体验、满意度和忠诚度等。档案用户行为轨迹的时间记录,是帮助透析和预判用户需求的探测镜,对开发利用“增值数据”具有重要作用。
其次,要从空间维度了解和掌握影响档案用户行为的关键要素。借鉴“5W2H”分析法,可将档案网站发生的用户行为分解成七大要素。 即:谁(Who)? 什 么 时 间(When)?什么地点(Where)?访问了什么档案(What)?产生查询需求的动机是什么(Why)?打算查询多少档案资料(How Much)?如何借阅(How)?根据这些关键要素的分析,既能获得用户访问档案网站的时间、地点、点击的内容、页面每个部分停留的时间等零散的信息参数,又可整理、提炼并清楚地定义一个具体的用户行为,且利于尽可能精准地挖掘出“5W2H”中需要解答的问题。
第三,要从质量维度分析和评判档案用户行为数据的使用价值。档案用户的行为数据,可区分为“静态数据”(Static Data)和“动态数据”(Dynamic Data)两大类。其中:“静态数据”是指用户的姓名、年龄、学历、职业、来源地区、兴趣爱好等用户属性类信息。这类大数据信息,通常由档案管理机构的日常服务自我生成。如:档案网络管理系统需要用户注册ID才可使用,它可构成用户身份的确定性与唯一性,且用户填写的注册资料是分析和评判数据价值最基础、最重要的依据。“动态数据”是指档案管理机构内部主动对用户行为进行“捕获”(Capture)而获得的操作类信息。这类大数据信息,主要包括用户的检索、浏览网页、下载等操作数据和点击流数据、跳出率数据,等等。档案管理机构通过获取用户的“静态数据”和“动态数据”,既可了解和掌握用户行为规律,又可为分析和评判用户行为数据的使用价值提供基础依据。
第四,要从来源维度分析和研判档案用户行为数据结构优化的解决方案。档案用户的行为数据,可区分为“内部数据”(Internal Data)与“外部数据”(External Data)。据IBM 公司发布的《分析:大数据在现实世界中的应用》白皮书显示:企业“内部数据”是大数据的主要来源,社交媒体等“外部数据”则不到一半[4]。目前,高校档案管理机构也面临同样的问题。即:内部系统中用户行为数据占主导地位,且这类数据的潜藏价值尚待开发;外部传统互联网、移动互联网、SNS社交网等每天都在生成大量的UGC(User Generated Content,即用户产生的内容)公共数据,档案管理机构现有的人力物力却难以顾及。改变这一状况的出路何在?笔者认为,除积极改善人力物力条件之外,必须从数据来源的结构优化入手,着力遴选“增值数据”集成机制的解决方案。如:针对高校档案部门用户行为数据分布在一系列不同的数据库(Data Base)、数据存储器(Data Storage)和文件服务器(File Server)的特点,可将所收集的文本、视频、音频、图片等不同结构类型的数据,先梳理、归类为结构化数据、半结构化数据和非结构化数据三大类型;再按照数据价值的特性,将不同结构类型的数据赋予“一般”、“独特”、“专属”等不同的价值属性,并对不同价值属性的数据进行结构优化和集成;然后,根据装备和技术条件选择不同的存储模式(远程存储、共享存储、专用平台存储、移动存储等),以便于开发利用。
档案用户行为大数据分析的技术系统建设,涉及多方面功能集成模块的设计思路与方法的选择问题,其中数据凝练、数据分析、数据预测、数据交互等关键技术,更是实践应用不可回避的研究重点。下面,笔者借他山之石并结合自己的研究体会,对系统所涉重大功能模块的主要作用和设计重点,提出初步研探的一些看法。
3.1.1 用户基本信息模块
构建用户行为数据资源凝练系统,是高校档案用户行为大数据分析的核心技术之一,而建立用户基本信息模块更是重中之重。该模块的主要作用:一是可对用户进行多维度分析。如:依据用户的性别、年龄、地域、兴趣爱好等人文属性,可创建用户基本信息数据的多维度分析资源库。二是可形成凝练用户基本信息数据的标准化识别机制。如:将用户的人文资料及在线行为记录进行有机融合,可把凝练出来的用户资料信息作为增值数据进行开发利用。三是可自动更新和完善用户基本信息数据。如:在不侵犯用户隐私的前提下,可对用户基本信息记录作自动更新和完善,以满足不同用户的应用需求。
3.1.2 用户信用(价值)评价模块
用户信用(价值)评价模块,是用户行为数据资源凝练系统中不可或缺的重要组成部分。该模块的主要作用:一是可对大量用户历史数据进行量化分析。如:通过对用户过去是否有点击、是否有借阅,借阅档案的价值,借阅的频率,最近一次什么时候借阅等属性的统计和归类,可寻找出用户信用风险的特征值与规律。二是可对用户行为数据进行价值评分。如:对新用户和已有用户(偶然来访者和常客),可赋予不同的分值来划分用户信用等级。三是可建立用户价值分群模型。如:按照不同的风险管理级别与服务级别,可有针对性地对不同用户群设计服务方式与客户体验。如:当用户每次光顾高校档案网站时,系统能够立即访问用户行为数据库,并实时判断出此用户是否为优质用户(High-quantity User),对优质用户可给予合适的优惠服务。又如:当一位很久没来过的用户再次光顾高校档案网站时,系统可对其提供特殊优待服务,以便其成为常客。再如:系统能给排名靠前的用户发送推荐信息,以利发现尽量多的潜在用户(Potential User),且能提前发现不守信用的用户(如逾期不归还档案或丢失原件等),并根据实际情况采取不同的有效措施进行预警处理。
3.2.1 用户偏好(倾向)模块
在用户行为需求预测系统中,用户偏好(倾向)模块是重要基石。该模块不仅可以通过追踪和分析用户行为数据来掌握用户行为规律,而且能够精确定位用户的需求偏好。应用案例一:高校档案管理机构通过日常对用户借阅行为、意向的记录与积累,可发现用户经常喜欢办理哪些业务,以及对服务还有哪些需求,以利从用户反馈中预测其需求状况并更好地改善用户的体验度。如:每年上半年高校会有大批教职员工查询与己有关的职称材料,档案管理机构可对用户需求进行分类并预先做出满足其需要的“对象库”,以利有效细分用户群的服务效果。应用案例二:高校档案管理机构通过对用户在网页上的热点图(Heat Map)分布数据和网页覆盖图(Webpage-overlay Map)数据,可分析用户喜欢看哪些主题的档案资料,从而做到一方面加强用户所偏好档案的收集、存储,另一方面还能考察自己的产品与服务效果,为新课题研发提供可靠的线索。应用案例三:高校档案管理机构通过对用户登录时间点的分析,不仅可以获悉用户的活跃期,而且可在对应的时间段做某些有针对性的信息推送,以利降低运营成本,并为发现增值服务提供可靠的线索。应用案例四:高校档案管理机构可通过用户访问网站流程来分析其对网站的字体颜色的喜好程度或页面结构设计是否合理等,为不同的用户呈现其专属设计的网页,以利开发出不同的产品与服务体验。
3.2.2 用户个性化服务推荐模块
在用户行为需求预测系统中,个性化服务推荐模块不仅是一种信息过滤的重要技术和手段,而且是解决信息超载问题的有效工具。用户个性化服务推荐模块的功能,主要以“私人订制”等各类贴心服务来予以体现。应用案例一:效仿亚马逊等电商巨头的做法,高校档案管理机构可在档案网站内设置“同类用户还查询了什么”的页面,由系统引导用户发现有价值、感兴趣的信息或当前的热点文章以及热点话题等。应用案例二:借鉴电子邮件 营 销(EDM,即Email Direct Marketing)的技术手段,高校档案管理机构可通过分析用户已有的访问信息,并在其事先许可的前提下,利用电子邮件或微信公众账号向目标用户主动发送有价值的信息提示,以利帮助用户作出决策(经过大数据分析后发送的推荐信息,使用户收到的邮件起码是与其潜在需求的普通属性相关的、可能感兴趣的信息,以免被用户作为垃圾信息而直接删除)。应用案例三:高校档案管理机构可在所有要推荐的档案信息产品旁边增加一个“不喜欢”的按钮,以便用户选择。就个性化服务推荐而言,收集用户不喜欢的东西与喜欢的东西不仅同样具有重要的使用价值,而且可在一定程度上帮助系统改进功能,以利提供更精准的推荐服务。
3.2.3 用户风险预警模块
在用户行为需求预测系统中,用户风险预警模块不仅可预测用户黏度(User Viscosity)并对将要流失的有价值的用户及时采取有针对性的维系方法,而且对降低运营风险具有重要作用。如:移动运营商采取给数亿用户建立一个数据库的办法,通过海量数据分析跟踪用户的话费消耗情况,就能知道哪些用户在流失(话费锐减的用户基本上是将要流失的先兆)。借鉴这一做法,高校档案用户风险预警模块的设计,应将用户行为“生命周期”的分析判断作为重点,并采取相应措施来增强用户黏度、降低流失率。可资借鉴的参考方案:一是针对处于“稳定期”的用户,可通过加强用户互动交流和信息推送服务等,以利保持用户对高校档案网站的关注度;二是针对处于“成长期”的用户,可通过对使用某类增值业务有兴趣的用户进行预测分析,主动向其推荐个性化服务内容,以利促进其向“稳定期”转化;三是针对处于“衰退期”的用户,可通过设定预控条件,对即将流失的用户做出友情提醒,尽量促使其回归稳定。此外,要根据用户流失特征和各类运作风险作深度分析,及时改进服务不到位的缺陷,以利有效增强用户黏度。如:系统可根据大数据分析,实时判断并提前发现用户在使用过程中的各种操作失误或故障,对其各种误操作进行警示。又如:在物联网营运环境下,档案管理人员需要接触并操作温湿度控制、有线和无线通信、远程监控、自动报警、RFID物联网传感器等各种现代化设备,系统可通过建立用户风险预警模块来收集这些设备的海量运作数据,提前对某个具体指标的变化进行预警分析,并据此采取相应措施来提高数据安全管控,避免不必要的损失和事故发生,以利实现更加及时、更加人性化管理之目的。
3.3.1 用户“购物篮”关联模块
关联技术不仅是互联网发展的一大优势特征,而且为大数据关联分析提供了有益条件。通过“关联分析”(Association Rules)寻找在同一事件中出现的不同项的相关性,有助于增值数据的开发利用[5]。如:亚马逊运用协同过滤(collaborative filtering)技术,对收集到的销售数据和客户购买行为数据进行分析,并据此向客户推销相关商品[6]。再如,沃尔玛“啤酒与尿布”的经典商业案例,同样是将收集到的消费者购物行为数据,运用关联算法进行数据挖掘(Data Mining),发现了风马牛不相及的商品之间的神奇关联,使看似无用的数据创造了新的商业价值。同理,高校档案管理机构可借鉴“购物篮分析”(Market Basket Analysis)方法,在网站上为用户设置“购物篮”,分析“购物篮”里用户借阅档案之间的相似性关系,发现什么样的档案组合用户多半会一起查阅,寻找出既频繁又可信的档案信息借阅组合。因此,建立用户“购物篮”关联模块,一方面可快速、准确地帮助用户浏览想要的档案,减少用户过滤信息的负担,节省用户的检索时间;另一方面可按照大数据分析结果对实体档案进行科学排架,并通过实体档案与关联电子档案的优化链接,促进借阅量的快速增长。
3.3.2 用户检索语言语义分析模块
零售业寡头沃尔玛为其网站设计的搜索引擎Polaris,利用语义数据进行文本分析、机器学习和同义词关联挖掘,使在线购物完成率提升了10%到15%[7]。高校档案管理机构应积极借鉴大数据语义检索(Semantic Retrieval)技术,通过建立用户检索语言语义分析模块,来捕捉用户所输入语句背后的意图,并以此向用户提供最符合其需求的查询结果。该模块的技术设计要领是:依托知识“本体”(Ontology)的支持,对用户查询请求进行预处理(Data Preprocessing)、语 义 映 射(Semantic Mapping)、共 现 分 析(Collocation Analysis)、联 想 检 索(Associative Retrieval)等处理后,在“档案元数据”(Metadatabase)中匹配(Match)符合条件的档案信息,以适应概念匹配、语义匹配等知识检索之需。
3.4.1 O2O用户交互模块
在实践中,用户会先到档案网站上去查询,然后再到档案馆去调阅档案。这种行为模式,与O2O(Online to Offline,线上与线下的结合)电子商务模式有异曲同工之妙。因此,建立O2O 用户交互模块,将高校档案管理机构线下的业务与网络进行对接(网站成为线下“交易”的前台,档案馆成为线下的“实体店”),既可让用户用收到的二维码彩信电子凭证在档案馆享受相应的服务,又可通过网上档案馆直接完成足不出户的查档体验。此外,开发用户O2O 交互数据,不仅能节省用户时间,而且可节约档案馆的人力服务成本,特别是O2O模式在创造客流量的同时,网站上产生的用户行为O2O数据资源会成为档案管理机构了解用户需求信息的重要渠道,而掌握了庞大的用户行为数据,既有利于提升“精准服务”水平,又可更好地维护并拓展用户。
3.4.2 用户满意度分析模块
对用户评论进行情感(满意度)分析具有潜在的商业价值。目前,亚马逊、淘宝等主流网络交易平台几乎都配置了评论功能,大众点评网、豆瓣网等第三方点评网站也把评论信息作为吸引用户使用的重要功能。通过考察可以发现,网站的评论信息是根据用户的经历和经验写成的,正反信息都有,较为客观,既可方便其他用户对关注的内容进行充分的比较和更深入的了解,又可方便网站获得用户反馈来促进后续的生产或销售。借鉴这一做法,建立用户满意度分析模块,可让高校档案管理机构根据用户评论的目标、评论的内容、分享的内容,及时了解和掌握用户的信息需求。
3.4.3 用户社交图谱模块
建立用户社交图谱(Social Graph)模块,既是完善和丰富知识“本体库”的需要,也是用户行为大数据分析的必备条件。高校档案管理机构要在不断充实和完善内部用户行为数据的基础上,切实做好与互联网数据的对接。如:微博、微信等社交媒体中的用户非结构化数据,主流的关系型数据库很难存储,高校档案管理机构要利用大数据技术来分析UGC 中海量的用户社会关系和兴趣关系,并通过分析社交图谱来建立汇聚社会化、非结构化的档案用户行为数据资源知识库,同时要根据这些图谱关系,结合用户的网络访问轨迹,对网络潜藏信息进行挖掘,帮助用户发现彼此的朋友圈,拓展交流范围,以利方便有共同旨趣的用户进行档案信息交流。
3.4.4 可视化分析模块
“1张图片等于1000个字[8]。”美好的视觉展现效果可使数据不再是简单的文字或数字,它能便捷地使用户理解数据分析背后的信息。建立可视化分析(Visualization Analysis)模块的用途:运用计算机图形学和图像处理技术,将用户行为数据压缩转换成图形或图像在屏幕上显示出来,以便于用户理解和交互处理。实践表明,利用可视化软件以动画、趋势线、图形等美观的视觉效果,不仅能更好地展现档案用户行为大数据分析结果或监测数据背后的信息,而且能优化档案管理系统人机交互界面,吸引用户眼球、提高网站黏度。此外,还可将该分析结果发布到Web 和移动终端设备进行交互式信息展示,进一步提高推荐结果被用户接受的可能性,且可为未来作出合理决策等业务提供信息依据。
用户行为大数据分析不是简单的“分析数据”,需要一整套切实可行的解决方案,尤其要重视用户行为数据采集凝练体系与分析流程的应用对策研究。
首先,要有明确的建设目标。随着Hadoop(由Apache 基金会开发的一个分布式系统基础架构——支撑大数据分析的分布式计算平台)的诞生,特别是NoSQL 数据库(非关系型数据库——支撑大数据分析的基础技术)的推广普及,高校档案管理机构已无需在内部开发或配备所有大数据技术,甚至不必投入固定资本自行搭建大规模的IT环境,即可完成对大量非结构化数据的高速处理。对此,笔者认为,高校档案管理机构要根据业务需求和基础条件,认真研究并制定档案用户行为大数据分析系统的建设目标,不仅要明确总体建设规划目标和阶段性实施方案,而且要对施用范围与成本效益作出科学估价,并通过权衡利弊提出应对措施。如:大型高校档案馆可以横向的大数据分析为建设目标,选择自建基于大型机系统的数据中心作为内部解决方案;小型高校档案馆(室)则应以垂直行业的关键性技术应用为大数据分析的建设目标,选择租用托管商提供的基于云端的大数据应用程序(Big Data Applications)作为内部解决方案。但就发展方向而言,高校档案管理机构应将着眼点放在对信息的分析、存储和预测能力等核心竞争力的提升上,努力使自身转化为“有价值的信息部门”。
第二,要确立规范的技术标准与流程。大数据的利用难点在于技术。实践证明,从数据的收集、存储 到 清 洗 , 再 到 脱 敏(Desensitization)、归类、标签化、结构化,以及建模分析、挖掘利用等等,这不仅需要服务器集群、数据利用模型、数据处理算法等一系列大数据技术予以匹配,而且需要依靠科学规范的技术标准与流程将挖掘出来的结果进行包装、变现。对此,笔者认为,对于一般高校档案管理机构来说,除了技术性很强的业务可委托外包给专业公司来做外,自身需要规范的技术标准与流程主要包括:一是要规范“用户行为”内涵定义。高校档案管理机构必须事先为大数据分析定义出规范的“用户行为”。如:用户分组、发生时间、持续时间等,以便后续匹配。二是要规范“行为事件”采集标准。高校档案管理机构必须高度重视数据采集的标准体系建设,并按照标准化和规范化的采集方法与流程,坚持从小处入手,对日常采集的独立数据流作分类、转换、汇总并将其输入至智能数据库保存起来(随着收集数据的不断增多,大数据可随即形成)。这样做不但可减少先期投入,而且还能从数据采集凝练中取得意外的收获。如果平时不注重积攒用户行为数据,关键时刻将会受历史数据量所限而无法进行大数据分析。三是要规范“行为事件”凝练手段。高校档案管理机构要根据业务需求和大数据分析技术装备条件,逐个分析已有的数据仓库,认真甄别和凝练有效数据,并对其匹配人工或系统智能定义好的个性化标签(需通过持续化地调整优化用户行为定义),以利建立用户行为记录的分类模型。四是要规范“结果可视化”展示形式。档案用户行为大数据分析既要对数据进行诠释,更要对分析凝练的结论进行可视化包装展示。鉴于这是一种主观性分析,其产生的实际效益通常难以量化和展示,能否把具体的项目收益与业务需求紧密结合起来,将是效益分析成败的关键之举。因此,高校档案管理机构要深入研究有效数据的量化规律和展示技巧,不断探索和创新“结果可视化”包装展示的规范化形式。
第三,要注重数据安全的风险防范。大数据需要“大安全”。高校档案管理机构在进行用户行为大数据分析时,不仅要考虑包括系统安全问题、用户隐私问题、兼容与整合问题等影响因素,而且必须提前做好应对各类风险的解决预案。对此,笔者建议:一是要建立健全信息安全监管制度。严格遵守国际国内相关法律法规的要求,切实规范信息安全监管制度与操作规程(包括在规定期限之后删除个人信息的义务)。二是要建立健全用户行为大数据分析隐私权防护机制。对采集的用户行为数据必须作“模糊处理”(Fuzzy Processing),着力使“大数据分析”挖掘出来的个人信息(特别是涉及用户隐私的信息)与特定数据点的联系难以对接。三是要建立健全数字化节制措施。对涉及用户信息数据再利用的行为,必须采取行之有效的数字化节制措施,不断更新和提升减灾能力,以利规避或降低用户信息数据二次利用中潜在的侵权风险。
数据科学(Data Science)正在成为一个新兴的学科和领域,谁能更好地抓住数据、理解数据、分析数据、应用数据,谁就能在未来的竞争中占据先机。因此,高校档案管理机构要像对待自己的宝贵资产一样来对待档案用户行为数据,高度关注大数据技术的发展走势,切实加强应用研究,不断提升档案用户行为大数据分析技术的实时化、精细化、智能化应用水平,努力使其成为开拓高校档案增值服务和满足社会需求之利器。
[1]周枫.大数据时代档案馆的特征及发展策略[J].档案与建设,2013(8):8.
[2]城田真琴.《大数据的冲击》[M].北京:人民邮电出版社,2013:219.
[3]Frank J.Ohlhorst.《大数据分析点“数”成金》[M].北京:人民邮电出版社,2013:31.
[4]科技日报.大数据主要来源于企业内部数据[EB/OL].(2013-03-21).[2014- 04- 28]. http://news.xinhuanet.com/tech/2013-03/21/c_124487009.htm.
[5]杨池然.《跟随大数据旅行》[M].北京:机械工业出版社,2014:35.
[6]城田真琴.《大数据的冲击》[M].北京:人民邮电出版社,2013:56.
[7]搜狐IT.八个典型的大数据应用案例[EB/OL].(2014-01-07).[2014-05- 28].http://it.sohu.com/20140107/n393108255.shtml.
[8]大卫·芬雷布.《大数据云图》[M].杭州:浙江人民出版社,2014:178.