惠州学院 胡 松 胡 辉 陈 伽 蔡映雪 范 瑾 蔡昭权
跨媒体数据智能系统技术研究与市场效益
惠州学院 胡 松 胡 辉 陈 伽 蔡映雪 范 瑾 蔡昭权
【摘要】移动智能终端的广泛应用和日益普及,研究这些移动设备、手持终端,以及在网络上登录行为记忆等的消费行为,行动区域,在不同媒体平台上浏览的信息内容等方面信息,已成为一个跨媒体数据研究方向。在这数据就是价值的时代,跨媒体数据智能系统技术研究将带来不可估量的研究价值和市场效益。
【关键词】跨媒体数据;智能系统技术研究;跨媒体数据市场效益
跨媒体技术的发展是随着移动智能终端设备的广泛应用和普及,海量、天量的视频、音频、文本文件以及各种触感数据构成了当前移动互联网领域中信息共享、传播的主体内容。手持移动化带来的变革是信息量的迅猛激增,对这些信息内容的深入研究,借助数据分析程序,基于位置移动(定位)从中得出分析人们行为,如:消费习惯,阅读习惯,个人社交,运动轨迹等,精准地研究这些习性,正在形成一种研究潮流和方向,其研究的深度和广度,正受市场热烈追捧,市场效益日益凸显。
跨媒体数据智能系统技术研究经历一个从无到有的发展历程。从起初平面媒体时代到TV时代,到当今的跨媒体网络,经历了一个百年历程。如今跨媒体数据正趋向动态高效,实时海量方向发展,正日益影响人们知识获取,知识重构的进程。
当前比较热门的智能系统技术研究方向和内容是:
物理层:SAS+数据中心机房+虚拟机+高速网络+GPU加速+重核加速+SSD 该层主要体现在系统硬件及硬件配套上
存储层:离线存储+在线存储+云平台 主要体现数据存储介质。
计算层:离线计算+在线计算 主要呈现系统算法规则。
业务逻辑层:数据抓取+实时统计+实时监控+在线分析+实时推荐+日志处理+预测建模呈现系统操作层面。
服务层:提供系统各条业务线路的服务。
此外还有系统自动运行维护外设软硬系统。
由于需要研究的跨媒体数据来源众多,跨平台,跨行业的内容庞大。这将必然导致数据的处理,分类,汇总问题极其复杂,也导致了数据类型向非结构化爆炸增长,数据单位有起初的TB-PB-EB-ZB的级别进化演进。这就需要我们研究如何在各种各样类型的海量数据模型中,快速获得有价值信息,目前采用数据分析系统主要用过程为:数据采集,数据存取,基础架构,数据处理,统计分析,数据挖掘,模型预测,结果呈现等八种技术能力。研究这些过程需要用到的计算模式是:批处理、流处理和交互分析三种计算模式。
目前主流的技术趋向是:人机交互,语音识别方向。
有人说,这是一个最好的时代,也是一个最坏的时代,跨媒体数据智能研究技术已经上升到国家战略发展的高度,日益受到党和国家的重视。国家了“十二五”国家战略性新兴产业发展规划》要求深入开展海量数据存储项目立项,跨媒体数据智能系统技术深入研发,要投入更多的资金,资源。在当今互联网科技前沿技术当中,关于信息生物感知技术、信息高速传输技术、信息高度安全技术等,都引入跨媒体数据智能系统技术的研发体系。
眼下最让科技界关注和投入的跨媒体数据运营的商业思维,我国互联网三大巨头公司BAT,在各自领域做出的努力已经慢慢让世人眼前一亮。
百度搜索,当用户网上进行搜索,其搜索行为马上被百度系统记录下来,当这位用户下一次再去使用搜索功能时就会出现和上次他搜索时相关内容的广告。举个例子,当他搜索“跨媒体数据”这个关键词达到一定次数时,再浏览网页就他会发现,百度搜索页面会跳出来一堆跟这个“跨媒体数据”关键词相关的内容。百度公司在运用跨媒体智能系统技术达到只要用户上网浏览输入关键词,就能分析出用户的搜索行为后,就能马上匹配精准的广告,大大提高了广告的展示效果。
阿里公司也是如此,用户在天猫,淘宝购物,浏览页面,所有行为,购物行为、和浏览数据,甚至包括支付账单,更精密的是,阿里可以精细地研判用户通过阿里云计算分析后,进行精准的用户行为预测,然后进行商品信息推送。比如:某个用户上淘宝搜索“眼镜”这个关键词的次数是行为数据里面最高的,分析出来之后,阿里预测这位用户就是喜欢这款眼镜品类的商品,然后挑一些爆款的让这位用户进行推荐。
腾讯公司更厉害,只是他们比较低调,不显山露水,腾讯一直在数亿的QQ用户,微信用户的社交数据,消费数据,娱乐数据(玩游戏,听音乐,看视频等)进行跨媒体数据智能研究,用户的社会关系、性格禀赋、兴趣爱好、隐私绯闻甚至生理周期和心理缺陷都尽在其中。这样腾讯就可以根据这些数据,开发产品。所以腾讯每推出一款社交工具软件,立马受到用户欢迎。
总的来说。根据跨媒体数据智能研究,可以精准地知道用户要干什么,喜欢干什么。
3.1 跨媒体数据智能系统技术研究主体的问题
跨媒体数据智能研究技术如此重要,那么研究这个技术的市场主体到底是政府还是企业个人?目前观念比较统一的看法是,因为跨媒体数据智能系统技术研究关系到国计民生,必须由政府主导,企业实行,走市场化的道路。
3.2 跨媒体数据智能系统技术研究政策配套问题
既然跨媒体数据智能系统技术研究需要政府主导,企业参与,走市场化道路,那么政府就必须要出台一系列相关的政策,来扶持配套和引导监督企业对跨媒体数据智能系统技术研究。
3.3 跨媒体数据智能系统研究人才问题
美国盖特纳咨询公司预测跨媒体数据研发领域将为全球带来440万个IT新岗位和上千万个非IT岗位。麦肯锡公司预测美国到2018年需要深度数据分析人才44万—49万,缺口14万—19万人;需要既熟悉本单位需求又了解跨媒体数据技术与应用的管理者150万,这方面的人才缺口更大。
中国虽然是人才大国,但能理解与应用跨媒体数据的创新人才更是奇缺。和中国国防科技一样,跨媒体数据智能系统研究需要一大批耐得住寂寞的顶级科学家、尖端人才参与。如何吸引到顶尖人才加入研究,需要各方面整合资源,一起努力。一方面要加速人才培养,一方面要多渠道吸引人才。
3.4 研究跨媒体数据智能系统面临的技术难点
首先要进行跨媒体数据智能研究,首先要有海量可研究的数据来源,目前我们由于行政体系改革还不深化,政府各个部门间存在大量的数据鸿沟,阻碍数据开放,我国政府、企业和行业信息化系统建设缺少统一规划和科学论证,系统之间缺乏统一的标准,形成了众多“信息孤岛”,而且受行政垄断和商业利益所限制,数据无法开放出来,数据共享难度大,这给数据利用和开发造成极大阻力。
影响和制约我国数据资源开放和共享的原因是是数据共享政策法规不完善。由于立法跟不上,数据拥有者无法保证共享,怕出现数据滥用,宁可让数据躲在深闺无人知。所以要加快推动政府相关立法,保证公共数据开放和隐私保护。总体来说,我国跨媒体数据研究缺乏政府数据开放的参与,就会造成无米下锅。我国跨媒体数据处理技术基础薄弱,总体上以跟随国际发达国家为主,难以满足市场迅猛发展的数据需求。
最后,跨媒体数据时代的市场经济,甚至政治决策不能光靠经验,而是真正要“拿数据说话”。更深层次看,就是要变革我们的市场管理模式、管理思维以及管理架构的与现实实际需求相适应。总之一句话,改进不足,抛掉包袱,跟紧时代需求的脚步。
跨媒体数据价值认知,即跨媒体数据智能技术研究的市场效益,正日益影响整个人类社会的前进脚步。跨媒体数据,也叫大数据,正在日益影响我们生活的方方面面,它已经俨然成为当今炙手可热的经济类别,如同货币或黄金一样成为人们眼中香饽饽,研究对象。
跨媒体数据智能研究技术,目前有几种较为靠谱的,能变现的商业思维:
从海量数据首先要能保存下来,才能有后续的处理,既数据存储和安放问题,由于数据海量,天文量级别,需要的运行系统十分庞大,运用的服务器组别都是上万台组。因此根据跨媒体数据存放需要,要有庞大的数据处理中心,在我国,很多城市纷纷取立项成为国家级别的跨媒体数据中心。因为大家都深知,这将给当地的经济能带来不可估量的腾飞机遇。
从跨媒体数据运行系统看,目前最火最老牌是方式就是IDC。所谓IDC, 就是互联网内容提供商(ICP)、企业、媒体和各类网站提供大规模、高质量、安全可靠的专业化服务器托管、空间租用、网络批发带宽以及ASP、EC等业务。IDC是对入驻(Hosting)企业、商户或网站服务器群托管的场所;是各种模式电子商务赖以安全运作的基础设施,也是支持企业及其商业联盟(其分销商、供应商、客户等)实施价值链管理的平台。目前除了三大运营商根据国家战略需要,各自启动了自己的IDC,一些大型企业也自己布局IDC。如华为公司,早在几年前就投入巨资开发IDC市场。
跨媒体数据研究内容上分析,目前广告行业运用最多的技术模式是:数据搜集+数据分析+精准推送=精准营销。国际和国内顶尖的广告公司,他们面对自己的广告客户,最拿得出手的是各自手头上的用户资源。那么他们的用户资源从哪里来?广告主凭什么要给他们投入广告?最根本的原因是因为跨媒体数据智能研究技术的使用。广告公司可以更为有,目的根据用户点击、浏览广告的行为来精准地研究用户的消费习惯,消费心理。
在跨媒体数据时代,很多传统的商业思维正在被颠覆和取代,越来越多的IT企业正在加紧分一羹,纷纷入驻布局,抢占行业研究的战略制高点,开展研究跨媒体数据智能系统技术在人才,资金,资源的储备。据测算,2016年全球在跨媒体数据方面的耗资将达到2320亿美元,由此产生的市场价值则高达几十万亿美元。
跨媒体数据将能激发巨大的内需增量,将引发产业的巨大变革。因此我们需要提早做好研发准备,最有可能实现我国在这一科技领域“弯道超车”的奇迹。未来跨媒体数据的应用最可能在电子商务、广告行业和企业管理三个领域取得重大突破。跨媒体跨媒体数据将带给我们一个革命性的方向。
参考文献
[1]邓香莲,杨佳.新媒体环境下的传统文本阅读实证分析——基于上海图书馆外借排行榜的SPSS解读[J].图书情报知识,2011(06).
[2]郑伟青.高校图书馆阅读推广实践现状调查与分析——以“211工程”高校图书馆为例[J]. 图书馆工作与研究,2012(08).
基金项目:广东省教科规划项目(11JXZ012,14JXN065),广东省自然科学基金项目(S2013010013432, S2013010015940),广东省教育厅项目(2013LYM00874),广东省高校优秀青年创新人才培养计划资助项目(2013LYM_0087),惠州市科技计划项目(2013B020015008,2014B020004026,2014B050013016,2014B020004023)。
作者简介:
胡松(1985-),女,河北秦皇岛人,硕士,讲师,研究方向:信息系统和信息管理。