基于信息感知平台的社交网络大数据分析

2014-09-15 19:31尹克坚
中国新通信 2014年12期
关键词:社交网络大数据

尹克坚

【摘要】 随着时代的进步和社会经济的发展,特别是科学技术的革新与应用,开始逐步兴起了社交网络,那么就从数据方面推动了城市感知的发展。但是因为它的数据复杂程度较高,那么就增加研究的难度。本文以某城市信息感知平台为例,对面向城市的信息感知技术进行了深入的研究;研究结果表明,基于社交网络,对城市规模的计算模型进行构建,可以对城市发展的进程进行更加有效的感知,将城市运行规律给找出来,促使智能城市的目的得到实现。

【关键词】 信息感知 社交网络 大数据

一、前言

国外有教授学者明确指出,在人类发展过程中,最为伟大的发明就是城市,城市的出现,促使人们更好的创新,城市化让人们更加的智慧,可以更加幸福和健康的生存。但是,城市化进程的加快,也增加了服务和管理的难度。如果不将信息技术及时应用过来,那么城市化可能会更多发挥消极的东西。另外一方面,随着信息技术的发展,如移动互联网技术、社交网络、云计算技术等,在互联网上,数据的传播速度以及内容量在不断地提高和增长。根据相关的统计资料表明,每秒钟,全球都有超过300万封电子邮件在发送,每天有5000万条消息发布于“推特”中,而谷歌的分布式系统,每天需要处理的数据达到了24pb之多;淘宝网有着数十亿的会员,每天有着千万笔交易诞生。这些海量数据,已经将目前人力处理范畴给超越了过去,代表着我们已经进入到了大数据时代。

近些年来,人们越来越重视城市计算技术。在城市计算技术的概念中,在一个城市级别的计算中,可以将计算单元定义为城市空间的任何车辆、设备、建筑一级道路等。近些年来,有着一些比较有代表性的工作涌现出来,如在哥本哈根,人们将传感器安装于自行车轮胎上,来对城市空气和质量进行探测;在美国,研究人员,借助于手机用户的通信时刻和位置,来对城市动态信息进行深入地研究;而在北京,通过对出租车轨迹进行分析,达到城市交通研究的目的。

二、社交网络是城市感知的重要途径

截止到2012年12月底,我国一共有5.6亿互联网用户,有着超过百分之四十的互联网普及率;其中,微博作为一种新型的社交媒体,得到了迅速的发展,已经拥有了超过了3亿的用户,相较于前几年,获得了成倍的增长。

随着社交网络的兴起,出现了大量的活跃用户,那么大量的记录城市生活的数据就在持续产生,这些数据有着较强的交互性和实时性,如果深入研究的话,可以将很多有价值的信息给找出来,已经受到了数据科学家的重视。有科学家将分层社区发现算法应用到社交网络中的大型用户关系网络中;我国专家利用聚类方法来检测了城市热点话题;还有专家借助于社交网络的位置信息,将挖掘频繁模式应用了过来,对城市信息进行分析。

三、社交网络中的城市信息

本文将新浪微博数据充分利用了起来,对某城市信息感知平台进行了构建,具体来讲,深入开展这些方面的工作:

一是城市属性挖掘:我国有着十分辽阔的地域,既有国际大都市,如上海、北京等,又有历史悠久风景美丽的旅游城市,如丽江、凤凰等等。每个城市在发展轨迹方面都是独特的,存在着较大的差异,在政治、经济、文化以及地理环境方面都是不同的,并且在城市生活的各个方面都有体现。通过研究发现,本省市的其他地级市的微博活跃度,会直接受到人均GDP的影响,通过微博活跃度,就可以将本城市的经济地位和政治地位给有效反映出来。在微博活跃度的基础上,用户的位置、言论以及关系等信息也被涵盖于微博中,通过分析这些信息,就可以将更加全面的城市整体以及各个区域的属性特征给得出来,如经济特征、政治特征以及文化特征等等,这样就可以促使人们对城市更好的理解和感知。

二是城市动态性分析:一个城市,基本特征就是动态性,而城市动态性直接体现于车辆运行以及人群移动等诸多方面。对城市中移动对象的移动轨迹进行感知,并且分析轨迹数据,可以将人类社会活动的特征给找出来,并且发现统计规律,那么就可以对复杂的城市动态进行把握和认知。通过分析时间轴上社交网络用户所发布的言论或者图片等信息,可以将空间位置上用户的变化给找出来,比如签到功能是社交网络所具备的,用户可以对地理位置随时记录和分享,这样就将丰富的空间移动轨迹数据给提供了出来。借助于人们提供的位置信息,可以分析城市各个空间对象的运动规律,这样人们可以对城市动态特征进行更好的把握,促使城市获得更好的发展。

三是社区发现:人是城市的基本组成单位,而且,有着一定的规律存在于人类行为中;通过研究表明,有着较强的时间和空间相关性存在于人类的行为轨迹中;并且在社交网络的社区结构中,这种小世界特性是依然存在,将人类的共同爱好,或者在真实世界中的社会关系给有效体现了出来。要想将人的社交结构给找出来,就可以将社交网络中用户之间的交互信息给利用起来,然后将一系列的技术给利用起来,如谱图技术、动态社区发现算法等,提取用户之间的社区结构,然后借助于其他的技术,来对同一社区的构成原因进行分析和研究。因为有规律存在于人类行为中,那么就有着诸多的宏观特征体现于城市当中。在如今的数据挖掘中,对个性化以及社交化更加重视,将社交网络中用户的生活模式以及社交结构给提取出来,其中,生活模式包括诸多方面的内容,如行为、意图等,都可以在很大程度上推动城市规律研究工作的发展。

四是异常事件检测:在城市计算中,非常重要的一项研究内容就是异常事件分析;在城市中,出现了一些异常事件,将会在较大程度上影响到居民的正常生产和生活,甚至带来较为严重的损失,比如流感的出现、暴雨灾害等等。采用传统的检测手段,异常事件往往无法及时发现。而通过社交网络,则可以对信息数据进行实时的监测。通过采集、分析社交网络中的相关数据,可以对异常事件进行实时监测,还可以对异常事件的发展趋势进行预测,然后将一系列有针对性的措施和方法给应用过来。社交网络有着较强的实时性,因此,在异常事件检测中,已经成为非常重要的一项手段,可以最大限度的降低城市正常运行受到异常事件的影响程度。除了流感外,在自然灾害、群体事件以及交通事件等检测中,社交网络也可以发挥较大的作用,这是因为社交网络具备较强的实时性。通过研究社交网络的城市异常事件检测,可以促使城市正常运行不会在过大程度上受到异常事件的影响,避免城市居民的正常生产生活受到异常事件的影响,提高了城市的智能化程度。

四、社交网络数据分析的挑战

无数的人在互联网上产生了社交网络数据,这些数据比较的复杂,虽然有规律存在,但是无用数据以及重复数据也占据了较大的一部分,它们没有利用价值。因此,在这些丰富的社交网络数据中,将有价值的信息给提取出来,就是如今需要重视的一个方面。

一是对大规模多源异构数据进行管理和处理:社交网络数据属于多源异构数据,它的产生源是不同的,并且包括着诸多类型的格式,如图像、文本和声音等;还有着诸多类型存在于社交网络数据中,如用户关系、移动轨迹、地理信息等。同时,社交网络中,包括了较大的数据量,随着时间的推移,还有诸多的实时数据产生,那么就增加了数据管理和处理的难度。

二是对社交网络数据进行在线实时分析:通过应用智慧城市,如交通流信息等,实时性要求比较的高。因此,在分析社交网络数据时,虽然有着较大的数据量,但是要快速高效的进行数据分析,这样实时应用的要求才可以得到满足。

三是如何在纷繁复杂的社交网络数据中将知识提取出来:社交网络数据的采集不需要花费较高的成本,但是也没有较高的质量,那么就需要从海量的数据中将有价值的信息和数据给提取出来,将大数据的典型特征给找出来。同时,如果数据是单个方面的,那么发现的信息也是不全面,要想对更加全面更深层次的知识进行获取,就需要从多个方面来努力。如如今开始利用实时云计算平台来获取处理海量社交网络数据,通过对实时云计算平台下的数据获取任务调度策略以及社交网络协议解析方法进行设计,使用社交网络协议,来对社交网络产生的原始数据进行解析。

四是如何从社交网络中提取知识,来指导人们的决策:上文我们已经提到,从社交网络中,可以将城市生活各个角度的信息给提取出来,但是我们还需要深入的进行研究,以便将这些信息和数据给充分利用起来,对城市管理起到有效的指导作用,将更加便捷和智能的城市生活提供给人们的生存和发展。

五、结语

通过上文的叙述分析我们可以得知,随着时代的进步和社会经济的发展,特别是社交网络的兴起,如今已经进入到了大数据时代;社交网络中包含了诸多的数据来源,通过分析这些数据和信息,可以更加有效的进行决策,提高城市生活的便捷性和智能化程度。但是,社交网络包括着十分丰富的数据,比较的复杂;目前的研究工作只是处于起步阶段,在未来的研究中,需要对传统的思维模式进行革新和转变,将一系列更加先进的技术方法给利用起来,将社交网络数据中存在的规律和特征给找出来,促使人们对城市信息以及发展轨迹进行更好的理解和感知,促使城市获得更好的发展,提升人们的生存质量。本文主要研究了基于信息感知平台的社交网络大数据分析,希望可以提供一些有价值的参考意见。

参 考 文 献

[1] 李文俊,陆建,王桥. 面向城市信息感知的社交网络大数据分析[J]. 中兴通讯技术,2013,2(4):123-125

[2] 李建国,姚良超,张文生. 社交网络中感知技术的研究与应用[J]. 计算机科学,2009,2(11):55-57

[3] 薛美凤,叶继元. 学术虚拟社区知识共享研究综述[J]. 图书情报工作,2011,2(13):55-57

[4] 张超旭,刘云. 基于关系的社交网络感知模型研究[J]. 铁路计算机应用,2012,2(12):55-57

[5] 于志文,于志勇. 社会感知计算:概念、问题及其研究进展[J]. 计算机学报,2012,2(1):55-56

[6] 周建立,张爱华. 社会关系强度对社交网络中应用接受意愿的影响研究[J]. 中国科技信息,2012,2(23):132-134

[7] 温忠麟,侯洁泰. 调节效应与中介效应的比较和利用[J]. 心理学报,2005,2(2):43-45

猜你喜欢
社交网络大数据
大数据时代社交网络个人信息安全问题研究
社交网络中的隐私关注及隐私保护研究综述
基于图片分享为核心的社交网络应用分析
社交网络自拍文化的心理解读
大数据环境下基于移动客户端的传统媒体转型思路
基于大数据背景下的智慧城市建设研究
数据+舆情:南方报业创新转型提高服务能力的探索