郎为民,陈 凯,张国峰,蔡理金
(解放军国防信息学院,武汉,湖北 430010)
影视剧显示的大数据技术
郎为民,陈 凯,张国峰,蔡理金
(解放军国防信息学院,武汉,湖北 430010)
大数据无疑是2013年IT业内最热的词。厂商热推,媒体热炒,仿佛不谈大数据,不推大数据,不用大数据,就没有了未来。当IT业界正在爆炒大数据的时候,影视圈的导演和主角们自然也不甘寂寞,他们雄赳赳、气昂昂地投身到这场轰轰烈烈的造星运动之中。本文对英剧《黑镜》、电影《点球成金》和美剧《疑犯追踪》中的大数据元素进行了分析,体现了大数据的无穷魅力,展望了大数据广泛的应用前景。
大数据;黑镜;点球成金;疑犯追踪
2013年大数据当仁不让地坐上IT江湖的头把交椅(如图1所示)。我们经历了以PC、网络、服务器和存储为中心的时代后,大数据如约而至,它将会深刻地改变我们每个人的生活。大数据的江湖很热闹,热闹到许多许多与大数据没有一星半点儿关系的人,都会义无反顾地投身到大数据的江湖里来,包括贩菜的、修车的、卖书的、开店的、做饭的……都纷纷声称要向大数据转型。
图1 大数据上头条
进入2012年,大数据一词越来越多地被提及,人们用它来描述和定义信息爆炸时代产生的海量数据,并命名与之相关的技术发展与创新。它光顾过《纽约时报》、《华尔街日报》的专栏封面,进入了美国白宫官网的头条新闻,现身在国内一些互联网主题的讲座沙龙,甚至被嗅觉灵敏的证券投资商等写进了投资推荐报告。
一桩桩围绕争夺大数据制高点而展开的并购案,一家家发布大数据战略的IT厂商,一个个关于大数据的传奇故事,一场场以大数据为主题的研讨会议,一名名轮流登场布道的专家大佬,无一不在宣告:大数据时代来了。
盘点近年来的西方影视剧,最靓丽的风景莫过于其中的高科技奇观。这些影视剧使用先进的高科技进行制作,拥有无可比拟的观赏性和征服力,总能给人以极大的震撼和幻想,充分体现了科技和艺术结合的魅力。同时,它们又总能紧跟潮流,与时俱进,将最时尚、最前沿的新东西融入到电视剧当中,因而一些年轻人对西方影视剧情有独钟也就不足为奇了。
大数据[1-4]无疑是2013年IT业内最热的词。厂商热推,媒体热炒,仿佛不谈大数据,不推大数据,不用大数据,就没有了未来。当IT业界正在爆炒大数据的时候,影视圈的导演和主角们自然也不甘寂寞,他们雄赳赳、气昂昂地投身到这场轰轰烈烈的造星运动之中。娱乐没有圈,没有谁规定电影人不能玩高科技!
臧克家在《有的人——纪念鲁迅有感》写道:“有的人活着,他已经死了;有的人死了,他还活着……”如今,随着科技的发展,诗人的这一预言变成了现实。当深爱之人不幸殒命,你会用科技的力量复活他么?2011年热播的英国电视剧《黑镜》给出了答案:Yes!
图2 《黑镜》
《黑镜》(如图2所示)是英国电视4台于2011年12月播出的迷你电视剧,由英国制片人查理•布鲁克制作。“黑镜”的灵感来源于人人都有的“黑镜子”——每个家庭、每张桌子、每个手掌之间都有一个屏幕、一个监视器、一部智能手机,这是一面反映时下现实的黑镜子。
全剧共两季,每季三集,以六个建构于现代科技背景的独立故事,试图表达当代科技对人性的利用、重构与破坏。
在《黑镜》第二季第1集《去去就来》中,艾什生前是一个社交网络控,几乎天天泡在Facebook,Tw itter这类网站上。控来自于Comp lex,即情结、极度喜欢的意思。每天玩社交网络的艾什伤不起啊!除了做梦的时候不上,其余时间分分钟都在上网,没事儿就想着点刷新,手贱得根本无法自控。在玛莎的劝说下,艾什同意和她搬到一处偏僻的小屋去住。糟糕的是,艾什在一次车祸中不幸遇难。在艾什的葬礼上,玛莎的朋友萨拉称某公司可以利用艾什生前在社会媒体上留下的“生活轨迹”再造一个“真实”的、具有“人工智能”的艾什。一开始玛莎认为这个想法太不可思议,但最终还是同意了。此后,玛莎很快发现自己怀孕了。人工智能艾什给玛莎发来很多邮件,玛莎决定回复其中的一封。这个“死后重生”的艾什会做何反应呢?
寂寞无助的玛莎经不起亲情和爱情的双重诱惑,她太爱艾什了!于是,在供应商为玛莎量身定制从文字聊天到语音通话的套餐吸引下,她无法自拔,自愿加入了一个尚在测试阶段的项目,该项目利用艾什在Facebook,Tw itter等社交网络上留下的大量数据,重建了一个模拟艾什人格的人工智能(AI)机器人。
在社交网络上分享信息实际上是一个量化自我的过程。量化自我(QS)是指通过科技方式将一个人日常生活的各方面,包括物质摄入,身体状况以及体能情况记录下来的一项活动。量化自身的追随者相信收集,分析数据可以改善一个人的生活。
剧中替身机器人的生产商采用了软件免费+硬件收费这一盈利模式。先提供免费的文字和语音沟通服务令用户产生依赖,然后借机推销昂贵的人形终端设备。当厂商成功地将用户对逝去亲人的感情转移至人工智能,有谁会拒绝一掷千金换回爱人音容笑貌呢?
供应商提供了三种服务:初级服务、中级服务和高级服务。初级服务提供在线聊天服务,但这里的在线聊天是文字类型的,通过IM(即时通信)的形式进行彼此间的交流;中级服务在文字沟通交流的基础上,拓展至可语音通话,从而使人物更加立体化和情感化;高级服务则直接给你一个活生生的人。他可以陪你说话,可以陪你睡觉,可以给你做饭,而且他还遵循机器人三大定律(机器人不得伤害人、机器人应服从人的一切命令,但不得违反第一定律、机器人应保护自身的安全)。对于数据提供商来说,初级服务是可以免费提供的,而中、高级服务则是需要收费的。
通过对艾什在社交网络上留下的信息进行分析,获得模型、发现规律、统计比较,最终实现“预测”这一终极目的,即预测在特定的情景下,“如果艾什活着,他会怎么做?”
当然,需要提醒的是,社交网络上不可能包含所有的生活情景,这使得重建的人格中存在数据空白。如艾什身上有颗痣,而替身机器人(如图3所示)却没有,因为艾什可能不会在社交网络上公布身体的这些细节信息和一些私密行为的信息。
图3 人工智能艾什
这些数据的空白环节需要替身机器人自行学习。人工智能学习的知识有两类:一类是数据库;一类是使用过程中用户的实时反馈。剧中的替身机器人重建人格并填补上数据的缺项后,人工智能就拥有了一个情景库,其中包含可能遇到的各种情况,并有与之对应的处理方式。人工智能剩下要做的,就是将实际遭遇的场景与这个库中的范例进行匹配。
替身机器人的本体是保存在云端服务器的人工智能。眼下方兴未艾的一“云”多“端”思路在剧中的时代已经生根发芽,观众看到的替身机器人与女主角最初用来与A I沟通的电脑、智能手机一样,只是一台终端。
科幻从来不是无根之水,剧中的替身机器人涉及的技术已初现端倪,“复活”爱人并不遥远。如果这事儿发生在古代,活生生的一出《人鬼情未了》。还好,剧集发生在未来,所以一切都经得起推断和解释。
此类替身机器人面临着诸多伦理问题:一是中国有个不成文的传统:人死为大,逝者为尊,入土为安。在亲人不幸离世之后,使用逝者生前留下的数据重建他的人格甚至外貌,并将重建的数据用于定制替身机器人是否合适?是让爱人“复活”还是假以怀念?二是发表在社交网络的大部分数据都是公开的,如何避免有未经授权的机构或个人擅自盗用这些数据,复制出死者甚至活人的替身用于非法行为?
社交网络的大数据分析,除了复活逝者,还能在人海寻找拥有相同思考逻辑与兴趣爱好的“灵魂伴侣”。当曲终人散,科技不该让人沉湎过去,而该助人迈步前行。我们不想去纠结剧集本身的压抑和黑暗以及主创所想要表达的思想,只想通过这么一个剧集,来看一下大数据未来的应用。无疑,在这部剧集中大数据最为直观的应用就是能够生产智能机器人。
一名棒球好手走在路上,忽然看到一只小猫在树上摇摇欲坠。他赶忙奔去将小猫接个正着,然后朝一垒方向扔去。在国内,棒球仍属于非常小众的运动。而在美国却红得发紫。但是,打好棒球其实并不是一件容易的事情,就连棒球巨星米奇•曼陀都说:“难以置信,打了一辈子球,却依然对它知之甚微!”一个4 000万美元年薪家底的棒球队能够和一个1.14亿美元年薪家底的球队相抗衡,而且还能赢得1亿美元?电影《点球成金》(如图4所示)给出了答案。
图4 《点球成金》
影片《点球成金》改编自迈克尔•刘易斯的《魔球:逆境中致胜的智慧》。讲述的是一个真实的故事,介绍奥克兰运动家棒球队总经理比利•比恩的经营哲学,描写了他抛弃几百年一直依赖的选择球员的传统惯例,采用了一种依靠电脑程序和数学模型分析比赛数据来选择球员的方法。他并没有采用那些像“棒球击球率”这样传统的标准,而是采用了看上去很奇怪的、类似“上垒率”这样的标准。这个方法发现了这项体育赛事的另一面,始终存在却一直被忽略了的一面。一个球员怎样上垒并不要紧,不管是地滚球还是三垒跑,只要他上垒了就够了。当数据表明偷垒不实用的时候(即使这会让比赛更有看头),比利•比恩也不会再关注这种华而不实的技能。
2003年,此书出版后在美国掀起了一股热潮,从波士顿、纽约到旧金山、洛杉矶的球迷、新闻媒体乃至金融精英都津津乐道于书中的只言片语。数年后,该书的影响力甚至跨越太平洋到了欧洲足球界。这本颠覆了美国体育管理层思路的书,讲述了精明的比利•比恩如何采用统计学和数学建模的方式分析数字,从而取得最终胜利的经营哲学。他是逆向投资的表率,用极少的资金经营着这家俱乐部,并使用复杂的电脑程序分析比赛数据,用“数据”的方式将一个小球队打造成超级劲旅,使得这只球队取得了一场又一场的胜利,甚至有能力与大名鼎鼎的纽约扬基队竞争市场。2011年由原著改编的同名电影正式上映,布拉德•皮特扮演了总经理比利•比恩。
《华尔街日报》评价说:“从来没有一部电影将枯燥的数据转化为如此令人愉悦的娱乐体验。”《芝加哥太阳报》则认为:“这是一部聪明、紧张且感人的电影……虽然入场前我已经知道电影的故事,但影片的智慧与深度是我没有预料到的。”该片获得第84届奥斯卡最佳影片、最佳男主角、最佳男配角、最佳改编剧本、最佳音响效应、最佳电影剪辑等6项提名,以及第69届金球奖最佳剧情片、最佳剧本提名。
在美国职业棒球大联盟比赛中,比利所属的奥克兰运动家队败给财大气粗的纽约扬基队,三名主力被重金挖走。总经理比利很早就发现自己的天赋不足以成为大联盟的球员,因而他下定决心成为一个棒球界的高层管理人员。他在奥克兰运动家队做球探,8年后就成为了总经理。他暗下决心改造球队。
比利是一个“特立独行”、“思维怪异”的家伙,就是在这样一个经理人的掌控下,他的一切行事和工作几乎皆不按常理出牌,处理一切皆采用逆向思维的方式。就是这样一个比利,按照他自己所谓的对事物真谛的顿悟,打破一切惯例常规之后,成功组建和塑造了一支具有强大战斗力的棒球队。
在竞争激烈的美国职业棒球大联盟(MLB),比利的奥克兰运动家棒球队无论在人员构成、物质配备,还是在资金实力上都仅仅位于“下三流”之列,不可能像扬基队那样一掷千金来购买高身价的球星。一次偶然的机会,他认识了耶鲁大学经济学硕士、大胖子彼得,两人对于球队运营的理念不谋而合。
比利聘请彼得作为自己的顾问,查询所有球员的历史数据,利用数学建模,定量分析不同球员的特点,合理搭配,重新组队,颠覆棒球界靠重金挖明星球员的传统理念(如图5所示)。在新的赛季中,奥克兰勇士队创造20场连胜的战绩,刷新大联盟纪录。
图5 比利和彼得用数据拿冠军
如何在不公平的竞争中以弱胜强?这就是比利•比恩面临的难题。所谓“不公平的竞争”便是指美国棒球大联盟不同球队间巨大的薪资差距。2001年,纽约扬基队的总年薪高达114 457 768美元,这个天文数字不仅在当时美国体育界鹤立鸡群,即便是在世界范围内也毫不逊色于皇家马德里、巴塞罗那、曼联之类的足球豪门。然而,奥克兰运动家队同时期的总年薪不足纽约扬基的三分之一,只有39722 689美元,在全联盟位列倒数第3位。薪资的巨大差距意味着优秀球员的流失,更难以寻觅联盟中那些当红的超级巨星。除了捉襟见肘的工资预算,运动家还是一支典型的“小市场”球队。一穷二白的状况不仅使其无法招揽球员,甚至连一座像样的专业棒球场都供养不起。自1968年至今,奥克兰运动家队都不得不与同城另一支美式橄榄球队共用体育场。设施陈旧和全美倒数的观众上座率几乎成为运动家队主场的“特色”。
然而,运动家队却是近年来“投入产出比”最高的职业棒球队。2000年至2003年间,他们每赢一场球的成本约50万美元,而扬基每赢一场的成本则几乎是其3倍(近150万美元)。至于联盟中其他那些“富队”,则需要花费近300万美元才能赢一场“天价”般昂贵的胜利。金融圈出身的作者刘易斯很敏锐地捕捉到了这个诡异的现象,于是便有了这本书。他希望借此来勾画与解释比利•比恩是如何扮演这么一位近乎“无米”的“巧妇”角色。
棒球是一项强调数据的运动。所谓“数据”不仅包括球队的各项胜败指数,还有每个职业球员的各类成绩:防御率、胜投数、打击率、长打率、全垒打数、打点数等多达几十类别。在谈论某个球员时,资深棒球迷都会如数家珍般报出一连串数字。若被不谙棒球者听到,或许是以为两位证券分析员在交流工作心得。长久以来,美国棒球界也将这些数据的记录工作看作重中之重。于是,即便是20世纪初,某场比赛的交战数据都能毫不费力地找到。然而,在比利•比恩看来,棒球界却没有将这些数据转换成真正提升球队战绩的“不二法门”。基于这个想法,他开始摸索一套全新的方法来解读棒球数据背后的“真谛”,甚至不惜向所谓“百年传统”宣战。
比利的成功之道是运用一整套的数据分析法(Sabermetrics)来代替传统的球队运作,这是一种美国棒球研究协会(SABR)所倡导的统计方法。直到现在,美国高级棒球研究协会一直是一种奇特的亚文化的中心。比利最重视的是上垒率,而这种统计方法帮助他成为出色的管理人员,也使得运动家队最终成功。
这套全新方法被称为“棒球统计学”,其创始人并不是比利•比恩,而是一位统计学家比尔•詹姆斯。他也是刘易斯《魔球:逆境中致胜的智慧》书中的另一位主角。比利认为,棒球界传统的统计数据无法准确反映出球员或球员的价值,也无法准确预测其未来的表现,而对这些数据的解读也缺乏一种科学的方式。于是,他雄心勃勃地设计了一套统计学公式来计算各类既有的棒球数据。在一片批评与质疑声中,比恩的“棒球统计学”在奥克兰运动家棒球队的办公室里被铭记了下来。
早在1977年,比尔就自费出版了自己的“研究成果”,但却几乎毫无反响。棒球界的元老们根本瞧不上这样一位从没真正打过棒球的“门外汉”。在他们看来,这类书呆子式的纸上谈兵可能连“票友”水平都不如。问世20年后,穷则思变的比利•比恩才成为第一个真正吃螃蟹的实践者。
比利破天荒地将“棒球统计学”作为球队的经营方针。他尽可能地将球员能力数据化,并以此作为衡量球员能力的惟一标准,而非某些基于主观经验的判断。通过这套统计学公式,比利以有限预算去寻找那些价值被低估的球员。同时,他还强迫整个球队摒弃传统的成绩评估标准:既然让棒球比赛结束的因素是27个出局数,而不是时间;那么就忘记“打击率”、“盗垒”等华而不实的成绩,“上垒率”才最重要。因为只有上垒才能减少出局的概率,并提高得分的概率。比恩打破一切常规惯例,在全新理念的指引下,运动家队在2000年后曾5次打入季后赛,4次获得分区冠军,共赢了1 045场比赛。期间,甚至还创下了美国职棒联盟百年历史上连胜20场的空前纪录。从那以后,统计学家取代球探成为了棒球专家,很多其他球队也开始争相采用“棒球统计学”来指导球队运作。
人们经常用“有贼心没贼胆”来调侃自己,未来有贼心可能也会犯事儿。
它几乎无所不能,全天候监视所有人的行踪,聪明地预测出谁是危险分子,谁会遭遇不测……美国政府用它攻击恐怖分子,开发者则用它拯救普通人,这是美剧《疑犯追踪》(如图6所示)里的“神器”。这真的只是一部科幻剧吗?
《疑犯追踪》是CBS(美国哥伦比亚广播公司)电视台制作的犯罪电视系列剧,由乔纳森•诺兰与艾布拉姆斯共同打造剧情架构。与同类型的《戏中迷局》、《基本演绎法》相比,实属以剧情和人物刻画取胜的佳作。主演拍档是电脑天才芬奇和能打架能卖萌的性情帅哥,同样出彩的也有好警察、坏警察和讲人性通晓MBA(工商管理硕士)的黑帮老大。
图6 《疑犯追踪》
《疑犯追踪》讲述了一位推定死亡的前CIA(中央情报局)特工里瑟与一位神秘的亿万富翁芬奇联合起来,运用一套独特的办法制止犯罪的故事。该剧于2011年9月22日首播。2012年9月28日起播出第2季。2013年9月24日起播出第3季。
剧集以每集一个案子,主角和情报局互相猫鼠游戏为串联,同时配合时代错综的来回倒叙手法,可谓精彩迭起。此剧的大胆之处是将C IA和FB I(联邦调查局)与犯罪错综复杂的人物关联以及理不清的内部白吃黑、黑吃黑、黑吃白一一呈现,特别是莱纳尔•弗斯科,长着黑警察的脸,怀着好警察的心,走着双面卧底的路线,还卖着为黑白两道两厢奔走和互相欺瞒的命。
相比帅哥主角单一的角色设定,更喜欢芬奇的傻劲和执着。在大数据时代,人们感到越来越不安全,生活在监视器下,没有任何隐私,不知不觉地开放着个人信息,通过社交网络,通过联网信息,通过条条光缆,随时随地向有心犯罪和政府输送着证据和把柄,这些数据可能会在不久的将来,被拿来用作威胁的资本。
哈洛•芬奇是一位深居简出、极度重视个人隐私,且拥有亿万身家的天才软件工程师,是一家软件公司的幕后老板。他为政府开发了一套称作“神器”的、可侦测恐怖攻击的电脑系统(如图7所示),它通过观测已有模式来识别有可能进行暴力犯罪的罪犯。它可以监视所有人,并预测“有计划性或经谋略策划的犯罪”,诸如9•11事件之类的大型恐怖攻击灾难,并提供情报让有关当局防患于未然。
图7 神器
他雇用了一位被推定死亡的前美国特种部队绿色贝雷帽队员、前CIA探员里瑟,二人使用国家级监测技术,加以里瑟的专业技能和芬奇的无限财富,开始“法外执法”,力图在犯罪发生前就对其加以阻止。里瑟的行动引起了纽约市警察局的注意,其中包括警探卡特和弗斯科。面对无数的犯罪调查,里瑟和芬奇发现能够改变一切的关键就是找到正确的人、正确的信息和正确的时间。
强大的计算机集群将整个纽约市的摄像头整合在一起,结合每个人的信用卡记录、医疗及社会保险记录、行车罚单等各种数据,筛选各种有犯罪或被害人的模型,并不断补充新的数据和修正这些模型,推断并锁定出危害别人或即将被害的自然人。
[1] 郎为民.漫话大数据[M].北京:人民邮电出版社,2014
[2] 维克托•迈尔-舍恩伯格,肯尼思•库克耶.大数据时代:生活、工作与思维的大变革[M].盛杨燕,周涛译.杭州:浙江人民出版社,2013
[3] 涂子沛.大数据:正在到来的数据革命,以及它如何改变政府、商业与我们的生活[M].桂林:广西师范大学出版社,2013
[4] 刘晗.用数据给电影“算命”,搭上大数据头班号[N].科技日报,2012-5-21 (7)
中国国航A330将搭载GX Aviation卫星通信系统
2月21日,Inmarsat迎来了GX Aviation又一重要里程碑事件——中国国际航空公司(中国国航)同霍尼韦尔航空航天集团 (Honeyw ellAerospace) 签署了一份谅解备忘录,将于 2015 年第二季度在国航现役 A 330 型飞机上安装并测试 GX Aviation空中网络连接服务。
Understanding Big Data based on Movies & TV Play
Lang Weimin, Chen Kai, Zhang Guofeng, Cai Lijin
(PLA Institute of National Defense In form ation, Wuhan, 430010, China)
Big Data is undoubtedly the hottest word in 2013 throughout the IT industry. Vendors say highpraise for it and media report it frequently, as if there would be no future without talking about big data, advertisingbig data, applying big data. When the IT industry is paying more and more attention to big data, directors andmovie stars are unw illing to be the spectators, so they participate valiantly in this vigorous star-making movement.This paper analyzes the element of big data in the British TV series "Black Mirror", the movie "Moneyball" and U.S.TV series "Person of Interest", refects the charm of big data and forecasts the various applications of big data.
Big Data; Black Mirror; Moneyball; Person of Interest
10.3969/j.issn.1672-7274.2014.03.009
TN919.5文献标示码:A
1672-7274(2014)03-0035-06
国家自然科学基金资助项目(60703099)
作者介绍:郎为民,男,1976年生,河北省馆陶县人,华中科技大学电信系博士,国防信息学院综合保障信息系统教研室主任,副教授,中国通信学会高级会员,硕士生导师,主要研究方向为大数据、物联网和下一代移动通信系统。
陈 凯,男,1991年生,陕西省西安市人,国防信息学院在读研究生,研究方向为认知无线电网络。
张国峰,男,1989年生,内蒙古赤峰市人,国防信息学院在读研究生,研究方向为认知无线电网络。