魏忠
公元760年,已经发配贵州夜郎漂泊了三年的诗人李白在巫山吟游,接到赦免他的皇命,家也不回改变行程坐船由三峡直下江陵,写下了“朝辞白帝彩云间,千里江陵一日还”的诗句。与后世的苏东坡一样,一生坎坷的李白人间处处是精彩,也是想象力的半径起的作用巨大。
按照一些学者的考证,从碎叶内迁的李白不能参加科举考试,也就失去了功名的机会。不死读书,却成就了艺术天才李白的数学范儿。在李白一生所写的1100首诗歌中,最让人难忘的是李白对于数词的使用:白发三千丈、千里江陵一日还、对影成三人、四万八千岁、飞流直下三千尺、落九天,这是中国其他诗人望尘莫及的。李白这种数词使用的灵感,来源于李白一生的万里行路。
目前收录在《唐诗三百首》中的20首李白诗歌中,有明确数词使用的就有18首,只有《静夜思》《越女词》没有数词使用。而像“朝辞白帝彩云间,千里江陵一日还。两岸猿声啼不住,轻舟已过万重山”,既有数词又体现速度,而“城头铁鼓声犹震,匣里金刀血未干”是用比喻表现速度,虽无数词,但也是用数据说话。在数据理工男看来,李白诗歌有两个特点让他有别于一般的诗人,一是用数据说话,二是讲故事。
用数据讲故事,不仅要求你会讲故事,还要求你会使用数据。如果你是文青,你要有数学范儿;如果你是科学家,那么你要会讲故事。汉斯·罗斯林是瑞典卡罗琳学院的国际卫生学教授、医学统计学家。1996年他将人类几百年的GDP数据收集起来,用一种名为Trendalyzer的软件展示出来,并用动画技术让这些数据讲故事,颠覆了传统意义上人们认为的社会制度、治理水平和经济发展之间的关系,预示着全球经济发展之间的联系和共同规律以及发展阶段之间的内在关系。浙江大学医学院李兰娟院士承担国家重大公共卫生协同创新平台的项目,2015年项目验收时,邀请了美国著名的数据科学家张小彦博士对公共卫生决策的数据进行可视化分析。张小彦博士用了几个月时间,其重心就是让公共卫生决策专家系统,变成友好的会用数据讲故事的界面。在张博士看来,故事讲得好,就会变专家决策为用户决策,“SELF-SERVICE”是故事讲得好的最高标准,不是吗?李白的诗写得好的原因在于,巧妙地运用大量的数词,故事根本不用文学评论家辅导解读。
总体来说,用数据讲故事基本上采用可视化的方法,笔者总结了以下几种方法:1. 叙述方式随着时间改变:著名的南丁格尔极地图,就是开创了这种巧妙的方法。2. 由大及小:就像世界杯足球赛转播的摄像师,从宏观场景一直聚焦到一个美丽的表情。3. 由小及大:像很多无人机实现的自拍,从自拍一直拉伸到风景、城市,甚至地球、时代。4. 突出对比:将极端和选项的进化过程用突出的对比实现,例如GDP和政治制度的关系。5. 探究交叉点:显示几组概念的交集及其构成原因。6. 剖析原因:变量因素与结果进行对比显示。7. 描绘异常值:将异常值突出进行表现。
又回到中世纪的一句谚语:“资助科学家和艺术家,是富人的天职”。原来,那些富人把两拨人搞到一起,是为了讲故事。