闵应骅/口述 李斐然/撰文
什么是小数据?小数据就是个体化的数据,是我们每个个体的数字化信息。比如我天天都喝一两酒,突然有天喝完酒胃疼,我就想了,这天和之前有何不同?原来,这天喝的酒是个新牌子,可能就是喝了这个新牌子的酒所以胃疼。这就是我生活中的“小数据”,它不像大数据那样浩瀚繁杂,却对我自身至关重要。
第一个意识到“小数据”重要性的是美国康奈尔大学教授德波哈尔·艾斯汀。艾斯汀的父亲去年去世了,而早在父亲去世之前几个月,这位计算机科学教授就注意到老人在数字社会脉动中的些许不同——他不再发送电子邮件,不去超级市场买菜,到附近散步的距离也越来越短。
然而,这种逐渐衰弱的状态,真到医院去检查心电图,却不一定能看出来。到急诊室检查的时候,不管是测脉搏还是查病历,这个90岁的老人都没有表现出特别明显的异常。可事实上,追踪他每时每刻的个体化数据,他的生活其实已经明显与之前不同。这种日常小数据带来的生命讯息的警示和洞察,启发了这位计算机科学教授——小数据可以看作是一种新的医学证据,它是属于你的数据。
人们爱说,大数据将改变当代医学,譬如基因组学、蛋白质组学、代谢组学等等。不过由个人数字跟踪驱动的小数据,也将有可能为个人医疗带来变革,特别是当可穿戴设备更成熟后,移动技术将可以连续、安全、私人地收集并分析你的数据,这可能包括你的工作、购物、睡觉、吃饭、锻炼和通讯,追踪这些数据将得到一幅只属于你的健康自画像。
假设你是一名患者,这样精确而个体化的小数据也许可以帮助你回答:我每次服药应该用怎样的剂量?当然了,药物说明书上会有一个用药指导,但那个数值是基于大量病人的海量数据统计分析得来的,它适不适合此时此刻的你呢?于是,你就需要了解关于你自己的小数据。
再比如癌症治疗。肿瘤细胞的DNA对不同的癌症病人会引起不同变化。所以,对许多患者用同一个治疗方法是不可能成功的。个性化或者说层次式的药物治疗是要按照特定患者的条件开出药方——不是“对症下药”,而是“对人下药”。这些个性化的治疗都需要记录和分析个人行为随时间变化的规律。这就是小数据的意义。
当然,这并不是说大数据就不重要。从大数据中得到规律,再用小数据去匹配个人。
(欢 歌摘自《中国青年报》2014年4月16日,〔波兰〕约瑟夫·本德伊查图)