10年前,我坐着绿皮火车踏上了去往大学、通向理想之门的征程。我的专业是地理信息科学。直白地解释,就是用编程技术去建模地理学问题,然后用地图的方式展示分析的过程和结果。
近年来,大数据技术兴起,越来越多的人通过空间大数据分析来关注社会经济现象、社会群体、社会文化和人类行为等方面的问题。而这也正是我们的工作。
你知道每天有多少个自然村落在消逝吗?答案是120多个。
这是我在做一项关于地名遗产的大数据分析项目时得知的答案。这些不断消逝的村落,有些是因为合并而消失,有些是因为人们都去了城市而荒芜。村落的荒芜意味着村落地名的消失,更意味着一种弥足珍贵的地名文化的丢失。
为了更好地了解地名文化,我们不仅采集了大量数据,还远赴成都进行实地调研。因为听不懂方言,我们只能不断找人翻译。慢慢地,我们发现,当地的村落名称很多都带“龙”字。为什么会这样呢?我们查不到可靠而详细的文献,只好再向当地的老人求教。通过访问村民、社区文化站、当地政府,加之以数据分析,我们才得到了初步的结论。
空间大数据分析师用数据发现问题,并解决问题。这是一个艰难的过程,除了对技术的要求,还考验你的实践能力和耐心。
“八大菜系”你不陌生吧?但你知道现在位列八大莱系之首的是什么菜吗?如果你的答案是“鲁莱”,我的数据可能会让你惊讶。
在一个关于饮食文化的大数据分析项目中,我通过代码,获取高德地图上750万个餐馆兴趣点数据,提取这些餐馆相应的菜系,分析这些菜系在地图上的空间分布特征和模式。
大数据分析的结果告诉我,以前排在八大菜系之首的鲁菜,其地位已是岌岌可危,而川菜的发展势头相当迅猛,是目前分布最广泛的莱系。
但调查到这里就结束了吗?并不是。举个例子,东北莱实际上是鲁菜的一个分支,闯关东时期,很多山东人来到了东北,将鲁菜与当地的食材和饮食习惯相结合,从而形成了现在的东北莱。现在东北菜的发展也很好,在某种程度上,可以说鲁菜与时俱进了。如果你不了解闯关东,不了解鲁菜的渊源,你就没法做好大数据分析。
所谓大数据,并不是通过数据简单地说话,而是要用专业素养分析数据,让数据变得更有温度,并且更有说服力。在一个关注社会低收入群体的项目中,我从相关部门拿到上海市数万辆出租车的轨迹数据,采用GIS技术分析得到出租车群体的工作时长、工作时间节点及其居住地的空间分布特征。
分析这个有什么用呢?出租车司机其实是城市里的低收入人群,但他们又是城市最大的贡献者之一。然而根据大数据分析,他们的住所基本聚集在一起,且离市区10公里以外。随着经济的发展,这些对城市贡献最大的人,却成了被疏离的一群人。政府应该怎样关注他们?通过我们的大数据分析报告,政府可以调控出租车的税收、滴滴对出租车的影响等。如果没有大数据分析报告,政府可能投了大量的金钱,花了大量的精力,却没有用在刀刃上。
成为一名空间大数据分析师后,我越發强烈地感受到:技术是先进的,数据是有趣的。而更大的成就感在于社会价值,因为我们是在用实际行动关注社会,用专业知识、技能和自己的思考,或多或少地,有形或无形地影响这个社会。
作为一名地理学人,我很骄傲能用自己的热忱和技术,诠释大数据时代地理学作为自然科学、社会科学和人文学科的综合体,在人们日常生活中所扮演的重要角色。