“内存计算数据管理”专辑导读

2014-03-31 12:04周傲英
关键词:华东师范大学数据管理内存

周傲英

互联网改变了一切,包括改变了信息技术的发展模式.早期互联网发展的典型套路是:通过向人们提供搜索、娱乐、社交等服务,吸引用户上线;产生流量后,再通过“流量变现”获取利益.这就是所谓的“制造需求”和“眼球经济”.Hadoop是这个阶段数据管理的经典之作.如今,“通过营造虚拟空间制造需求”的传统互联网商业模式已发展到极致.与此同时,移动计算和位置服务等技术的发展,则为把人们线上和线下的生活关联起来提供了技术条件.当前,互联网商业模式的发展正在进入一个新的阶段,那就是备受关注的O2O和反向O2O模式.

当人们的(线上)虚拟空间生活和(线下)现实生活密不可分时,新的挑战和机遇也随之而来.经过三四十年的发展,数据库已经成为现代信息社会的重要支柱,并构成信息基础设施的重要组成部分.人们的日常生活行为,电信记账、出行订票、银行转账等等,都需要后台数据库系统的支持.数据库系统区别于其他软件系统的本质之一,就是支持事务处理(包括数据库恢复和并发控制).互联网版本的并发控制和事务处理是当前数据管理领域所面临的一个挑战,同时也是一个发展机遇.应用需求的变化,硬件技术的发展,互联网企业在数据管理领域的成功探索,改变了数据管理领域长期固守的一些基本假设.面向互联网和面向企业的数据管理逐步走向融合,数据管理技术和系统也随之进入新一轮的探索发展阶段.

数据管理是信息系统的核心问题.信息服务的互联网化使得信息系统在数据规模和业务规模上都面临着巨大的挑战,传统的依赖于高端主机和小型机的集中式数据管理系统已经成为掣肘信息系统扩展服务规模的瓶颈.数据管理的技术变革已经从互联网领域向传统的电信、交通、能源、金融等商业应用领域扩展.闪存、固态硬盘和高速网络等硬件设备的应用,对高可靠、可扩展的分布式数据管理系统的技术发展提供了支撑.针对不同应用的需求来研发适用的数据管理技术已经成为一种可能,更成为一种趋势.

近十年来的数据管理探索和技术发展已经证明,使用通用的数据库管理系统来应对任何类型的数据管理需求和负载是不可行的.在谷歌发表了介绍GFS、MapReduce和BigTable的三篇论文之后,以Hadoop及其相关系统为代表的开源数据管理平台如雨后春笋般出现,形成了互联网数据处理的技术生态圈.其典型特征就是通过搭建无共享的MPP集群获得分布并行的数据处理能力,从而达到高可用和高性能的特性.为了应对互联网规模的应用提出的高可扩展性和高性能的要求,Oracle、微软、SAP、EMC等传统数据库系统软件和解决方案厂商也通过自主研发或收购的方式,发布了一批具有良好扩展能力的高性能数据库管理系统.

Hadoop生态圈的形成,促使人们开始反思传统的数据库系统设计理念,开始针对现实应用中特定的数据和负载来设计专用的数据管理系统.进入21世纪以来,计算机系统各组件(CPU,内存,磁盘,网络等)在容量和性能上有了极大的提高.内存容量的大幅增长,使其具备了存储、管理海量数据的能力;处理器设计也经历了由单核向多核再到众核的发展,并出现了多核/多处理器共享缓存的架构;大容量闪存如固态盘(SSD)、相变存储器(PCM)等的出现,带来了计算机系统存储结构的变化;这些改变促进了数据管理系统构架的变革.基于内存计算的数据管理系统的研发成为学术界和工业界共同关注的一个热点.

华东师范大学数据科学与工程研究院成立于2013年9月,定位是建设国际性的从事大数据相关研究的协作创新平台和研发基地.研究院秉承和践行协同创新理念,立足中国市场的大数据应用需求,依托华东师范大学,通过学术伙伴、企业赞助和访问学者等机制积聚各类创新要素,全面提升研发能力和应用推广能力,致力于发展有中国特色的大数据技术和系统.研究院现有的学术伙伴包括来自清华大学、中国人民大学、武汉大学、西北工业大学、中山大学、东北大学和云南大学等七所高校的数据管理研究组;企业赞助商包括SAP、交通银行、平安科技、华为、宝信软件、淘宝、聚胜万合和高德导航等多家公司.研究院起源于成立于2007年的海量计算研究所以及成立于2012年的云计算与大数据研究中心,研究院在Web数据管理、社交媒体数据分析、不确定性数据、数据流等海量数据处理与分析方面有着长期丰富的积累.自2011年底,在SAP等企业的支持下,启动了内存计算数据管理系统的研发工作;当前的研究兴趣还包括知识图谱、在线教育、基于位置的服务(LBS)等方面.

为了加强与兄弟院校研究人员以及企业合作伙伴之间的合作与交流,同时也是为了响应国家科技部2014年项目指南的精神,促进内存计算数据管理系统的研发工作,研究院在2014年积极组织各种类型的学术交流活动:于2014年5月,召开了华东师范大学“数据科学与工程”论坛内存计算数据管理主题报告会,邀请了来自多家学术伙伴和合作企业的研究人员,就各自研究工作的进展和合作研究计划进行了深入的学术交流和讨论,确定了在《华东师范大学学报(自然科学版)》出版“内存计算数据管理”论文专辑的计划.该计划得到了《华东师范大学学报》编辑部的大力支持,并得到授权邀请国内相关领域的专家学者组成了专辑特邀编委会.2014年7月,在华东师范大学2014年数据科学与工程暑期学校召开期间,专辑编委会成员齐聚上海,对收到的稿件进行了认真的审阅,最终确定录用31篇稿件.全部论文分为技术综述、系统介绍、关键技术、应用分析和基准测试五个栏目:学者和专家们分别从各自的角度,对面向新型内存的系统架构、系统可用性、容错性、并行计算模型等相关领域的技术发展进行了讨论;对各自正在研发的内存计算数据管理相关的系统进行了全面的介绍;介绍了各自在面向内存计算的查询、索引、OLAP等领域的工作进展;介绍了内存计算相关系统和技术在不同领域的应用案例;以及针对如何评测内存计算数据管理系统的性能提出了自己的观点和方案.

在本专辑出版之际,谨在此衷心感谢各位在短时间内提供高质量稿件的作者以及受邀担任专辑编委的各位专家学者,也对学报编辑部的信任表示感谢.特别感谢《华东师范大学学报》的王善平老师和李艺老师,正是他们的及时帮助和严格把关才使得本专辑得以高质量顺利完成.希望本专辑能为我国从事相关领域研究开发和应用的科研人员及时了解内存计算数据管理这一新的研究方向的最新进展提供一个窗口.

猜你喜欢
华东师范大学数据管理内存
华东师范大学学报(自然科学版)2022 年总目次(总第221—226 期)
企业级BOM数据管理概要
定制化汽车制造的数据管理分析
海洋环境数据管理优化与实践
CTCS-2级报文数据管理需求分析和实现
“春夏秋冬”的内存
More Than Providing Nutrition: Food and Eating in The Importance of Being Earnest
Fighting for freedom and democracy: After reading the 1830 and 1848 Revolution in France
The Way to an Economic Giant
内存搭配DDR4、DDR3L还是DDR3?