张平平 李晨曦
“中国的移动互联网用户超过12亿,人均上网时长6.9小时,每天提供在线总时长80亿小时。”
近日,中国工业经济学会会长、中国社科院大学教授江小涓谈论数字经济时表示,相信中国个人数据的流量产生是全球第一。
《数字中国发展报告(2022年)》显示,截至2022年底,中国数据存储量已达724.5EB(艾字节),同比增长21.1%,全球占比14.4%。
近年来,中国移动互联网的发展带来了数据量的爆发式增长,以及高度不确定的交易量变化,也催生了企业数字化转型的强烈需求,而承载海量数据的存储、处理等需求的主流数据库产品仍沿用着数十年前诞生的传统集中式架构。
在主流数据库架构与中国移动互联网业务场景需求的错位中,国产分布式数据库OceanBase应运而生。
在OceanBase CEO杨冰看来,主流数据库设计者在40年前所作的假设正在经受现实的挑战,过去说的“大数据”与当下的大数据已经无法相提并论。“这就意味着,需要新的假设、新的架构来解决新阶段的问题。”杨冰表示,随着数字经济的发展,分布式架构将是支撑现代化数据库的新架构。
近日,OceanBase2023年度发布会上,该公司披露已服务超过1000家客户,去年一年客户数增长150%。在1000家客户中,30%将OceanBase应用于核心系统,为核心系统升级首选。在金融领域,OceanBase已成为市场占有率名列前茅的分布式数据库。
数据库,是和芯片、操作系统并列的现代信息技术领域的三大核心基础之一,是基础软件“皇冠上的明珠”。在企业的数字化转型过程中,数据库的升级是关键环节。
数字化转型先从应用层开始,很快触碰到底层计算网络等基础设施瓶颈,从而推动云计算和大数据平台的发展。作为PaaS层之一,数据库下接IaaS层、上承SaaS层,数据库的升级改造实际上是IT系统中最为关键、最为复杂的环节,是“最难啃的骨头”。
过去十年,中国的IaaS层经历了一轮“到云上去”的初步洗礼,而当IaaS层升级完成,PaaS层既需要匹配新的底座基础设施、又要承接SaaS层的快速迭代,在此之外还必须具备数据库应有的安全、可靠、稳定。
正如相关领域专家所言,构建数据存储安全可信保障体系是时代的需要、历史的使命。
IDC中国副总裁兼首席分析师武连峰也曾表示,对下一代数据库的要求,至少有弹性扩展、稳定可靠、极致性能、融合分析、平滑迁移、多模能力、AI融合七大要求。
始于20世纪末的中国数据库产业,在近十年快速发展,并伴随数字化热潮迎来新机遇。《数据库发展研究报告(2023年)》显示,2022年全球数据库市场规模为833亿美元,其中中国数据库市场规模为59.7亿美元,折合人民币约为403.6亿元,占全球的7.2%。
而到了当下,人工智能爆火,海量数据价值的挖掘和应用,成为推动创新的重要力量。这对数据存储和计算的性能成本提出更高要求。
“从数字化转型角度来说,数据库更要满足企业业务流程创新、用户体验创新、产品服务创新、商业模式创新、社会责任创新、风险管控创新等多个价值的需要。”在武连峰看来,对数据库的要求越来越苛刻,这对国内数据库产品来说既是挑战,更是前所未有的发展机遇。
OceanBase创始人阳振坤曾说,从OceanBase诞生的第一天起,团队成员的目标就是一致的:不只是做一款给自己用的数据库,而是做一款能推动整个社会进步、推动社会生产力发生变化的数据库。
毫无疑问,OceanBase是一款由业务场景倒逼出来的产品。十多年前,当成千上万的用户集中在一个时点支付货款,瞬时交易峰值对电商和支付平台IT系统的考验犹如洪峰过境。2010年,淘宝“双11”活动创造了超过9亿元的销售“神话”,而前所未有的巨大成交量也导致全国数家银行网银瘫痪。同年,OceanBase诞生。
2014年起,OceanBase开始逐渐取代Oracle(甲骨文)支撑支付宝核心交易系统,承担“双11”交易流量。2017年,替换蚂蚁集团核心系统最后一个Oracle数据库。2019年“双11”,OceanBase录得6100万次/秒的数据库处理峰值记录。
随着OceanBase数据库支撑的业务从边缘到核心,团队对数据库应用场景的痛点也不断有更深入的感触。在数据库实际应用中,企业往往面临着业务规模增长、业务场景变多、IT架构应用渐趋复杂的难题,造成数据库越用越多、越用越复杂的现状。
本着“把复杂留给自己、把简单留给客户”的产品理念,OceanBase团队以一体化的设计思路,解决并控制了客户使用的复杂度,致力于实现“用一款数据库解决80%的问题”。
为此,在OceanBase诞生的13年中,数据库代码有过两次重构。
第一次是从0.5版本到1.0版本,团队将原有代码推翻重写,把数据库代码从最朴素的分布式变成工程一体化,初步解决了分布式架构带来的高复杂操作问题。
第二次是2022年,OceanBase发布单机分布式一体化数据库OceanBase 4.0“小鱼”。该版本既可以实现单机部署,又可以在单机部署下实现分布式部署的完整功能,得以满足企业从小体量到大体量的不同发展需求。
杨冰坦言,设计4.0“刀子动得很大”。也正是这次重构,让OceanBase能够触达更多场景,变成了一个通用数据库。
“从OceanBase整个演进来看,一体化设计就是OceanBase产品的DNA,未来OceanBase也将持续践行一体化的产品战略。”杨冰表示。
2020年,OceanBase诞生的第十年,这款经历了数年“双11”锤炼的产品踏上了正式商业化运作的道路。
正式商业化当年,OceanBase协助工商银行完成了对公(法人)理财系统从大型主机到分布式架构改造。这也是工商银行首次在蚂蚁自主研发的数据库上运行重要业务系统。
关于商业化的三年,杨冰介绍,在最开始,OceanBase深入探索了金融、运营商、政务等场景,把所有的路几乎都走了一遍,在这些领域已经开始出现规模化复制的迹象;此外,2021年,OceanBase将核心的300万行代码进行开源,随着开源生态的不断成熟,已经有500家客户将OceanBase的社区版本应用于实际的业务生产系统;2022年OB Cloud上线以来,公有云客户数量已经增长150%。
但各行各业的需求有参差,随着客户的行业跨度增加,OceanBase也面临着迥异的客户需求。
在金融行业,大型机构、小型机构的需求、关注点是不太一样的。大型机构基础设施比较好,在TPS、响应时间等各方面要求会比较高,所以关注点不仅是分布式,还要有完整的单元化分布式整体解决方案和在分布式架构下如何构建高可用的技术风险体系。而中小型金融机构,首先需要数据库的分布式能力,但在使用上根本不希望对此有感知,而是希望像集中式数据库一样使用数据库。
运营商行业对数据库的使用非常深,而且一般系统之间的耦合度比较高,数据的集中度也比较高,一旦涉及数据库替换往往复杂度和风险要比金融机構还要高。这部分客户会更关注数据库的兼容性,以及数据迁移和评估等配套工具完善度和成熟度,以减少迁移时的风险。
某些行业,对宕机后的恢复速度要求不是最高,但对成本非常敏感;某些行业则特别看重秒级回切,可以回档。
“数据库是用出来的。”杨冰不无感叹地说道。三年来,从金融核心到政企和大型国计民生的核心系统,再到运营商和新零售新制造的核心,OceanBase在千行百业的“关键业务”中边磨边干,才得以打拼出一条积极的商业化增长曲线,也为客户创造出了更大的价值。
国际咨询机构Forrester报告显示,企业在采用OceanBase数据库之后,存储空间节约比例超过70%,服务器资源节约比例达到85%,平均每注册用户的数据库成本节约超过50%。
从2010年发展至今,OceanBase从1.0进化至4.0,支撑系统也从边缘应用走向“关键业务负载型的业务”。而从2020年只有18个客户,到2023年客户突破1000家,OceanBase只用了三年。