综合报道/本刊高级主笔 徐姝静
2021年6月,中国邮政储蓄银行发布一则关于数据库采购的成交公告:美国数据库企业甲骨文(中国)软件系统有限公司中标,采购金额为1.45亿元。
对于这次采购,邮储银行给出了这样的理由:多个核心生产系统使用Oracle数据库进行数据存储和处理,无法替换,需向甲骨文采购,保证系统的正常运行和稳定。从中,多少可以感受到银行方在数据库应用领域不能完全自主选择的些许悲愤。这件事也带火了一个词——数据库。
那么,数据库究竟是什么?
在这个离开手机和笔记本电脑就会被潮流抛弃的数字经济时代,大众是否都困惑过这样一个问题:数字经济大厦建立在怎样的地基之上?
是工业互联网、大数据,还是人工智能?
都不是,这些仅是数字经济的支柱,而不是地基。支柱之下,是一个极为庞大和复杂的地基体系——基础软件。
所谓基础软件,就是数据库、操作系统等的统称。其中,数据库是储存和管理数据的软件产品,所涉及的技术可谓极其复杂。相较于芯片,国产基础软件更加孱弱,甚至弱到似乎没有什么人注意到它。有专业人士曾经为此表现过无奈:“芯片是短板,而基础软件几乎是断板。”
除了邮储银行,中国联通也曾为数据库付出过高昂的代价。早在2008年,中国联通就收到过甲骨文6000万元的“罚款”通知。
当时,甲骨文是中国联通的数据库供应商,后者的计费、结算、缴费等核心业务都搭载在甲骨文数据库上。按照甲骨文的售卖方式,除了购买软件时按服务器数量支付一次性费用,每年还需要缴纳大概22%的技术服务费,一旦采购新版本的软件,还得额外付费。
中国联通认为这笔费用并不合理,所以一直没有缴纳。后来,中国联通需要采购甲骨文的新产品时,对方提出必须先结清欠下的服务费,这也就是所谓“罚款”的来源。最终,中国联通不得不缴纳了罚款。
从中不难看出,“没得选”是甲骨文在中国市场大赚特赚的重要因素。
如果把数据库比作“大脑”,全世界最好的“大脑”便是甲骨文。早在1980年,甲骨文就开始为美国军方供应数据库产品,并很快实现商业化。后来,甲骨文成了第一个进入中国市场的大型软件公司,又恰好赶上金融、电信等领域国企信息化的浪潮,顺势将大量市场份额攥在手中。
根据IDC的调研,2008年,甲骨文在中国的市场份额达到了顶峰,接近50%。
由于金融、电信、邮政这类业务对系统稳定的极高要求,同时,在一些关键服务上,中国数据库产品拿不到开放端口,导致国产和进口的数据库不能实现互通,这也形成了事实上的进口数据库垄断。对此,很多企业在很长一段时间里都充满了无力感。
对于数据库的研究和建设域,我国经历了漫长且艰辛地探索和攻坚。
业界对于数据库理论正式传入国内有一个共识:1978年,中国人民大学经济信息管理系首任系主任萨师煊第一次将“数据库”三个字写在了黑板上。
我国最早的数据库学术论文,就是萨师煊发表在1979年的《电子计算机参考资料》上的数据库课程口述稿。在1982年,他又起草了国内第一个计算机专业本科“数据库系统概论”课程教学大纲。
1986年3月,以基础科研项目攻坚为核心的“863计划”出炉,由高校和科研机构牵头围绕“数据库重大专项”展开技术突围。如今,国内主要的数据库公司几乎都有当年“先吃螃蟹”那些人的影子。
2000年,我国在数据库技术上虽然取得了重大进展,企业也有信息化的客观需求,但是由于需求方所处的大多是对产品稳定性要求极高的关键行业,就算有意进行国产化替代,也因不同数据库使用的语言和代码不同所带来的潜在风险望而却步。这样的境况下,国产数据库走过了研发阶段,却停留在了产业化的前夕,迟迟无法迈出下一步。
国家数据局的成立标志着“数字中国”建设进入快车道,也意味着以数据库技术为核心的数据安全领域有望迎来“大提速”。
甲骨文在中国市场的如日中天,其实就是彼时中国软件产业在底层技术上积累薄弱的一个真实写照。
2000年前后,中国互联网商业热潮兴起,腾讯、阿里巴巴、百度等今日的互联网巨头和一大批互联网企业先后创立并迅速发展。
此后,随着用户的快速增加,企业对数据库的需求变得越来越大。如果继续用甲骨文的产品,互联网企业每年要支付数亿元的巨额账单,且还无法满足一些定制化需求。
2009年,阿里巴巴喊出了去IOE的口号,决定用开源数据库MysQL和服务器来替换相关产品。那一年,阿里巴巴的公司战略多了这么一句话:“2010年后,再也不购买小型机。”
阿里巴巴自研数据库产品有一个天然优势:自身体系业务非常丰富,可以让自己的业务试水,参与产品验证过程,这也就克服了自研产品难以参与市场验证、难以自我造血的问题。
阀门出厂前的开关时间均能达到小于10 s的要求,是厂家在受限条件下得到的数据。若在现场模拟厂家的受限条件,令L1=5 m,L2=10 m,Z=2 m,按2.1节的计算方法,阀门开关时间为9.6 s。因此,在与厂家签技术协议时,务必要求厂家按阀门的实际布置以及环境温度的变化调整相关参数,并出具阀门开关时间计算书,以确保出厂的产品能在一个很宽的范围内满足开关时间的要求。
2010年,阿里巴巴开始建设OceanBase数据库,从淘宝的收藏夹业务开始,一点一点替换掉了甲骨文和MySQL。
到2013年5月17日,支付宝完全下线了IBM小型机和EMC存储设备。当年7月,随着淘宝广告业务不再使用甲骨文数据库,甲骨文彻底丢掉了亚洲市场最大的数据库客户。
腾讯的数据库研发几乎有着一样的路径。起因是甲骨文的更新周期无法满足公司以天为单位的迭代需求,以及业务体量剧增产生的巨额费用。2007年,腾讯开始在内部孵化自己的分布式数据库,即后来的TDSQL。到2014年,TDSQL已经为腾讯90%的计费业务提供支持。
此后,达梦、人大金仓、神通、南大等一批数据库公司快速发展,数据库产品代替甲骨文开始应用于关键行业、战略性领域。国内互联网公司也开始用上了国产数据库。
数据库在中国的研究和科普肇始于1978年。这一年,中国人民大学经济信息管理系首任系主任萨师煊第一次将“数据库”三个字写在了黑板上。
数字时代构筑于海量数据之上。在中国,14亿人口的体量决定了对数据库更高的要求:中国仅微信用户就超过10亿,铁路12306系统春节前后日浏览量超1500亿次,淘宝在2018年的“双11”实时计算处理峰值达到17.18亿条/秒……
打车、餐饮、购物等各类生活场景;各类组织的人员管理信息、财务管理系统;国家机关的各类公文数据;商业银行的存款贷款数据……庞杂的数据记录着人们工作生活的方方面面,一切都在数据中奔跑。然而,作为最重要的战略型生产资料,数据的安全性面临着严峻考验。
美股棱镜门事件的影响至今余波犹在。从2007年起,美国政府启动了一项绝密电子监听计划,旨在从美国网际网络公司的中心服务器中挖掘和收集数据,多家科技巨头也参与其中。
根据当时媒体的披露,美国国家安全局通过该计划,可以获取电子邮件、视频和语音交谈、照片和档案等内容。斯诺登曾说:“主要攻击网络中枢,像大型互联网路由器等。不用入侵每一台电脑就可以接触数以十万计电脑的通信数据。”
这一事件不得不让每一个国家重新审视网络安全这一议题。而作为承载服务器、路由器、电脑系统安全性的核心之一,数据库如果出现重大漏洞或者存在某些允许黑客侵入的后门,建立在基础软件地基之上的数字经济就会“宕机”。
2018年后,技术短板引发的困境逐步显现,持续的外部压力促使数据库走上了国产化替代之路。
2023年初,国务院进行机构改革,正式成立了国家数据局。
国家数据局主要负责协调推进数据基础制度建设,统筹数据资源整合共享和开发利用,统筹推进数字中国、数字经济、数字社会规划和建设等。
2023年2月,中共中央、国务院印发的《数字中国建设整体布局规划》指出,要畅通数据资源大循环。在推动公共数据汇聚利用,建设公共卫生、科技、教育等重要领域国家数据资源库的同时,还要释放商业数据价值潜能。与此同时,要增强数据安全保障能力,建立数据分类分级保护基础制度。
这意味着,国家层面对数据存储与计算的基础软件——数据库提出了严苛的要求:既要高性能,又要稳定及安全可靠。这也标志着中国数据库发展迈出了“关键一步”。
细看数据库的发展历程,这“关键一步”的跨越得益于“上云”的机遇。一方面,由于云计算的普及,大幅降低了企业IT的一次性投入,拓宽了整个底层软件的市场空间,为中国企业创造了弯道超车的路径。恰如中国直接跳过信用卡阶段跨入移动支付时代。
另一方面,互联网公司基于本身规模的增长和业务的多元化,可以让自研技术在现实场景中反复摔打,解决了长期困扰国内数据库公司“无法参与市场验证”的问题。
今年3月底,数据库领域权威测评机构国际事务处理性能委员会宣布:中国数据库TDSQL以每分钟8.14亿笔订单的处理能力,成为新的世界第一。
数据库的功能特性极其明确,衡量标准几乎只有速度,决定客户采购与否的也就只有性能和成本,此次登顶几乎完全证明了TDSQL的强悍实力。
从无到有、从弱到强,是一个产业建立影响力与话语权的必经之路,数据库如此,芯片如此,科技产业亦是如此。
从1997年1月甲骨文CEO 拉里·埃里森乘专机到访我国时的“强硬”,到如今,特斯拉CEO埃隆·马斯克面对中国市场时,极力表现出的热爱。
从中我们便能认清一个现实,“坚持自主创新”这六个字,是“数据库该如何发展”的唯一正确答案。