那么,国产数据库究竟经历了怎样的发展才能取得如今的成就?未来又将面对怎样的挑战?
数据库行业百花齐放
目前我们提到的数据库,一般是指在计算机中有组织的进行数据存储和获取的系统。而提起数据库系统,还要追溯到20世纪60年代。
当时的计算机已经广泛应用于数据管理,但随着人们需求的日益增长,人们渴望拥有一套能够集管理与数据共享为一体的数据库管理系统,于是dbms应运而生。1970年-1972年,关系型数据库模型出现在大众视野中。这种模型建立在更加严格的数学基础之上,抽象级别较高,便于理解和使用,自此,关系型数据库系统逐渐成为主流,也出现了一些代表产品,譬如ibm公司的db2,以及oracle的第一款关系型数据库oracle v1。20世纪末,传统的关系型数据库已经能满足大部分数据存储需求,oracle、ibm等商业化数据库也得到了蓬勃的发展。进入2000年,随着互联网业务不断扩大,数据量也随之呈现出了爆发式的增长,结合关系型数据库的sql模型和基于nosql数据库高性能的newsql数据库问世,以此面对不同的业务场景及需求。
但在中国,商业化数据库的发展之路并不是一帆风顺。oracle、ibm、microsoft、sap四家传统厂商的产品曾一度占据商业数据库市场超90%多的市场规模,oracle更是席卷中国,在中国数据库市场可谓是一手遮天。
为了在数据方面实现安全可靠,自上世纪90年代以来,我国就有大大小小的企业开始涉足国产数据库领域。虽然早期我国数据库厂商发展艰辛,但也获得了不小的成果:中国拥有了第一代原型数据库,也崛起了诸如东软openbase、中软cobase和华科dm database等一系列优秀国产数据库产品。进入21世纪,阿里喊出了“去ioe”的口号,选择使用开源的mysql,棱镜门事件的曝光,也让达梦、金仓等一批国产数据库得到了广泛的关注,postgresql、hbase等开源数据库也开始活跃起来,再到如今云计算时代和开源社区的兴起,国产数据库真正进入了蓬勃发展的时代,一时间数据库行业百花齐放。
“1 4 4 n”格局形成
据艾瑞咨询发布的《中国数据库行业研究报告2021年》指出,国内企业对于基础软件付费的意愿和it支出占比在逐年提升,随着市场需求的增加,大批厂商借助国产化的热潮,开始入局国产数据库市场。目前,国产数据库市场“1 4 4 n”的发展格局已经形成。
所谓的“1”,指的是国际巨头——华为。华为目前是全球第一大电信设备商,更是全球5g技术领跑者,技术领域的行业地位毋庸置疑。据华为giv报告显示,全球数据量到2025年将增长至180zb,ai应用率也将达到80%,基于此背景,华为面向全球发布了人工智能原生(ai-native)数据库gaussdb。
在极致性能的加持下,华为gaussdb数据库广泛应用于金融、运营商、政府、能源、医疗、制造、交通等多个行业,并为全球60个国家及地区、1500多个客户提供了优质服务。此外,华为还联合各行业顶尖isv为客户联合开发尊龙凯时注册的解决方案,致力于打造繁荣的生态圈。照此趋势来看,华为在云、人工智能和物联网领域的进步,也代表了整个大数据市场的进一步繁荣,并正在通过产品创新、尊龙凯时注册的解决方案创新以及在数据库领域展现的技术价值与产品价值,为各行各业赋能。
在“4 4”中,第一个“4”指的就是4家上市公司,阿里、腾讯、海量、中兴。
首先说说阿里,阿里如今凭借自主研发的数据库oceanbase,在国际事务处理性能委员会(tpc)的tpc-c基准测试中,以每秒4200万次的数据处理峰值成功登上榜首。这一重大突破一举打破了美国甲骨文公司保持了长达9年的世界纪录,《科技日报》更是评价阿里此次登顶国际权威排行是云时代中国数据库换道超车的标志。
再看腾讯,作为云厂商大军中的一员,也一度凭借增速高达123%的市场份额位列国内数据库厂商之首。腾讯云数据库深耕开源领域已久,凭借齐全的产品线,腾讯无论是从技术创新到产品应用,还是到基础研究深化,都有能力构建完整的技术演进周期。
接下来是海量,这个名字虽然没有前两位那么知名,但是在数据库领域也是一家深耕已久的实力派了,早在5年前就成功主板上市,行事一直比较低调,近年来积极参与信创产业,数据库业务更是多领域遍地开花,最新发布的企业级关系型数据库vastbase g100也是在opengauss内核基础上研发而成的产品,其高度兼容oracle,高性能和高安全的特性赢得了很多金融、制造、政府领域大客户的青睐。
最后一家中兴早在2002年,就已经开始涉足数据库相关技术的研发。中兴推出了具有银行基因的金融级交易型分布式数据库产品——goldendb。在2019bdic大会上,中兴goldendb数据库获得了全部50项测试满分的成绩,一时之间也引起了人们对中国数据库技术的热议。在2021年,中兴通讯goldendb更是以位居中国金融级分布式数据库领导者象限第一的位置,一跃成为国产分布式数据库金融行业第一品牌。
“4 4”中后一个“4”指的是4家老牌厂商,即达梦、人大金仓、南大通用和神舟通用。
达梦算得上国产数据库领域的一名老将,也是国产信息化领域国家队的一员。达梦走的是自主原创的技术路线,根据2016年国内权威机构的检测,达梦系列产品代码自主原创率高达99.9%,在安全性方面也达到了目前国产数据库的最高安全级别。如今,达梦通过加强与产业链上下游伙伴的合作,完成了从芯片、整机、中间件到应用系统的产业链千余款产品的深度优化适配,逐渐构建起了一个独立自主的国产基础软硬件生态。
人大金仓同样也是数据库领域国家队的一员,先后承担了国家“863”、电子发展基金、信息安全专项、国家重点研发计划、“核高基”等重大课题研究。在数据库领域,人大金仓选择了一条低成本的战略路线,主要目标是实现替o,并研发出了具有国际先进水平的大型通用数据库产品。借助政策东风,在2020年,人大金仓在信创市场份额超50%,完成产品兼容认证1000余个,助力传统国产厂商市场份额上升至7.1%。如今,金仓也在不断打磨核心产品kingbasees,结合需求侧技术发展的新趋势,不断扩大国产数据库领域的生态格局。
神舟通用拥有深厚航天软件研制经验,在国内基础软件企业拥有较强影响力。从数据库性能来讲,神州通用数据库对oracle 语法有90%的兼容性,在大型评测机构中取得了相当不错的成绩,某些方面的表现甚至要超过了国外流行的几家数据库。在国家“核高基”专项综合排名及“863计划”产品评测中,神州通用斩获第一的好成绩。
在分析型数据库领域中,南大通用占据重要地位。凭借技术优势,南大通用已经为2000多个大型企业用户提供了优质数据库服务,在线运营数据节点高达30000多个,管理数据超过300pb。值得一提的是,南大通用旗下gbase 8a mpp,是目前国内唯一成熟的国产mpp数据库产品,而新版mpp数据库集群的发布,也标志着南大通用向大数据分析领域的又一次里程碑式迈进。
此外,近年来受国产化影响,“n”家初创厂商、云厂商、ict厂商也开始发力数据库市场。譬如pingcap、偶数科技、巨杉、易鲸捷、柏睿数据等,也在国产数据领域取得了大大小小的成就,并逐渐被更多的人认可。国产阵营日益强大,预计未来五年有10倍以上的成长空间。如今国产数据库领域正呈现百花齐放、活跃创新的局面。
挑战之路仍漫漫
数据库向上要和操作系统适配来保障系统的稳定运行,向下要支撑应用软件的需求,确保软件能够在数据库之上稳定运行,若没有一个安全可靠的数据库支撑,我们的数据资产安全将难以保障。因此,发展国产数据库势在必行。
但机遇与挑战是并存的,我国数据库领域发展虽然一路向好,但与国外还存在一定差距。国产数据库厂商们在奋力追赶的过程中,也面临了不小的挑战。
一是在分布式实践方向,国产数据库厂商们推出了相应的分布式数据库产品,但在解决分布式事务、创新架构、数据分片的智能化和提升企业级能力上,仍需深入探索。
二是在信创背景下,国产数据库借助政策利好进一步发展壮大,但未来还要考虑如何助力传统企业实现数字化转型和业务的创新升级,从而进一步拓展市场。
三是国产数据库选型和应用系统的存在形式越发多样化,未来如何助力企业降低成本,实现“统一管理”成为了新的挑战。并且,国产数据库的发展本就是一个不断在实践中积累经验打磨产品的过程。随着近年来云计算、大数据、人工智能和物联网等场景的提出和落地,人们对于数据库的需求将不断驱动技术的更新迭代。
如何让分布式数据库在事务、性能等环节实现进一步优化?如何进一步优化数据库的性能,打造高可用的国产数据库产品?如何应对数据的频繁迁移、多库长期并存所提出的新诉求?如何迎着信创产业实现市场版图的快速扩张?如何推进包括公有、非公有形式在内的云数据库成为主流?如何让开源成为产业互联网时代国产数据库发展的突破点等等问题,都将是国产数据库厂商们需要解决的问题。
千里之行,始于足下。国产数据库的挑战之路仍漫漫,国产厂商任重而道远。
不可否认,我国数据库发展与国外产品还存在一定的差距,但我们也要看到,当前数据库市场“百花齐放”、数据库产品的成熟度以及认知度日渐提升都离不开国产数据库厂商们的不懈努力。从“1 4 4 n”的格局来看,我国数据库产业已在市场局部开始取得突破,并迎来了数据库国产化演进的发展拐点,并逐步向着数据库核心应用领域渗透。可以想象,随着数据井喷式的发展、国家政策的支持以及企业级市场的强劲需求,未来国产数据库市场发展的后发优势也将更加明显。