分布式数据库有多重要?

据IDC调研,目前约26.8%的企业级市场用户部署了分布式数据库,超过90%的企业认可分布式数据库部署后的效果。

Gartner发布的白皮书《原生分布式数据库引领数据管理技术发展趋势》中指出,原生分布式数据库以其诸多特性,正引领数据库管理技术发展趋势。以OceanBase为代表的国产原生分布式数据库已经深入各行各业,成为企业核心系统升级的首选。

以当前的趋势观察,各大数据库厂商均将“分布式数据库”当做未来的重点方向,纷纷展开自研并发布了重要的产品。但是,分布式数据库至少有3条不同的技术路线,涉及到软硬件协同、多租户、数据迁移、安全合规等问题,还需要解决金融、消费等新兴业务场景的问题。

哪类厂商能在这一条路上走的更快更稳?

01

分布式数据库的三条路线

都知道分布式数据库重要,但做好并不容易。

分布式数据库所具有的跨区域提供一致且可信的数据、改善业务连续性等特性,是集中式数据库所不具备的,也是当前业内的一致看法。

但业内厂商对 “分布式”的理解不同。国家工业信息安全发展研究中心和中国电子学会、北京国家金融科技认证中心发布的《分布式数据库发展趋势研究报告》(下简称报告)中,披露了业内主流的三种路线。

第一种路线是,分布式中间件+单机数据库。这条路线是在单机数据库系统上进行改造,主要解决了扩展性的问题。优势是,兼容性好,学习成本低;劣势是业务建模需要重新规划,业务代码也要相应修改,改造成本高。

第二类技术路线是通过构建分布式共享存储实现扩展,采用非对称计算节点,大部分公有云数据库走的这条路线。优势是兼容性好,应用不需要改造。劣势是,扩展性有限,对底座有比较重的依赖。

第三条技术路线是原生分布式数据库,各计算节点提供对等的读写服务,该路线根据分布式一致性协议做底层设计,与传统数据库有着本质的区别,也被业内众多专业人士称为“真正意义上的分布式数据库”。优势是,系统无需改造、可对应用无感弹性伸缩、更强的数据一致性保障与高可用保障。劣势是目前业界类似这样的成熟产品较少(仅有以OceanBase为代表的少数几家),且上下游生态有待完善。

相比较而言,第三条技术路线的优势更为明显,挑战更大,更需要厂商具备技术能力、以及大规模部署、运维和真实场景验证的能力,还有基于技术的号召能力,这样才能立足生态,让用户不但用起来,而且用得好。

国内也有几家原生分布式数据库公司,基于不同的开源产品研发。纯粹自研的只有OceanBase一家,支持HTAP混合负载,具备高可用、高扩展、部署灵活等特点,重要的是能够实现对应用透明的水平扩展。

02

新场景需要分布式

不管哪种路线,分布式数据库都需要解决在新技术、新场景下挑战。

新场景带来的新技术问题是,如何解决高频数据的查询和交易问题,不仅仅涉及存储空间、效率和成本,还涉及到业务本身,最典型的如金融和电信核心业务的应用场景。

比如,在新场景、高频数据查询和交易下,如何解决分布式事务的一致性保证问题?传统的单机版数据库很容易实现,分布式则需要拆分事务,再部署到不同的服务器上处理。但分库分表在意外情况下出现问题。再比如,架构尤其是对中间件的压力过大,并发和低延时还有提升的空间;数据分片的智能化,如何确保高效、高质量的分片,还需要探索等等。

具体到金融行业。数据量急剧增长,对数据存储和管理提出了更高要求,同时面临高并发业务和大用户量带来的系统压力,这就要求移动应用响应速度更快;而电信在5G趋势之下,需要处理的数据业务呈指数级增长,像电信公司的核心计费业务系统,日处理各类详单数据百亿条,数据处理性能和准确性至关重要。

而原生分布式架构则为分布式数据库提供了新的思路,这是一个全新的设计,具备集群的扩展和收缩对应用透明,并可以按需扩展,没有数量和规模限制;这种架构能够在普通服务器上实现无限水平扩展,帮助客户省去了定制改造的步骤,减少大量人工成本。

以OceanBase为例,正在朝着一体化方向发展,能力将向混合负载发展、场景将向云化发展等,与报告中对未来分布式数据库的趋势判断相吻合。同时,报告认为,未来分布式数据库的趋势还在高可用能力、对数据一致性、生态建设、异构芯片等方面持续创新。

03

OceanBase新版本有啥新突破?

OceanBase采用自研的好处是,能够掌握核心技术能力,每个新版本都在小步快跑。

脱胎于蚂蚁集团,支撑支付宝核心交易系统,并且连续9 年稳定支撑阿里双 11;自研一体化架构,一套引擎同时支持OLTP和OLAP的混合负载,在多项TPC-C和TPC-H测试中刷新了世界纪录,这就是OceanBase在数据库领域的过人之处。

在最新发布的4.0版本中,OceanBase再次获得技术突破,那就是成为业内首个单机分布式一体化架构数据库,可在全球最小的电脑树莓派中运行。这意味着,在单机部署下实现分布式部署的完整功能,从技术上首次突破了分布式数据库的单机性能瓶颈。

无论企业规模大小,无论采用单机部署还是水平扩展部署,一套数据库系统均能满足。而且在单机一体化架构中,性能远超同类产品,可以满足金融、电信等行业对核心系统的要求。这也代表着OceanBase可以伴随着企业不断成长,大大减少了企业的压力,让企业具备技术上的连续性。

这就是OceanBase“小就是大”的核心:更小的数据库产品,满足更多的应用场景,减少更复杂运营成本,打通单机和分布式之间的隔阂,让企业用户使用和运营“更简单”。

此次发布的新版本,能够把故障恢复时间(RTO),从30秒降低到8秒以内,这是中国数据库的第一次,也是全球数据库的第一次。

OceanBase继续朝着开放的道路上前进,本次宣布全球开服OceanBase Cloud,支持阿里云以外更多的云厂商,助力企业出海等。

在开源方面,OceanBase将发布后续社区版,MySQL兼容能力全部开源,社区版将享受企业版同等性能。OceanBase 4.0 社区版将实现小型化,未来最小将支持4核8G小规格,让更多开发者更低门槛应用。

单纯对比功能,OceanBase正在将分布式数据库的的性能提到另一个层次。

04

如何评论OceanBase新版本?

OceanBase作为中国完全自研的分布式数据库,自独立运营以来,备受业内关注。核心在于,它的方向某种程度代表了技术趋势,间接反映了客户的需求,尤其是金融、电信等数据量大、隐私安全等级高的行业。

如何评论此次4.0新版本的发布呢?

1. 创新无止境。本次技术层面无论是支持单机分布式一体化架构还是开服OceanBase Cloud,无论是 RTO<8s还是单机部署性能超越MySQL,技术的创新永远没有止境,永远在路上。而这一切都来源于“自研”而不是“开源创新”。立足于“自研”,一旦有了基础,就会呈现“后发优势”,牢牢把握主动权,创新的技术点也会越走越远,走出自己的一条道路。

2. 小就是大,以产品力探索商业化之路。不盲目自大,以支持淘宝和支付宝为积淀之后,积极走上服务金融、电信等大型企业之路。同时,注重中小企业的需求。据悉,现在两者的收入比例已经对半开,这意味着,4.0小鱼打破分布式数据库只能用在大型客户/大型场景的局限,OceanBase的产品能力终于从大B(大型客户)走向更广阔的小B(中小企业),通过技术降低用户使用数据库门槛。

3. 开源再升级。MySQL兼容全面开放,社区版企业版同等性能,这是今年OceanBase开源最重磅的信息,也透传出OceanBase在开源的路线上笃定的方向。开源能“公开透明”,来自技术自信,共筑生态圈。开放能促进开源,生态繁荣。受益的不仅仅是OceanBase,还有广大的用户以及数据库产业。

4. 创新的一小步,分布式数据库的一大步。这次发布会现场,我们看到国产数据库已经从开始时的非核心/创新业务的探索尝试,走到核心系统全栈替换,这是国产数据库的重要里程碑。希望国产数据库的每一小步,都能成为数据库行业的重要一步。