阿里云要引领数据库市场?这话没毛病

云时代来了,很多观念都变了。

曾经部署一套业务系统先是买几台物理服务器、几台存储设备,现在是直接采购多少TFLOPS的计算能力、几TB的存储空间;过去用户都是购买数据库软件部署在本地,如今直接采用云端的数据库产品。至于其中的方案是如何构建的,用户并不关心,只要满足需求即可。换句话说,如今用户更关心的是业务,至于如何到达彼岸,是乘船还是坐车并不重要。

有了这个前提,再去审视为什么AWS、阿里云两家云计算公司今天能大谈特谈数据库技术,就不足为奇了。新时代下,曾经被少数寡头垄断的技术、产品不再是少数企业、少数人的专利,只要能力到位,谁都可以涉足。所以,现今我们再去评价一个数据库产品的好坏,不该再以老眼光先去看它是谁开发的,而是应该看看它的性能如何、稳定性怎么样……以数据库本身的特性去评判。

POLARDB,阿里云的自我挑战

9月21日,2017杭州云栖大会前夕,阿里云正式发布了其历经三年时间自研的新一代商用关系型云数据库POLARDB。就如前文所讲,我们看看POLARDB这款产品怎么样。

先看稳定性,或者说可靠性,没有这个保障,谈其它没有意义。阿里云在发布会上宣布旗下云数据库产品将领先行业全部采用第三代可靠性方案。请注意,这不是针对POLARDB,而是所有其所有云数据库产品,可见阿里云的重视程度。

有什么不同?第一代是单机房异步复制,第二代是双机房半同步复制,第三代是三机房强制同步复制。第一代、第二代方案一旦发生故障,很有可能发生数据丢失的情况,而第三代除非三机房同时发生故障才可能出现这样的问题。这样的概率小之又小。

有了这个基础,再看POLARDB的亮点。用一组数据来呈现会更直观,100%、64核/512GB、100TB、6倍、100万、13万、2分钟……它们分别代表什么?

  • 100%是指兼容性。开源数据库市场,MySQL占有率第一是毋庸置疑,而将其从传统环境迁移至云端,兼容性是用户第一位考虑的,而且必须是完全兼容,否则会丢失很多功能,阿里云现在能做到的是100%兼容MySQL 5.6版本,很快会支持5.7和5.8版本。
  • 64核/512GB是POLARDB单实例的扩展边界。POLARDB最高规格是64核、512GB,基本可以说是现阶段云服务商可提供的最高规格,大部分用户的业务天花板都触及不到这一高点。
  • 100TB是POLARDB单实例支持的最大存储容量。MySQL是在单机上诞生的,容量扩展一直是难题,尽管之前10TB已经是大部分用户的业务峰值,而POLARDB这次直接升级到了100TB,大一个数量级。

光是单实例的配置规格就直接秒杀同类产品,更别提阿里云针对数据库引擎做的大量优化、底层最新硬件技术的大量引入,以及第三代分布式共享存储系统的应用等。加上这些,给POLARDB带来的直接变化是,相较上一代产品的性能提升6倍,读性能达到100万QPS,写性能达到13万TPS,创建只读副本和容灾实例的时间均为2分钟。

没有对比就没有伤害,AWS Aurora(POLARDB发布前业界公认的最好的云数据库)的读性能峰值是50万QPS,写峰值性能7.5万TPS,曾经创建只读副本的时间以天为单位。

可能有人会有这样的疑问,既然用户业务都很难达到那个高点,为什么阿里云还要把POLARDB的扩展边界做到那么大?按照阿里云数据库总负责人余峰的话说,今天阿里云做的是下一代数据库,出发点就是希望未来几年用户都触及不到这个天花板,留下时间让他们继续创新。换个角度理解这句话,POLARDB是阿里云推出的面向未来几年的产品,要保证的是持续的领先性,直到下一代产品问世。不拿出点真本事,何谈引领一个时代。

阿里云数据库总负责人余峰

其实关于POLARDB,还有很多爆点,比如同时兼顾OLAP和OLTP应用,这意味着采用一套数据库就可以满足所有的业务需求。这里不再列举更多,有兴趣可以自己去了解。

至此,相信对POLARDB已经有一个较为全面的认识,阿里云并不是对标着业界领导者做产品,而是在不断超越自己,把产品做到极致。在采访中,阿里云数据库产品负责人张云杨讲到了阿里云数据库的愿景,那就是以开源数据库的价格提供商业数据库的性能、可靠性、功能性。这样的愿景正在快速实现。

从开别人造的车到自己造车开背后的逻辑

为什么阿里云能把数据库做到这种层次?从根源上讲,阿里云做数据库是为了满足自身的业务需求。如余峰所讲,尽管业界有很多专业的数据库厂商,它们的产品也很好,但是并不足以满足像阿里巴巴这样快速发展的互联网公司。互联网公司产品迭代快,这要求底层的支撑平台能及时支撑上层的业务,数据库厂商能随时随地满足这种需求吗?显然不现实。

一旦确定了方向,就是锲而不舍的投入,这是阿里云成功的第一个要素。2011年,阿里云组建自己的数据库团队,开始研发数据库产品。2012年,第一个RDS产品接入阿里巴巴“双11”活动,到了2014年,所有“双11”电商流量全部会经过RDS。截至当前,阿里云已经有超过10万个数据库实例在运行,这一数字还在不断增加。阿里云的数据库团队也从最初的几个人成长为现在的200多人。

从开别人造的车到自己造车开,再到把车卖给别人,阿里云从零开始到今天成为领先的云数据库服务商,今天看这个故事很励志,但其中的艰难恐怕只有阿里云数据库团队的人知道。余峰表示,研发POLARDB的过程中,失败过很多次,好在现在成功了,要不然真不知道怎么交代。

其二、阿里云懂得数据库的玩法。大处要看时代背景,比如云时代需要什么样的产品,小处着眼微创新,用户更关注什么。余峰在接受采访时表示,他们更更看重微创新,因为大的时代变革谁都看得见,小处则不一定有人愿意深入。

凭借着这股精神,阿里云数据库产品近五年来每年都有一两次大的迭代,小的功能优化更是不计其数,每年超过千项。客观地讲,形容刚刚发布的POLARDB,已经不能说是优化、调优,称其重写也不为过。依靠不断的迭代,让最新的技术能尽早发挥出效力,阿里云数据库如今实现了对AWS的超越,成为了数据库领域的一个标志。

其三、持续释放硬件红利,而这实际上体现的也是阿里云对数据库演进趋势的洞察。该如何理解?两个层面,一、硬件进步快,大家都看得见,几乎每两年就会有一个大的变化,这些最新的技术都被及时应用在云中了吗?答案是很多都没有,很多云服务商使用的都是上一代、甚至上上一代产品;二是软件不可能脱离硬件独立存在,这些最新的硬件特性真的体现在软件架构中了吗?答案一样是否定的,或者更准确地说没有及时体现在软件中。

业界知名的数据库厂商版本迭代周期是三年、四年,甚至更长。这直接导致的问题是,软硬件之间的脱节,软件无法享受最新硬件带来的性能提升。阿里云的迭代周期是多少?每年一两个大的版本更新,每年超过一千项的功能优化。这样的迭代周期能充分享受到硬件提升的红利。当然弊端也有,那就是保持高频率的优化、更新,这也是为什么商业数据库不愿频繁更新的重要原因,躺着挣钱的日子过习惯了。

看看如今POLARDB底层的硬件,都是最新的技术,英特尔Skylake CPU,主频3.0GHz、NVMe SSD,单盘32Gb/s的吞吐能力,50Gbps的RDMA网卡。阿里云承诺会保持对新技术的敏感性,或许光这一点就能超越很多云计算厂商。

以上所讲这些,恐怕很多人都不知道,成功不是偶然的,背后一定是巨大的付出。

总结全文,POLARDB很有可能改变数据库市场的发展路径,倒逼传统数据库巨头更快地向云时代迈进。对用户来说这不失为一件好事,毕竟选择会增多。而在这个过程中,阿里云无疑已经取得了先发优势。据余峰透露,阿里云已经开始着手下一代数据库技术的研发,这正是领先,同时又敏锐的可怕之处,让它人追无可追。

文章点评:

昵称*

邮箱*

网址