2018年11月30日,为期两天的数据中心联盟第七批大数据产品评测结果评审会圆满结束。

本期测评,百度4款大数据产品:

  • 时序数据库TSDB
  • 数据仓库Palo(现已更名Doris,Apache孵化中)
  • 数据科学与机器学习平台Jarvis
  • 分布式事务数据库TafDB

全部顺利完成测评,获得权威认证。其中,时序数据库TSDB、分布式事务数据库TafDB均是全国首批参与相关标准测评并通过的产品。

喜讯|百度大数据4款产品通过DCA大数据能力评测-大数网

作为大数据领域重要的行业平台,数据中心联盟(DCA)一直致力于推进大数据产品评测、助力大数据产业融合生态的构建工作。经过4年的发展,“DCA大数据产品评测”,已成为国内外极具权威的评测体系,成为厂商产品研发和用户采购选型的风向标。

 

此次评审大会于2018年11月30日在北京圆满结束。评审委员会既包括来自中国信息通信研究院、清华大学、中国科学院、北京邮电大学、中移信息、国电投、中国银行、北京银行的行业专家,也包括了所有参评产品的企业专家。

 

一、TSDB

时序数据库TSDB

Time Series Database

存储时间序列数据的高性能数据库

 

今年8月,由中国信息通信研究院牵头成立了全国首个时序数据库标准工作组。百度云成为标准工作组认证成员,并为此次标准制定贡献了自己的力量。

 

时序数据库作为全国首个商业化的云端时序数据库产品,百度云时序数据库拥有数据高效读写、时间序列管理、插值查询、聚合计算、实时监控、Web图标可视化等能力,支持了此次标准规定的所有必选功能和可选功能。

 

凭借对存储和管理时间序列数据的专业化数据库基础功能的多年打磨,百度云时间序列数据提供高性能读写和强计算能力的分布式云端数据库服务,不仅获得了广大用户的青睐,也获得了专家评委们的一致好评。

 

喜讯|百度大数据4款产品通过DCA大数据能力评测-大数网

百度云时序数据库产品优势如下:

  • 高性能读写,每秒千万级数据点写入,亿级数据点聚合结果秒级返回。
  • 低成本存储,高效的压缩算法,大大节省存储空间。
  • 计算能力,提供插值、预处理等多种计算方式,支持15种聚合函数。
  • 多生态支持,支持SQL生态、支持Hadoop/Spark等大数据分析平台、对接多种可视化工具、Web图表等方式展示查询结果。
  • 高可靠服务,三副本、分布式部署,保证数据可靠性。
  • 多场景应用,适合物联网设备监控场景和互联网业务监控等多种场景应用。

二、palo

百度数据仓库Palo

Baidu Data Warehouse

全托管PB级别MPP架构数据仓库服务

 

Palo(Apache Doris,孵化中)是一款百度大数据团队自主研发的MPP数据库,其功能和性能已达到或超过国内外同类产品。

喜讯|百度大数据4款产品通过DCA大数据能力评测-大数网

自2017年在GitHub上开源以来,先后被小米、美团、链家、品友互动、瓜子、搜狐等十多家互联网公司使用。同时,Palo(Doris)在百度内部服务超200条业务线,单业务最大容量500TB。

 

在百度云上,Palo(Doris)已从2016年开始为云上客户提供数据仓库服务,也支持企业级私有化部署服务包括四川航空、金风科技等众多客户。2018年7月,Palo(Doris)获得了全球著名开源社区Apache基金会的认可,通过投票成功进入Apache孵化器。之后将通过社区的力量,提供更加稳定、高效、易用的数据仓库服务。

 

三、Jarvis

百度数据科学与机器学习平台Jarvis

Baidu data science and machine learning platform

一站式数据科学和AI开发平台

 

百度数据科学与机器学习平台Jarvis是集数据可视化、分析、建模、模型部署于一身的可视化的数据科学平台和AI开发平台。支持Notebook代码、表单、拖拽等交互模式,提供了大数据分析能力和自动建模能力(AutoML & AutoDL),集成了优秀的机器学习和深度学习算法,内置了丰富的行业解决方案。能够帮助用户高效率、低门槛的完成数据科学工作。

如下为Jarvis产品架构:

 

喜讯|百度大数据4款产品通过DCA大数据能力评测-大数网

四、TafDB

百度分布式事务数据库TafDB

Baidu Distributed Transaction Database

自研分布式事务数据库

 

TafDB是百度面向NewSQL领域打造的一款自研分布式事务数据库产品,具备如下特点:

  • 高可扩展性 − 支持到千台级别
  • 强一致 ,高可用 − 多副本,副本之间raft协议复制
  • 分布式事务 − 提供snapshot isolation的隔离级别
  • 完善SQL查询层 − MPP查询层,支持复杂的分布式JOIN
  • 全局索引 − 依赖分布式事务支持全局二级索引
  • Online schema change − 不停服动态增加、删除字段和索引,修改列名

产品核心架构如下:

喜讯|百度大数据4款产品通过DCA大数据能力评测-大数网

截至当前,本次完成测评的4款大数据产品已经获得众多用户的选择和认可。未来,百度还将不断创新,为用户提供更快、更稳定、功能更丰富的大数据产品。同时,欢迎更多用户试用、选择百度大数据产品。