今年年初,“东数西算”工程正式启动。

业内普遍认为,这一工程的战略价值媲美西气东输和南水北调,是推动数字经济建设的重要落地抓手,也将推动数字经济成为拉动经济新增长的重要引擎。

究其本质,“东数西算”是一场“数据”与“算力”的调配,通过将算力资源跨区域调动,提升国家整体算力水平,提高算力使用效率,实现全国算力规模化、集约化发展。

算力要提升,离不开强大的存储能力支撑。当前,重点行业的结构化、非结构化数据的激增已经是常态,如果不能够很好的处理各类数据,存储就会“存不好”,直接影响“算不快”,成为“东数西算”的掣肘。

如何让存储变得“又快又好”,答案是分布式存储。

近日,首届分布式存储产业发展论坛举办,业内看到了分布式存储的价值和落地的可能性,将进一步促进行业新发展。

何为超算?

“超算”,字面理解就是“超级计算机”,每秒运算能力可达十亿亿次、百亿亿次,在各种科学计算、大型工程中,超算是必备能力。

比如,现在的天气预报是按小时报的,精准度更高。这背后就是超级计算的功劳,算力的发展已经把天气预报准确率从过去的21.8%提高到了现在的90%。

生物医药领域同样得益于算力的发展,基因测序的时长从24小时缩短至7分钟,新药研发鉴定的周期从5000天缩短到100天,由此拯救了很多生命,免去了很多病人的痛苦。

类似的场景还有很多,比如石油勘探、工程仿真、动漫渲染、海洋环境工程等,它们的背后都有超级计算的身影。

过去超级计算主要用于科学研究,但随着数据量的剧增,如今的超级计算有了更广阔的用武之地,比如宝马与英伟达合作,把整个生产流程在数字世界中重建,通过仿真模拟进行优化,把生产效率提高了30%;再比如自动驾驶、基因测序、灾害模拟等。

从计算密集型到数据密集型

过去和现在最大的不同在于处理的数据种类和数据量,过去的超算被称为计算密集型超算,现在的很多超算被称为数据密集型超算。

根据全球高性能计算市场研究机构Hyperion Research预测,未来数据密集型超算市场份额会数倍于传统超算的增长速率。到2024年,高性能计算市场更是将有超过40%来自数据密集型超算。

俨然,在数据爆发式增长的今天,超算从计算密集型到数据密集型演变是必然趋势。这也意味着超算需要从多方面进行改变,比如,需要重新构建底层架构,原来的架构只关注算,数据密集型超算要求必须关注数据存储和管理……

也就是说,随着大数据分析、AI人工智能等新的数据分析工具相结合,整个高性能计算HPC的诉求从传统的数值计算为主,不断地走向以大数据、AI训练推理相结合的HPDA高性能数据分析时代。

多样化的分析应用带来了多样化的性能和多样化的数据访问协议的全新的挑战。

济南超算面临新挑战

事实上,超算转向以及架构的设计在济南超算身上也有体现。

济南超算是山东省“超级计算大科学工程”,借助根植山东、覆盖全国、辐射全球的超算互联网建设,致力构建“E级超算、人工智能、大数据、工业互联网”等大科学装置集群。

自建立以来,济南超算先后部署了天气预报、空气质量预报、海洋数值模拟、智慧海洋工程、石油勘探、医养健康等多个应用。

从应用部署来看,济南超算也是在传统科学的基础上,不断承接新的数据密集型超算应用。

国家超算济南中心研究员郭猛表示,随着超算应用的不断转向,近些年无论是架构还是上层的技术都面临着巨大的挑战,济南超算也在不断的调整。

以存储为例,旧有架构的问题是:

01、应用融合调度挑战大,“用不好,调不动”。仿真建模、仿真数据、大数据等丰富应用之间“各自为政”,严重缺乏高效融合的新架构,导致不同资源无法灵活调动,协作难度大。

02、海量数据存储分析难,“存不下,算不快”。随着科学研究的深入,超算中心数据量从PB级增加到了EB级,而且数据类型更加多样,非结构化数据占比大,在实际中,只有不到2%的数据得到了保护,不到10%的数据被应用,存算比很低。

03、数据管理流动难度大,“数据进来容易,出去难”。海量数据采集之后,被导入到了不同的应用资源池中,数据互通难。

流不动、存不下、算不快、用不好,这一系列问题严重拖累业务。

 

排行榜第一

在对比了市面上的众多解决方案后,济南超算选择了华为分布式存储来打造数据底座。

有了分布式存储的支撑,济南超算的性能提升是显著的,在ISC 2022高性能计算大会上发布的第十期IO500榜单中,济南超算山河平台实现了并行系统270多字节/秒的带宽,位居排行榜第一名。

值得一提的是,济南超算还建成了首个国家级生态环境监测大数据超算云中心,以及全国首家遥感大数据中心,能够为国内首个多尺度、高分辨率全球遥感数据集提供PB级数据存储能力和千万亿次计算能力。

另外,在人类探索地外文明方面,济南超算也正在释放更大能力,比如为探究双星系统的演化规律以及检验相对论效应提供存储支撑。

用郭猛的话说:“放在过去,这是不能想象的。”

据悉,未来基于分布式存储,济南超算将打造超算互联数据一张图,这其中包括两方面,一是算力的有效聚合,另一个重点则是将存储系统实现更高级别的打通和融合。

 

分布式存储有未来

当前,各存储厂商正积极探索分布式存储更多的可能性。

一方面,分布式存储已经是一种业界共识,另一方面,每家方案各有侧重,缺乏一些基础标准。

而这也是首届分布式存储产业发展论坛召开的根本出发点。日前,信通院联合华为、新华三、联想凌拓、宝德等业界公司召开分布式存储产业发展论坛,目标很清晰,广交流、谋共识、促发展。分布式存储在谋求某种程度的统一。

分布式存储毫无疑问是个大市场,调查数据显示,2021年中国分布式存储市场规模达到178亿元,年增长率达到44%,高于中国企业级外置存储的25%增长速度。预计未来3年中国分布式存储市场规模仍将保持40%以上的年增长。

面对大蛋糕,鱼龙混杂,分布式存储的发展也面临着诸多挑战。

比如在架构上,中短期可以明显看到分布式存储正在向面向混合负载、多协议互通、应用存算分离的架构方向发展。长期来看,分布式存储也在进行存储层自身的存算分离、以及面向全闪存化的架构重构。

所以,答案很简单,市场很大,但靠一己之力很难推动市场良性发展,进而满足各行各业用户的需求,于是有了这次的联合。

 

华为存储的新解法

在此次论坛上,包括华为在内多个厂商对此表示认同,并给出了自己的见解和各自的创新方向,比如华为分布式存储领域副总裁韩振兴提到,眼下所有业务最典型的特征就是混合性,业务是混合的,技术是混合的,协议是混合的,混合的本质是不确定性,所以解决不确定性成了华为分布式存储创新的核心。

为此,接下来华为分布式存储将在三个维度重点发力:

一是存储软件的重构

以此来保障面向混合负载的高性能、多协议和高安全;

二是硬件重构

从通用走向专属;

三是解决方案的重构

优化计算与存储的连接、多地多存储的连接、存储与云的连接,实现全局数据有效治理。

华为分布式存储发力的方向其实很明确,两个关键词:性能和可管理性。这一点也得到了其他与会者的认同。华为与分布式存储产业方阵其他成员在某种共识之上,更好的推动整个行业的进步。

总结全文,数据量暴增带来的挑战,需要以一种颠覆性的方式来解决,高性能计算只是其中一个典型场景,其它还包括很多,分布式存储就是当前的最佳解决方案。

未来,乘着“东数西算”的东风,以华为为代表的分布式存储厂商将深入探索、创新,分布式存储的价值还会得到更大释放,届时,千行百业的数据才能真正的“存得好”、“算得快”,共同推进“东数西算”工程,让数字经济成为新引擎。