3月29日,国家发改委正式批复,由中国科学院计算技术研究所承建的“大数据分析系统国家工程实验室”(以下简称“实验室”)在京揭牌。

“大数据分析系统国家工程实验室”究竟咋回事,这回终于说清楚了

大数据分析系统国家工程实验室揭牌仪式

实验室重点立足“分析”和“系统”两个关键词(具体后面会讲),是2016年《国家发展和改革委员会办公厅关于请组织申报大数据领域创新能力建设专项的通知》规划的13个国家级大数据实验室中的一个。

据介绍,实验室由中国科学院计算技术研究所牵头,联合中国科学院大学、中国科学院计算机网络信息中心、曙光信息产业股份有限公司、国创科视科技股份有限公司共同建设。宗旨是产学研结合,使大数据技术更好的落地,推动大数据产业更快的发展。而事实上,这也是《通知》对于国家级大数据实验室的核心要求。

只热闹不够,重要的是落地

从13个国家级大数据实验室的设立,不难看出大数据当前的发展热度。而实际上,像这样的指导性文件和规划近两年还有很多,比如《关于运用大数据加强对市场主体服务和监管的若干意见》、《促进大数据发展行动纲要》、《政务信息资源共享管理暂行办法》、《大数据产业“十三五”发展规划》……

特别需要指出的是2016年10月9日,中央政治局举行集体学习,习近平总书记提出,要实施网络强国战略,建设全国一体化的国家大数据中心,推进技术融合、业务融合、数据融合,实现跨层级、跨地域、跨系统、跨部门、跨业务的协同管理和服务。

国家对大数据产业的重视程度略见一斑。它不再是产业内少数几个企业在做、在推动的事情,已经上升到了国家层面。换句话说,从上至下,全社会已经充分意识到了数据的价值。

这很好,重视是做好一件事的前提。但与此同时,光口头上的重视并不能带来实际的价值。数据如果不经过处理,它只是数据,没有意义。

这正是13个国家级大数据实验室所承担的使命。简而言之,为国家、为产业界趟出一条实践的道路,未来各个实验室在各自细分的领域都是一个样本工程。

理解“分析”和“系统”

这里值得一提的是,相较科研实验室,工程实验室更讲究落地、应用,因此在操作中更讲求产学研的结合。具体到实验室的设置、规划,也能看出这一点。

从共建成员来看,中国科学院计算技术研究所、中国科学院大学、中国科学院计算机网络信息中心、曙光信息产业股份有限公司和国创科视科技股份有限公司,研、学、产各方都有,而且实力很强。

以曙光信息产业股份有限公司(以下简称“曙光”)为例,服务器、存储等硬件处于领先地位,特别是在高性能计算领域;软件方面,曙光自主研制的XData大数据平台能够充分融合各种数据资源并进行全方位多层次的智能分析。更为关键的是,曙光的软硬件方案已经在气象、政府、医疗、广电等多个行业得到了实践,这是实验室最迫切需求的。

从实验室业务建设方向来看,规划了三大平台:大数据分析基础设施平台、软硬一体的大数据开放分析平台、大数据分析示范应用与服务平台,覆盖大数据分析全生命周期的技术与应用环路。

解释一下实验室的两个关键词“分析”和“系统”。

分析主要指横向软件层面的。用户需要的不是Hadoop,也不是Spark,而是解决问题的能力,因而实验室要研制的是新一代的数据分析软件栈,是要把各种数据分析平台都囊括其中,做成一个工具集。

系统狭义的理解纵向软硬件一体的平台。广义的理解如曙光高级副总裁聂华所讲,产学研的搭配、软硬一体的组合、从数据收集分析到应用的全囊括。我理解这是应对大数据时代的一套方法论,让大数据发挥出价值是项系统工程,要系统的对待。

一切以落地、应用为前提。

深入行业,应用是根本

除此之外,总体规划在三大基础平台之上,各共建单位还将分别深入一个细分领域进一步探究大数据的应用。比如曙光就同时挂牌“政府大数据分析系统实验室”,未来将重点开展政府相关行业的大数据智能分析技术与系统的研制。

“大数据分析系统国家工程实验室”究竟咋回事,这回终于说清楚了

二级实验室授牌仪式

为什么会有这样的布局,主要源于两方面的考虑:一是工程实验室本来就致力于实际应用,基础性研究只是手段不是目的,深入行业触及实际应用是必然;二是从共建方的角度考虑,擅长、优势的行业更利于拓展应用。

再以曙光为例,自其2015年提出“数据中国”战略以来,通过“百城百行”的布局,一张中国云数据服务网络已初现端倪。截止当前已经有近40个城市落地、服务近百行业、部署近千应用。

从这个角度看,曙光深入政府行业是一种顺其自然。就“政府大数据分析系统实验室”这个小目标而言,曙光有很好的基础。这意味着曙光发展自身业务与建设“政府大数据分析系统实验室”这件事刚好一致,这个过程不会有资源被浪费,相互促进更利于双方面的共同进步。

如果再放大视角来看,曙光的战略布局与实验室规划的契合度也非常高。实验室所致力的三大平台建设,无论软硬件还是应用,曙光都能提供很好的支撑和促进作用。同时,在这个过程中如聂华所言,将进一步完善曙光自身的大数据理念、架构、技术,推进大数据的理论研究与产业应用,推动业务更好的发展。

因此,我们有理由相信在实验室近期目标“直接可管理的科学与政府大数据开放资源30-50PB”“分布于50-100个城市的大数据分析云基础设施”和“支撑至少两大领域的示范应用”的规划中,曙光能做出自己的贡献。同时,在更长远的“建设大数据产学研用良性生态系统”的目标中,曙光也能发挥自己应有的价值。

大数据时代已经来临,其所能带来的产业价值不可估量。而我国的实际情况却是这样,据统计,中国拥有全球14%的数据量,利用率却不到0.4%,待开发的价值可想而知。这对于实验室而言,既是压力也是动力。希望其能化压力为动力,迎难而上,早日让大数据发挥出应有的价值。 ')}