作者 | 于泽 (大数网副主编)

4月8日-9日,以“新IT 新经济”为主题的新华三领航者峰会在杭州召开,超过5000人参加峰会,规模之大可以想象。会上,新华三带来了对未来的很多思考,大数据是其中一个重要的议题。

当下,大数据热已是不争的事实,全社会都在进行探讨,上到国家,下到企业、个人。比如,最近有个段子,有人在聚会时说自己买了很多条iPhone数据线,家里每个房间插一条,走到哪儿都能随时充电。在场的人都当成是段子笑笑就过去了,只有一个细心的姑娘悄悄问他买了多少条,他说42条。现在她和他在北京三环内总共42个房间的数套豪宅愉快地生活,下个月就要结婚了。

尽管是个笑话,但这算是当下大数据热的一种最好写实。当前,自上而下,国家在大力推动,产业界各种开源工具、软件层出不穷,一众大数据相关的公司如雨后春笋般冒出,传统IT豪强纷纷布局,全民参与……

新华三集团大数据产品线总裁孙德和接受采访

需要指出的是,大数据仍处于摸索阶段,概念比较多,谁能做到第一?不知道,因为涉及到投入、产品、战略、定位等很多因素。但能明确的是,新华三正在强势出击。为了方便阅读,本文以问答的形式整理了对新华三集团大数据产品线总裁孙德和的采访,看完之后,新华三的大数据布局也就一目了然了。

1、新华三做大数据的边界是什么?

解读:往下到计算、存储、网络、大数据处理软件等等,新华三软硬件都做;往上至轻应用,新华三也做。何为轻应用?数据之间通用型、行业共性的关联分析,不涉及具体业务。再往上,新华三就交给合作伙伴来做。

说到底,新华三要做的是大数据平台,再加上数据服务。不收集数据、不触碰具体应用,做的是中间部分。为什么有这样的布局?因为新华三是做基础架构的,这样做,与新华三的整体业务规划、能力和生态都是契合的。

2、大数据业务怎么做,如何布局?

解读:大数据处于初级发展阶段。数据层面,主要集中在互联网行业,政府手中的大量数据有待开发;技术层面,开源入行门槛的降低使得数据处理、分析平台层出不穷,问题也很多;应用层面,基于数据的应用还有很大想象空间,商业模式不清晰。大数据产业的发展任重道远。

在这样的前提下,不同厂商的优势不同,做法也不同,新华三的平台战略主要是在技术层,大的布局是以行业为主线,基于过去13年在政府、教育、医疗等行业的积累。渗透到具体行业应用,则依赖生态伙伴,与它们结合,比如在细分行业,新华三会选择与排名前三的ISV合作。涉及到数据收集,未来新华三会在客户授权的情况下帮助他们来做,但并不会自行收集数据,这是新华三的承诺。核心就是两条,做好自己的平台,依赖合作伙伴的力量。

3、大数据在整体业务中扮演什么角色?

解读:整体来看新华三的“三大一云”,大数据与大安全、大互联、云计算相互之间并不孤立,而是一种联动状态。也就是说,一项业务的深入拓展会带动相邻业务的增长。大数据是新华三技术战略的四大增长引擎之一,未来想象空间很大。

这一点,从大数据业务的投入情况也能看出,新华三对大数据业务的发展是不计成本的。在去年年底的中国(郑州)产业转移系列对接活动上,新华三集团已经决定将大数据公司落户郑州,未来3年,新华三大数据公司的规模将达到800-1000人。

4、新华三大数据平台做的好不好?

解读:两个层面:首先,新华三是大型IT企业,对标的是华为、戴尔这些巨头,其拥有完整的产品线、解决方案,完善的销售体系、生态能力,这是格局。

其次,具体到产品能力,巨头有巨头的方式,它做一件事的方式不是创业公司、小型企业能比的。一个创业公司专注的可能只是Hadoop或者Spark等某一个方向,但新华三要做的是一个平台、工具集,交付用户的是数据处理的能力,让数据处理尽可能简化。事实上,这也是当下用户的思考方式,用什么框架不重要,解决问题就行,而这样的能力只有巨头才可能有。未来的平台之争将是巨头之间的争夺。

在全国信标委大数据标准工作组主持的全国首次大数据系统通用规范测试中,H3CDataEngine以耗时最短的佳绩一举通过了全部71项测试用例,从几十家申请测试的大数据产品中脱颖而出。这或许可以解释什么叫大企业的做事方式——要么不做,要么不是一般企业所能企及的。

5、哪些客户用了新华三的大数据平台?

解读:很多,覆盖政府、公安、教育、医疗、金融、运营商等多个行业,每个行业又有很多标杆客户,比如与301医院、协和医院共同做医疗大数据、科研和临床的研究,与公安部做警务资源的整合等。

这些都是大行业、敏感行业,对数据非常看重,对平台的要求极高,而这也侧面反映了新华三大数据的实力。

6、新华三新发布的数据引擎是什么?

解读:一个大平台,是一个包含了数据存储、处理、开发等工具和模块的平台。其中有几个关键组件,一是Hadoop和MPP,用来存储各种数据;二是数据服务层,把之前的数据采集、加载、孵化过程进行集中化、智能化处理;三是创新应用开发平台,它的作用是能够自行完成一些基础代码的编写,比如一个十万行代码的应用编写,数据创新应用开发平台能够自己写好4-6万行,无形中节约了很多资源;四是数据视觉引擎,能够把数据可视化。

数据引擎就是新华三大数据战略——做平台的最直接体现,而下一步更具体的方向是城市数据引擎,把分散在各个厅局、企业的数据打通、互联,非常值得期待。

对新华三大数据还有什么想了解的,欢迎留言讨论。