今天,数据的地位就如同石油、煤炭,是基础性资源、是生产资料、是商品。谁都知道石油、煤炭是好东西,但是要把它们采出来,再加工、流通、利用,并不容易,需要技术、法规等一系列支撑。对于数据而言,同样如此。

这不容易,比处理煤炭、石油更难,随随便便就能提出一大堆问题,尤其是流通环节,比如哪些数据能卖、哪些不能卖、该如何确定、谁来确定,这些数据是谁的、数据版权如何保护,数据质量如何保证……这不是一己之力就能解决的,需要整个产业,包括行业组织、厂商、政府的共同推动。

这是1月11日“中国数据共享公约组织”(以下简称“数据组织”)宣告成立的大背景。与此同时,在当天召开的主题为“破界,数链未来”的2017中国数据流通峰会上,京东万象还发布了包括京东万象EID、数据质量管理、数据图谱、数据集成和区块链应用在内的一系列产品与服务。

数据组织要解决什么样的问题?京东万象一系列产品背后的逻辑?二者之间有什么联系?在回答这些问题之前,先看看当前的数据产业环境,更准确的说是数据流通环节的产业环境。为什么这么说?这是数据组织、是京东万象所要解决的核心问题。

数据流通面临三大难题

数据是基础性资源,但又区别于一般的基础性资源,利用方式不同、交易方式不同,导致面临的问题不同。比如煤最终的价值就是烧了,散发热量,然后化为灰烬。数据呢?清洗、加工、挖掘价值,然后这些数据依旧存在,还能继续利用,还能继续传播,这就要预防非法传播问题。

再比如评价煤炭的质量好坏,发热量是一个很关键的指标,价格也与之息息相关,这是一个非常可观的标准。但是数据质量如何评价,价格机制如何确定,这都是非常主观的,对于你可能认为毫无价值的数据,对于旁人可能是求之不得的东西。

京东万象总经理杜宇甫演讲

类似的问题还有很多,不再一一列举。所有这一切都说明数据的流通与普通商品的流通不一样,需要考虑的问题更多。在京东万象总经理杜宇甫看来,当前数据流通过程中面临的挑战主要集中在三个方面,一是数据安全问题,二是数据价值评估问题,三是供需关系无法匹配的问题。

其中一和二在前文已经有所阐释,数据安全问题的核心是保证数据不非法盗用、非法传播,数据价值的评估需要的是一整套体系。如果没法解决这两个问题,那问题三将一直存在,数据拥有方不愿意共享,数据采买方无数据可买。

这样的结果恐怕不是人们所想要的。怎么解决?还是那句话,有的问题通过技术手段是能解决的,比如针对数据安全问题,京东万象将区块链技术应用其中,配合京东EID产品,能够有效提升数据的安全性。有的问题需要整个产业共同努力,比如数据价值的评估,就需要像数据组织这样的机构群策群力。

一句话总结,因事制宜 各展所长。

技术问题技术解决

以京东万象为例,定位很明确,做技术、服务的提供方,为数据流通保驾护航。分析其此次推出的产品和服务,覆盖数据流通的多个环节,数据拥有方、采买方、平台方都能从中受益。

比如京东万象EID,其结合了公安部的EID技术,能够为数据交易双方提供可识别的认证服务,并将数据授权和流通的各个环节记录到数据流通的区块链上,以证明数据流转的安全性和可信性。与此同时,京东万象与公安部相关部门合作,建立了个人数据授权体系,使得个人数据可以在互联网上合法使用。

京东万象基于区块链技术的交易溯源平台

这里值得一提的是区块链技术的应用。源于比特币,区块链技术迅速受到人们的重视,路径可追溯、去中心相互验证是区块链的特点,用于数据流通环节正好可以解决数据安全的问题。事实上,京东万象也是国内首个将区块链技术用于数据交易环节的平台。

再比如,数据质量管理是基于京东万象多年实践制定出的数据质量标准,包括吞吐量、响应时间、并发能力、容错能力、负载能力,能够给数据使用方提供有效的参考。

数据图谱则能够将数据从数据类别、名称、应用行业、场景等多个维度生成数据流通网络图谱,直观呈现行业与数据的热度关系,帮助数据需求方快速找到行业最需要的数据,相当于企业多了一个首席数据官,指导数据提供方拓展业务方向、有的放矢。

数据集成通过在平台上集成第三方应用接口,可将多个数据服务在平台端完成集成,一次调用,就能使用不同类的的数据,大大降低开发者开发混合应用的复杂度。

从用户需求出发,从数据流通的现实场景出发,这不是纸上谈兵,一切都源于实战。有一组数据参考,截至当前,京东万象平台已经拥有超过300个数据提供商、超过1000个数据源,和超过100个数据标签。换句话说,京东万象的产品和服务在发布之前,就已经得到了实践的检验。

大产业问题共同努力

这是京东万象的努力,但正如前文所述,这还不够。事实上,在更高的产业层面,京东万象也在积极贡献自己的力量。

杜宇甫在接受采访时表示,一方面,依托京东云覆盖大数据全产业链的权益保障和完整服务,京东万象平台作为数据市场的一份子,将努力为数据供需双方提供更好的服务;另一方面,作为数据组织的主要发起者之一,京东云及京东万象平台将为构建以安全交易为核心的大型、开放、绿色、有序的数据生态环境而不断投入,让数据在整个行业轮转起来,让数据对行业产生价值。

中国数据共享公约组织成立仪式

据悉,数据组织由积极投身大数据产业的企业、大学、科研机构等单位组成,除了京东云外,包括CAICT中国信息通信研究院、中国电信、金蝶等十数家企业都是该组织的成员。

看数据组织成员,全面覆盖产学研各个环节,都是业界非常有实力的组织、企业、机构。看未来目标,推动区块链技术的应用、制定统一的数据分类行业目录、建立数据流通评测标准体系、推动个人隐私数据授权和管理体系建设、打击数据侵权……很聚焦,核心是解决数据流通过程中的种种难题。

基于此,我们对未来的数据流通环节更加期待,毕竟每个人都可能是其中的参与者。

总结全文,数据产业所处的阶段还比较初级,每个环节问题都很多,但这并可不可怕,只要共同努力,问题是可以一一攻克的。

从现阶段的情况来看,国家已经给予了充分重视,《促进大数据发展行动纲要》已经出台,未来还可能会有更多政策发布;看产业界,越来越多类似数据组织的机构成立,越来越多的技术厂商加大了在这方面的投入。可能用不了多久,数据的买卖就会像今天买卖普通商品那么简单,届时大数据产业或许才真正称得上繁荣。