很多人都在说,现在已经进入大数据时代,大数据已经在影响着社会以及个体生活的方方面面,正如作者的观点,大数据是不容忽视的。书中提到,“大数据”这个概念,最早是由天文学和基因学等学科创造的,这表明在计算机领域以外,在网络得到发展之前,人们就已经看到数据的重要性,并重视对数据的分析和利用。

在计算机领域,大数据的价值得到突显。计算机的发展、网络的优化,以及在背后起推动作用的存储技术、数据处理技术等技术的进步,无疑形成了大数据茁壮成长的肥沃土壤。在这样的条件下,大数据快速积累。一些公司或机构主动增加数据,比如谷歌的全球定位系统,收集了大量的位置和地理信息;而更多的数据是来源于被动的收集,每一位上网的用户,他们的浏览记录和发布的信息,都将被积累保存到数据库。

越来越庞大的数据量、不断升级的存储技术,和大量的大数据应用实例,都在显示,现在已经是大数据时代。

大数据不仅仅是字面上的意义,指大量,或者说是超大规模的数据。现在更多的是指利用相关的技术,来对这些主动或被动收集来的数据,进行存储、分析和处理,让它们为某项公益的或商业的研究服务。

书中提到了很多利用大数据的例子,“大数据的核心是预测”。利用收集到的大量数据,对其进行分析,可以预测流感爆发的大致时间和地点,可以预测个人的犯罪倾向,可以帮助企业判断客户的状态和需求,以便准确地向他们推荐产品。

这些具体的例子,都在证明大数据给这个社会带来的好处。除了推动技术的进步,它还让很多难以解决的社会问题,变得简单和清晰。对于个人来说,我们也不得不承认,大数据给我们的生活带来了便利。我们可以通过网络查找我们想要的信息,某些新闻客户端会推送我们感兴趣的新闻,大大节省了我们的时间。

但是,没有什么是完美无缺的,大数据优势突出,缺陷也同样明显。为了更好地利用大数据,作者希望我们能改变思维,要更看重“是什么”,而不是为什么,不需要追求精确性,要接受混杂性。这在一定程度上,也是由大数据的局限性决定的,因为数据库避免不了会混进一些错误的数据,这样就得不到精确的结果,而在大数据的现有条件下,想要知道现象背后的原因,也几乎是不可能。

另外,数据可以从很多不可能的地方提取,甚至可以说,世间万物都可以数据化。面对大数据带来的种种好处,有些人会变得过于依赖数据,而数据远没有我们所想的那么可靠。过度地依赖大数据,单纯地为了“数据”而“数据”,而不去考虑其他的因素,可能会得到事与愿违的结果。这是在大数据产生之前就存在的问题,只是数据增多,问题也就随之升级了。因此,只有得到了合理地利用,大数据才会发挥出它强大的能量。

最令人担忧的,应该是大数据对用户隐私的威胁,这在技术上几乎是难以解决的。提到大数据时代的隐私泄露,有人会用奥威尔的《1984》作类比,虽然过于夸张,但这也表明了人们的担心。作为一个普通的网络用户,最直观的感受,就是一打开电脑,便被各种购物网站支配的恐惧。你近期在某购物网站搜过什么,各种广告弹窗就会出现什么。一些企业,尤其是电子商务公司,热衷于使用大数据分析,他们可以根据用户的检索习惯、消费习惯和其他信息的收集,对用户的状态进行判断,比较准确的为他们推荐可能需要的产品。除此之外,越来越多的个人信息,在网络上都能够找得到,你根本没有办法去防止你的信息不会被利用,就算发现被利用,你可能也不会知道是从什么地方泄露的。

“大数据为我们提供的不是最终答案,只是参考答案,帮助是暂时的,而更好的方法和答案还在不久的将来”。