大数据的幕后推手:摩尔定律,铸造数据滋生的利器
不是我不明白,而是这世界变化太快!人类处于一个信息化的时代,数字洪水正迅猛逼近。我们正生活在现实和虚拟混合的多彩世界中,浩如烟海的数据压得我们喘不过气来。10年前,1.44 MB 的3.5英寸盘还是我们装机的标配,一张软盘打天下;10年后,硬盘的存储容量已从4 GB、16 GB、32 GB迅速攀升到1 TB。GB 级的小U盘和TB 级的移动硬盘早已是普通用户的寻常之物,企业级应用则动辄就要跃升至PB、EB级。原来仅有1.44 MB 的软盘在当时感觉存储容量还是蛮(非常)大的,到现在硬盘容量蹿升至1 TB 了,反而感觉存储空间捉襟见肘,这是为什么呢?
大数据!一语惊醒梦中人,大数据时代已经悄然来临。随着社交网络的逐渐成熟,移动带宽迅速提升,云计算、物联网应用更加丰富。更多的传感设备、移动终端接入到网络,由此产生的数据及增长速度迅速攀升。大数据时代形成的原因,已经有很好的解释——摩尔定律。
早在1959年,美国著名半导体厂商仙童公司首先推出了平面型晶体管,紧接着于1961年又推出了平面型集成电路。这种平面型制造工艺是在研磨得很平的硅片上,采用一种所谓“光刻”技术来形成半导体电路的元器件,如二极管、三极管、电阻和电容等。只要“光刻”的精度不断提高,元器件的密度也会相应提高,从而具有极大的发展潜力。因此,平面工艺被认为是“整个半导体工业键”,也是摩尔定律问世的技术基础。
1965年4月19日,时任仙童半导体公司研究开发实验室主任的戈登·摩尔应邀为《电子学》杂志 35 周年专刊写了一篇观察评论报告,题目是:《让集成电路填满更多的元件》。
在该报告中,摩尔对未来十年间半导体元件工业的发展趋势做出预言。据他推算,到1975年,在面积仅为1/4平方英寸的单块硅芯片上,将有可能密聚65 000 个元件。他是根据器件的复杂性(电路密度提高而价格降低)和时间之间的线性关系作出这一推断的。他的原话是这样说的:“最低元件价格下的复杂性每年大约增加一倍。可以确信,短期内这一增长率会继续保持。即便不是有所加快的话,而在更长时期内的增长率应是略有波动,尽管没有充分的理由来证明,这一增长率至少在未来十年内几乎维持为一个常数。”这就是后来被加利福尼亚理工学院的计算机专家米德命名的“摩尔定律”的最初原型。
尽管这一定律后来成为里程碑似的东西,但这篇文章当时并没有放在首要位置,文章所在的页码是114页。2005年4月11日,摩尔定律已经进入第40个年头,它是芯片产业公认的金科玉律,但从摩尔定律中获益最大的英特尔公司却没有一本最早刊登摩尔定律的杂志。早在1995年,《电子学》杂志就已经破产,摩尔和英特尔都没有保存刊登摩尔定律的这期杂志。为此,英特尔开始在eBay上以1万美元的高价求购这本杂志,获得英特尔1万美元奖金的工程师是大卫·克拉克,就职于飞利浦电子公司。
1968年7月16日,罗伯特·诺伊斯、戈登·摩尔以及企业家安迪·葛洛夫创建了英特尔公司,如今它已是全球最大的半导体芯片制造商。1971年,英特尔推出了全球第一个微处理器。微处理器所带来的计算机和互联网革命,改变了整个世界。
1975年12月,摩尔向IEEE国际电子组件大会上提交了一篇论文《数字集成电子的研究进展》,根据当时的实际情况对摩尔定律进行了修正,将“每年增加一倍”改为“每两年增加一倍”,而现在普遍流行的说法是“每18个月增加一倍”。1997年9月,摩尔在接受采访时声明,他从来没有说过“每18个月增加一倍”,这一论断出自英特尔高管大卫·豪斯之口。
摩尔定律可表述为:当价格不变时,集成电路上可容纳的晶体管数目,约每隔 18 个月便会增加一倍,性能也将提升一倍。换言之,每一美元所能买到的计算机性能,将每隔18个月翻两倍以上。这一定律揭示了信息技术进步的速度。
摩尔定律归纳了信息技术进步的速度。在摩尔定律应用的 40 多年里,计算机从神秘不可近的庞然大物变成多数人都不可或缺的工具,信息技术由实验室进入无数个普通家庭,互联网将全世界联系起来,多媒体视听设备丰富着每个人的生活。
你可能并不一定知晓下面这些数字,但你一定会感受到“数据”正在呈现几何级数的爆炸性增长,因为10亿台计算机、40亿部手机、无数的互联网终端……正在使我们生活的世界高速数字化,“信息爆炸”早已从抽象的概念变为现实的描述。
过去,计算机产生的数据比较简单,基本上都是一笔笔事务,总量虽大,但整体增长幅度都还是可控的,如传统金融企业,经常使用几台大型机就能管理其所有业务数据。然而,近年来,随着平板计算机、智能手机和传感器等智能设备的迅速发展和普及,它们所产生的数据已经远远超出我们的想象。试想一下,1995年全球制造的总硬盘空间仅为 20 PB。
现在,Google 每天都要处理超过 24 PB 的信息。2005年,一块 1 TB 的硬盘价格大约为 1 000 美元,现在一块不到 100 美元的 U 盘就有那么大的容量。这些数据存储的成本正在呈指数下降。根据IDC于2012年12月发布的《2020年的数字宇宙》报告,数据存储成本已从2012年的2美元/兆字节下降到2020年的0.2美元/兆字节(如图1-20所示)。
图1-20 数据存储成本发展趋势