之前读过《浪潮之巅》和《硅谷之谜》,被一个个科技巨头的故事深深吸引,在科技变革的浪潮中,有的公司顺势崛起,而有的则迅速消亡。在变革的巨浪中,公司的力量太小,只有拥抱技术变迁,才能不被淘汰。公司是这样,我们每个人也是,提早为可能要到来的巨浪做准备。

  

  一口气读完《智能时代》,书中也表达同样的观点:“2%的人将控制未来,成为他们或被淘汰”。阅读本书,开拓了视野和思路,下面总结下书中观点。

数据–人类建造文明的基石

  《智能时代》这本书,首先描述了数据信息知识的概念,并且讲述了三者的联系:数据是杂乱的,需要对数据处理,过滤掉无用的噪声或删除有害的数据,从而获取到数据背后的信息来。而知识比数据和信息更高了一个层次,它更加抽象,并且具有系统性的特征,它是对数据和信息处理之后,被相关领域专业知识的人才总结出来的。书中的例子是:通过测量星球的位置和对应的时间,就得到数据;通过这些数据得到星球运动的轨迹,就是信息;通过信息总结出开普勒三定律,就是知识。人类进步就是靠使用知识不断改变生活和周围世界的过程,而这一切的基础就是数据。所以说数据是人类建造文明的基石。  
  数据一个重要的特性是,数据之间具有关联性。所以通过对数据挖掘和分析可以得到想要的和许多意想不到的信息。比如中国最著名“照片泄密案“,就是个很好的通过分析来获得有用信息的例子。因为数据之间的这种相关性,当无法直接获得信息(比如疫情传播情况),可以将相关联的信息(比如各地搜索情况)量化,然后通过数学模型,间接地得到所需信息。数学模型的基础离不开概率论统计学。统计学的数据采集中有两个要点:,量是指统计的数据量必须充足,而质则是指采集的数据需要具有代表性、与统计的目标相一致。因此,准确的统计结果,依赖大量的有效数据。在实际应用中需要建立数学模型,寻找模型参数,来让模型和采集的数据相匹配。过去寻找模型更加重要,但在今天更多的是寻找模型的参数,这属于机器学习(找到数学模型后,用统计的方法“训练出”模型的参数)的范畴。至于模型选择,可以将很多简单的模型组合到一起,取代寻找一个复杂模型,来逼近真实情况。这样的方法被称为数据驱动方法。因为,它是先有大量数据而不是预设的模型,然后用很多简单的模型去契合数据。数据驱动方法是大数据的基础,也是智能革命的核心,更重要的是它带来了一种新的思维方式。
  人类认识自然的过程,科学实践的过程,以及在经济、社会领域的行为,总是伴随着数据的使用。从某种程度上讲,获得和利用数据的水平。在电子计算机诞生、人类进入信息时代之后,数据的作用越来越明显,数据驱动方法开始被普遍采用。如果把资本和机械动能作为大航海时代以来全球近代化的推动力,那么数据将成为下一次技术革命和社会变革的核心动力。

大数据和机器智能  

  验证机器有无智能的方法–图灵测试:让一台机器和一个人坐在幕后,裁判同时和幕后的人和机器交流,如果裁判无法判断对方是人还是机器,就说明这台机器有了和人同等的智能。学术界将机器智能分为传统人工智能方法现代其他方法(如数据驱动、知识发现或机器学习)。传统的人工智能就是首先了解人类是如何产生智能的,然后让计算机按照人的思路去做,但是这种方法无法让计算机有类似于人的智能。作者举了一个例子:The pen was in the box(钢笔在盒子里)很好理解,但是另一句语法相同的话:The box in the pen就让人费解。在英语中pen有另一个不常用的意思–小孩玩耍的围栏。知道了这层含义,这句话就能够理解了。但是对于机器,如果使用同样的语法分析,这两句话会得到相同的语法分析树,而仅根据这两句话本身,甚至通篇文章,是无法判定pen的含义是围栏还是钢笔。人对这两句话的理解并非来自语法分析和语义本身,而是来自他们的常识或者说关于世界的知识(world knowledge),这种问题是传统的人工智能方法解决不了的。因此只有另辟蹊径,采用统计+数据的方法,这种方法最大的好处是,随着数据量的积累,系统会变得越来越好,相比之下过去人工智能的方法很难收益于数据量的提升。  
  数据的量变可以引起质变,作者举出google翻译系统的翻译准确率在短时间超过其他研究机构的例子,来说明大量的数据使得google的翻译系统发生了质变:在大部分研究团队只够训练三元模型的情况下,google能够训练出六元模型。由于互联网和移动互联网的出现,数据量剧增,并且开始相互关联,数据驱动方法的优势越来越明显。全世界各个领域数据不断向外扩展,很多数据开始出现交叉,各个维度的数据从点和线渐渐连成了网,或者说数据的关联性极大地增强,在这样的背景下,出现了大数据的概念。那么什么是大数据呢,它有哪些特征?大数据最明显的特征是体量大,除了体量大以外,作者认为大数据还有多维度全面性(完备性)的特征。大数据的时效性不是必须的,但是如果有时效性可以做到很多过去做不到的事情:如城市智能交通管理。
  有了大数据之后,就可以变智能问题为数据问题,机器智能不再是和人一样靠推理,而是采用大数据,从数据中学习获得信息和知识。由大数据引发的革命已经悄然发生,它能够让计算机的智能水平产生飞跃,在很多领域计算机将获得比人类更高的智能。大数据和由之而来的智能革命决定着今后20年的经济发展。

机械思维和大数据思维

  自17世纪以来指导我们日常做事行为的最重要的思维方式是机械思维。机械思维的核心思想可以概括为:1.世界变化的规律是确定的;2.因为有确定性做保障,因此规律不仅可以被认识,而且可以用简单的公式或者语言描述清楚;3.这些规律应该是放之四海皆准的。机械思维作为一种准则指导人们的行为,其核心思想可以进一步概括成确定性(或者可预测性)因果关系。例如牛顿用了几个定律(力学三定律和万有引力定律)就可以把天体的运动规律讲清楚,并且应用到任何场合都是正确的,这就是确定性。类似的,当我们给物体施加外力时,它就获得一个加速度,而加速度的大小取决于外力和物体本身质量,这是一种因果关系。
  机器思维促进了世界近代化,乃至现代化的过程–它导致了很多重大发明和发现,比如爱因斯坦的相对论,也促进了一些现代科学的诞生,比如现代医药学。但是世界本身存在着很大的不确定性,由于它否认了不确定性和不可知性,机械思维在认识世界时还是有很多的局限性。世界不确定性来自两个方面:1.影响世界的变量非常多,很多细节难以准确测量。2.来自客观世界本身,它是宇宙的一个特性(微观世界里电子绕原子核的运动轨迹)。因为不确定性,世界上很多事情难以用确定的公式或者规则来表示。但是,并非没有规律可循,通常可以用概率模型来描述。在概率论的基础上,香农建立的信息论将世界的不确定性和信息联系了起来(大数据的可行性)。在无法确定因果关系时,数据为我们提供了解决问题的新方法,数据中包含的信息可以帮我们消除不确定性,而数据之间的相关性在某种程度上可以取代原来的因果关系,帮助我们得到想知道的答案,这便是大数据的核心。大数据思维和机械思维并非完全对立,它更多的是对后者的补充。  

智能革命

  我们今天可能处在机器智能将要超过人类的拐点上,作者从数据的产生、存储、传输和处理四个角度分析大数据形成的技术条件,并且讲述了大数据和智能革命的技术挑战和未来的智能化产业,在今后,任何能提供大数据关键技术的公司和个人,在未来的智能革命中,都将有大展宏图的机会。 
  “这是最好的时代,也是最坏的时代”,大数据导致机器革命的到来,这对未来社会的影响不仅仅存在于经济领域,而是全方位的。总体上看,这些影响是正面的,从长远看会使我们未来的社会变得更好。不过,智能革命也会带来很多负面的影响,特别是在它发展的初期。任何一次技术革命,最初受益的都是发展它、使用它的人,而远离它、拒绝接受它的人,在很长的时间里都是迷茫的一代。在智能革命到来之际,作为人和企业无疑应该拥抱它,让自己成为那2%的受益者。这将是一个让我们振奋的时代,也是一个给我们带来空前挑战的时代。