1.2 人工智能的历史

本节我们通过回顾历史来进一步理解人工智能。人工智能的发展历史大致可以分为初创时期、形成时期、发展时期、大突破时期4个历史阶段。

1.2.1 第一阶段:初创时期(1936年—1956年)

一般认为,人工智能始于20世纪30—50年代。这一时期,有几项与人工智能相关的重要科学技术成果相继产生。

1.通用图灵机

通用图灵机(Universal Turing Machine)由图灵在1936年发明,是一种理论上的计算机模型。通用图灵机被设想有一条无限长的纸带,纸带被划分成许多方格,有的方格被画上斜线,代表“1”;有的方格中没有画任何线条,代表“0”。它有一个读写头部件,可以从带子上读出信息,也可以往空方格里写信息。这个原型计算机仅有的功能是把纸带向右移动一格,然后把“1”变成“0”,或者相反地把“0”变成“1”。其假设的模型如图1.4所示,这是一种不考虑硬件状态的计算逻辑结构。通用图灵机是现代计算机的思想原型。

图1.4 通用图灵机模型

2.早期的计算机技术

1937年—1941年,美国爱荷华州立大学的约翰·文森特·阿塔纳索夫(John Vincent Atanasoff)教授和他的研究生克里夫·贝瑞(Cliff Berry)开发了阿塔纳索夫-贝瑞计算机(Atanasoff-Berry Computer,ABC),为计算机科学和人工智能的研究奠定了基础。现代可编程数字电子计算机架构是由美国数学家、计算机科学家、物理学家约翰·冯·诺依曼(John von Neumann)提出的,它是受到图灵的通用计算机思想的启发,于1946年在工程上实现的。“冯· 诺依曼计算机”奠定了现代计算机的基础,也是测试和实现各种人工智能思想和技术的重要工具。

3.人工神经元模型

1943年,美国心理学家沃伦·麦卡洛克(Warren McCulloch)和数理逻辑学家瓦尔特·皮茨(Walter Pitts)合作提出人类历史上的第一个人工神经元模型麦卡洛克-皮茨模型(McCulloch-Pitts Model),这是一种模拟人脑生物神经元的数学神经元模型,简称MP模型。他们的研究表明,由非常简单的单元连接在一起组成“网络”,可以对任何逻辑和算术函数进行计算,因为网络单元像简化后的神经元。由MP模型发展而来的一种重要的人工智能技术是人工神经网络(Artifical Neural Network,ANN)。可见,MP模型就是人工神经网络的最初起源。人工神经网络最开始并不是叫这个名字,而是叫“联结主义”,在当时人们并没有将这个概念和人工智能联系起来,因为1956年以前还不存在“人工智能”这个词语。

4.控制论

控制论是关于具有自我调整、自适应、自校正功能的机器的理论,其由美国数学家、控制论的创始人诺伯特·维纳(Norbert Wiener)于1948年提出。控制论对人工智能的影响在于,它将人和机器进行了深刻的对比:由于人类能够构建更好的计算机器,并且人类更加了解自己的大脑,因此计算机器和人类大脑会变得越来越相似。可以说,控制论是从机器控制的角度,在机器、人与大脑之间建立起了一种联系。控制论关于人与机器关系的思想,又启发后来的学者开发了早期的人工智能技术。

除了上述几项重要且关键的理论和思想,还有信息论等相关理论和思想,也对人工智能的产生有着重要影响。在当时的各种关于人、大脑、神经以及它们与机器关系的思想的启发下,图灵认为人的大脑应当被看作一台离散态机器,它与计算机在本质上并没有什么不同。图灵坚信,人工智能一定能以某种方式实现。图灵和其他学者关于计算本质的思想,建立了人类的逻辑推理能力与冯·诺依曼计算机之间的联系。

1952年,IBM科学家亚瑟·塞缪尔(Arthur Samuel)开发了跳棋程序。该程序能够通过观察棋子的当前位置,并学习一个隐含的模型,为后续走棋步骤提供更好的指导。通过这个程序,塞缪尔驳倒了当时一些学者持有的“机器无法超越人类”这一观点。他还创造了“机器学习”(Machine Learning,ML)这一概念。图1.5所示为塞缪尔正在调试他开发的跳棋程序。

图1.5 塞缪尔正在调试其开发的跳棋程序

在上述思想的影响下,1956年,美国学者约翰·麦卡锡(John McCarthy)、马文·明斯基(Marvin Minsky)以及IBM的两位资深科学家克劳德·香农(Claude Shannon)和尼尔·罗切斯特(Nathan Rochester)组织了一次学会,邀请包括赫伯特· 西蒙(Herbert Alexander Simon)和艾伦·纽厄尔(Allen Newell)在内的对“机器是否会产生思维”这一问题十分感兴趣的一批数学家、信息学家、心理学家、神经生理学家和计算机科学家参加,他们聚集在一起,进行了长达两个月的达特矛斯夏季研究会。麦卡锡首次提出“人工智能”这一概念。这次会议并没有解决有关人工智能及机器思维的任何具体问题,但它为后来人工智能的发展确立了研究目标,并开启了人工智能发展的历史,使其发展至今。

人工智能诞生之后的几十年,其发展大致有两条主线:一是从结构的角度模拟人类的智能,即利用人工神经网络模拟人脑神经网络以实现人工智能,由此发展而形成了联结主义;二是从功能的角度模拟人类的智能,将智能看作大脑对各种符号进行处理的功能,由此发展而形成了符号主义。

1.2.2 第二阶段:形成时期(1957年—1969年)

符号主义的最初工作由西蒙和纽厄尔在20世纪50年代开始推动。这一时期,研究者们发展了众多原理和理论(人工智能概念也随之得以扩展)相继取得了一批显著的成果,如机器定理证明、跳棋程序、通用问题求解程序、表处理语言等。

在十余年的时间里,早期的数字计算机被广泛应用于数学和自然语言领域,用于解决代数、几何和翻译问题。计算机的广泛使用让很多研究人员坚定了机器能够向人类智能趋近的信心。这一时期是人工智能发展的第一个高峰时期。研究人员表现出了极大的乐观态度,甚至预测当时之后的20年内人们将会建成一台可以完全模拟人类智能的机器。

这一时期也奠定了人工智能符号主义学派的基础。该学派的核心思想为,智能或认知就是对有意义的表示符号进行推导计算,也是一种对人类认知的初级模拟形式。所谓符号就是人类借以表达客观世界的模式。任何一个模式,只要它能和其他模式相区别,它就是一个符号。不同的英文字母、数学符号以及汉字等都是不同的符号。

1958年,美国康奈尔大学的心理学家和计算机学家弗兰克罗·森布拉特(Frank Rosenblatt)继承控制论的联结主义方法之后,提出了感知器的概念,这在当时引发了一股研究热潮。后来,符号主义权威明斯基和西蒙通过对一种早期的人工神经网络模型—单层感知器进行分析,证明了当时的感知器模型不能实现异或操作,也就是不能解决非线性可分问题(一种数据分类问题),由此推断人工神经网络是没有未来的。

20世纪60年代,其他一些非主流的人工智能技术也在悄然而生。德国专家英戈·罗森伯格(Ingo Rchenberg)和汉斯·保罗·施韦费尔(Hans Paul Schwefel)出于实际工程设计问题的需要,提出了基于达尔文进化论的进化策略,这是一种纯粹的数值优化算法,用以解决工程优化问题。这一行为实际上开启了基于进化论思想的进化计算领域的研究先河。

来自加州大学伯克利分校的落蒂夫·扎德(Lotif Zadeh)教授发表了著名的《模糊集》论文,奠定了模糊数学理论和模糊逻辑基础。到20世纪80年代,研究人员基于该理论构建了成百上千的智能系统,它们被广泛应用于工业生产、家用电器、机器人等领域。

总之,20世纪60年代,为了模拟复杂的思考过程,早期的研究人员主要试图通过研究通用的方法来解决广泛的问题。这个阶段,许多伟大的科学家们针对人工智能各个方面提出创新性的基础理论,例如,在知识表达、学习算法、人工神经网络等诸多方面都有新的理论出现。但是,由于早期的计算机性能有限,因此很多理论并未得以实现,但它们却为20年后人工智能的实际应用指出了方向。这一时期的主要特点是符号主义学派超越了联结主义学派,主导人工智能领域的研究直到20世纪90年代中期。

1.2.3 第三阶段:发展时期(1970年—1992年)

这一时期分为两个阶段:20世纪70年代和20世纪80年代。20世纪70年代,人工智能的发展因并不符合预期而遭到了激烈的批评和政府预算限制。特别是在1971年,罗森布拉特早逝,加上明斯基等人对感知机的激烈批评,人工神经网络被抛弃,联结主义因此停滞不前。这是人工智能发展历程中遭遇的第一个低潮时期。

但即使是处于低潮的20世纪70年代,仍有许多新思想、新方法在萌芽和发展。20世纪70年代初,美国学者约翰·霍兰德(John Holland)创建了以达尔文进化论思想为基础的计算模型,称为遗传算法,并开创了“人工生命”这一新领域。遗传算法、进化策略和20世纪90年代发展起来的遗传编程算法,一起形成了进化计算这一人工智能研究分支。

1970年,《人工智能国际杂志》创刊。该杂志的出现对开展人工智能国际学术活动和交流、促进人工智能的研究和发展起到了积极的作用。1971年,美国国防高级研究计划局。(Defense Advanced Research Projects Agency,DARPA)资助了一个由语音识别领域技术领先的实验室组成的联盟。该联盟有一个雄心勃勃的目标,即创建一个具有丰富词汇量的全功能语音识别系统。虽然该计划在当时并不成功,但由此发展而来的语音识别技术已经嵌入了智能音箱等设备,进入了千家万户。1974年,保罗·韦伯斯(Paul Werbos)提出了如今人工神经网络和深度学习的基础学习训练算法—反向传播(Back Propagation,BP)算法。

1976年,西蒙和纽厄尔提出了物理符号系统假设,认为物理系统表现智能行为的必要和充分条件是它是一个物理符号系统。物理符号系统的基本任务和功能是辨认相同的符号以及区分不同的符号。1977年,爱德华·费根鲍姆(Edward Feigenbaum)在第五届国际人工智能联合会议上提出“知识工程”概念,知识工程强调知识在问题求解中的作用,主要的应用成果就是各种专家系统。专家系统是一种利用知识规则、推理和搜索技术实现对人类专家经验的模拟,以解决某些专业领域问题的智能系统。

这一时期的一个重要特点就是人工智能研究者意识到必须对智能机器的问题范围进行充分限制。在对通用的、人类惯用的解决问题的方式进行仿真,以创造出聪明的搜索算法和推理方法等技术的探索失败后,研究人员意识到,有一条出路是使用大量推理步骤来解决狭隘专业领域的典型问题,这使专家系统取得了快速的发展,并且发展出了医疗专家系统、农业专家系统等。专家系统使人工智能由理论化走向实际化,由一般化走向专业化,这是人工智能发展的一个重要转折点。

经历了一段低谷时期后,人工智能的发展在20世纪80年代迎来了第二个春天。这主要是由于“专家系统”对基于符号主义的机器架构进行了重大修订。这一时期,很多模仿人类学习能力的机器学习算法不断发展并越来越完善,机器的计算、预测和识别等能力也随之有了较大提升。与此同时,日本政府启动了一项关于人工智能的大规模资助计划,并启动了第五代计算机计划。联结主义也由于美国加州工学院物理学家约翰·霍普菲尔德(John Hopfield)和美国加州大学圣迭戈分校的认知心理学家大卫·鲁梅尔哈特(David Rumelhart)所做的工作而重新受到了重视。

1982年,霍普菲尔德提出了Hopfield神经网格模型,标志着人工神经网络新一轮的复兴。

1986年10月,鲁梅尔哈特和美国卡内基梅隆大学的杰夫·辛顿(Geoffrey Hinton)等人,在著名学术期刊Nature上联合发表题为Learning Representations by Back-propagating Errors(通过反向传播算法的学习表征)的论文。该论文首次系统简洁地阐述了BP算法在人工神经网络模型上的应用。此后,人工神经网络才真正地迅速发展了起来。

20世纪80年代,理论神经科学家大卫·马尔(David Marr)在麻省理工学院开展视觉研究工作。他排斥所有的符号化方法,认为实现人工智能需要自底向上地理解视觉的物理机制,而符号处理应在此之后进行。明斯基认为人的智能根本不存在统一的理论。1985年,他在《思维社会》一书中指出,心智由许多被称作智能体的小处理器组成,每个智能体本身只能做简单的任务,其并没有心智,当智能体构成复杂社会后,就具有了智能。

1987年,在美国加州圣地亚哥召开的第一届人工神经网络国际会议上,成立了国际人工神经网络学会,这标志着人工神经网络进入了快速发展时期。科学家已在研制神经网络计算机,并把希望寄托于光芯片和生物芯片上,一个以人工智能为龙头、以各种高新技术产业为主体的“智能时代”即将开启。但好景不长,专家系统过于复杂、性能非常有限等不足使原本充满活力的市场大幅崩溃,日本政府也因此停止了第五代智能计算机研发工作,人工智能的发展在20世纪80年代末进入了第二次低潮时期。

20世纪80年代后期,一种自底向上地创造智能的思想复兴了20世纪60年代起沉寂下来的控制论。麻省理工学院教授罗德尼·布鲁克斯(Rodney Brooks)由此在20世纪90年代创建了行为主义学派。行为主义通过模拟从昆虫到四足动物以及人类等各种对象创建各种智能机器人。在行为主义工作范式下研究者们下进一步开展了人工生命和模拟进化的研究。依照人工生命倡导者的愿望,如果能够在机器上进化出生命,则智能将自然产生。

在20世纪80年代和90年代,也有许多认知科学家反对基于符号处理的智能模型,认为身体是推理的必要条件。这被称为“涉身(或肉身、体验、具身)的心灵、理性、认知理论(哲学)”。

20世纪90年代初,符号主义人工智能日渐衰落,人工智能研究者们决定重新审视人工神经网络。

在人工智能发展的第三阶段中,整个领域比较大的收获是联结主义取得了较大进展,也就是人工神经网络由于少数学者的坚持,取得了很大进步。这种进步的意义在于它助力了当代深度神经网络和深度学习技术的全面爆发,使人工智能进入了第四阶段。

1.2.4 第四阶段:大突破时期(1993年至今)

对于人工智能发展而言,大突破时期也是一个超越历史上任何一个阶段的、非凡的创造性时期。1993年,作家兼计算机科学家弗诺·文奇(Vernor Vinge)在他发表的一篇文章中首次提到了人工智能的“奇点理论”。他认为未来某一天人工智能会超越人类,并且会终结人类社会,进而主宰人类世界。这个时间点被他称为“即将到来的技术奇点”。

这一时期,模拟自然界鸟类飞行的粒子群算法和模拟蚂蚁群体行为的蚁群算法,以及用于求解函数优化等问题的各类算法相继出现,推动了从进化计算发展而来的计算智能、自然计算等人工智能分支的发展。

1995年,贝尔实验室(Bell Labs)科学家科琳娜·科尔特斯(Corinna Cortes)和俄罗斯统计学家、数学家弗拉基米尔·万普尼克(Vladimir Vapnik)提出了软边距的非线性支持向量机(Support Vector Machines,SVM),并将其应用于手写数字识别问题。这一研究成果在发表后得到了科学家广泛的关注和引用,其影响在当时远超人工神经网络。以支持向量机为代表的集成学习、稀疏学习、统计学习等多种机器学习方法开始占据主流舞台。在之后的10年里,深层次的人工神经网络并未受到关注。

1996年,人工神经网络领域的重要人物燕·乐昆(Yann Lecun)成为贝尔实验室的图像处理研究部门主管,开发了许多新的机器学习方法,包括模仿动物视觉皮层的卷积神经网络(Convolutional Neural Networks,CNN)。

1997年5月11日,国际象棋世界冠军卡斯帕罗夫(Kasparov)与IBM公司的国际象棋计算机“深蓝”的6局对抗赛降下帷幕。在前5局以2.5∶2.5打平的情况下,卡斯帕罗夫在第6盘决胜局中仅走了19步就对“深蓝”甘拜下风,整场比赛进行了不到一个小时。“深蓝”综合了多种人工智能知识表示、符号处理、搜索算法和机器学习技术,成为第一台在多局赛中战胜国际象棋世界冠军的计算机,这是人工智能发展的重要里程碑。图1.6所示为卡斯帕罗夫与国际象棋计算机“深蓝”对弈现场。

2006年,加拿大多伦多大学教授杰夫·辛顿联合他的学生(后来成为了纽约大学教授的)燕·乐昆和加拿大蒙特利尔大学教授约书亚·本吉奥(Yoshua Bengio),发表了具有突破性的论文A Fast Learning Algorithm for Deep Belief Nets(深度置信网的快速学习方法),开创了“深度神经网络”和“深度学习”的技术历史,并引爆了一场现代商业革命。

图1.6 卡斯帕罗夫与国际象棋计算机“深蓝”对弈现场(右为“深蓝”现场操作者)

2010年,斯坦福大学教授李飞飞创建了一个名为ImageNet的大型数据库,其中包含数百万个带标签的图像,为深度学习技术性能测试和不断提升提供了一个舞台。2010年以来,ImageNet 每年都会举办一次软件竞赛,即ImageNet大规模视觉识别挑战赛(ImageNet Large Scale Visual Recognition Challenge,ILSVRC),如图1.7所示。参赛程序对物体和场景进行分类和检测,正确率最高者获胜。通过这个比赛,许多优秀的深度学习算法脱颖而出。

图1.7 ImageNet 挑战赛

2012年,ImageNet 竞赛引发了人工智能大爆炸,杰夫·辛顿和他的学生亚历克斯·克里热夫斯基(Alex Krizhevsky)利用一个8层的卷积神经网络——AlexNet,以超越第2名(使用传统计算机视觉方法)10.8%的成绩取得了冠军。AlexNet不仅可以让计算机识别出猴子,还可以使计算机区分出蜘蛛猴和吼猴,以及各种各样不同品种的猫。

2015年,微软亚洲研究院何凯明等人使用152层的残差网络(Residual Network,ResNet)参加了ImageNet图像分类竞赛,并取得了整体错误率3.57%的成绩,这已经超过了人类平均错误率5%的水平。由于许多算法已经达到了竞赛预期的最高水平,因此该比赛于2017年终止。

2011年,谷歌计算机科学家杰夫·迪恩(Jeff Dean)和斯坦福大学教授吴恩达发起“谷歌大脑”(Google Brain)项目,用16000台计算机CPU搭建了一个具有10亿个连接的深度神经网络,并把这个庞大的网络想象成一个婴儿的大脑,然后让“大脑”看一些无标注的在线视频。在此之前,没有人告诉过这个“大脑”什么是猫,结果“谷歌大脑”在观看了大量视频之后自行学会了认识猫脸。

2016年,美国谷歌旗下的DeepMind公司开发的阿尔法围棋智能系统AlphaGo战胜了人类棋手冠军李世石。该系统集成了搜索、人工神经网络、强化学习等多种人工智能技术。这一事件也是人工智能发展史上的一个重要里程碑。图1.8所示为AlphaGo与人类棋手对弈的阶段棋局。

图1.8 AlphaGo与人类棋手对弈棋局

2016年之后,以AlphaGo为代表的新一代人工智能引起了各国政府的关注。各国政府纷纷进行顶层设计,在规划、研发、产业化等诸多方面提前布局,掀起了人工智能研发的一场国际新竞赛。如今,深度学习技术在图像识别、语音识别、机器翻译等方面取得了很好的应用效果,对工业界产生了巨大影响。世界著名互联网巨头公司以及众多的初创科技公司,纷纷加入了人工智能产品的战场,从而掀起了人工智能发展历史上的第三次高潮。

基于人工神经网络发展而来的深度学习虽然取得了巨大的成功,但它并不是什么新方法。其成功很大一部分因素得益于一种图像处理器(Graphics Processing Unit,GPU)的并行计算技术,以及超大型计算机的计算能力。

2019年1月25日,DeepMind公司开发的AlphaStar在“星际争霸2”游戏中以10∶1的战绩战胜了人类冠军团队。2019年5月31日,DeepMind公司的研究人员在Nature上发表相关论文,介绍了其在游戏智能体方面的新进展。当时,DeepMind的设计被称为For the Win(FTW)智能,它达到了人类水平,能够与其他智能体或人类相互合作。而之后,DeepMind又提出了被称为“自我游戏”(self-play)的新智能体,该智能体在游戏中甚至能够超越人类选手的水平。

近5年,超级计算、大数据与深度学习技术的结合也是引发人工智能第三次高潮的重要原因。相比于历史上任何一个时期,现阶段是联结主义人工智能对符号主义人工智能的胜利,以人脑神经网络为原型的联结主义成为了实现人工智能的有效途径,但从长远来看这并不代表符号主义的研究没有价值。

实际上,在联结主义迅猛发展的同时,传统的符号处理、知识表示、搜索技术以及机器学习等强化学习技术也在不断发展。

2011年,IBM沃森(Watson)超级计算机在美国一档名为“危险边缘”的智力竞赛游戏中打败了两位优秀的人类选手,竞赛场景如图1.9所示。IBM基于沃森超级计算机的成果发展了“认知计算”。

图1.9 IBM沃森超级计算机与人类选手竞赛

2018年6月,IBM的人工智能产品项目辩论者(Project Debater)参加了在旧金山举行的对战人类选手的公开辩论赛。在没有提前获知辩题的情况下,项目辩论者依靠强大的语料库,独自完成陈述观点、反驳辩词、总结陈述的整个辩论过程。2019年2月11日,项目辩论者和人类冠军辩手在旧金山进行了史上第二次人机辩论赛。人工智能辩论系统作为“理智派”代表却选用了一个更感性的角度,试图通过人性弱点来说服人类。这套人工智能辩论系统具有强大的语义理解和语言生成能力。它的潜在价值在于,可以通过不断提升数据处理能力,为医生、投资人、律师甚至执法机关和政府工作人员(在做出重要决策时)提供客观、理性、无人性偏颇、无情绪左右的建议。

知识图谱是一种实现机器认知智能的知识库,是符号主义持续发展的产物。它从一开始就在知识表示、知识描述、知识计算与知识推理等方面不断发展。自2015年以来,知识图谱在诸如问答、金融、教育、银行、旅游、司法等领域中进行了大规模的应用。从最初的简单地对人类知识进行表示,到现在的大规模应用,知识图谱已经前前后后经历了将近50年的时间,并已经成为发展以认知智能为目标的新一代人工智能的重要基础技术。

在联结主义和符号主义人工智能各自不断发展的同时,人工智能领域出现了脑机接口、外骨骼、可穿戴等人机混合智能技术。随着核磁共振等物理观测和仪器技术的进步,脑科学和神经科学也在不断发展,人们对大脑和神经系统在物理微观层面的认识也越来越深入,以大脑生物和物理为基础的类脑计算技术得以发展,类脑芯片、智能芯片等新型硬件产品和技术不断涌现。