《人工智能简史》作者尼克:人工智能三大派以及我对部分读者提问的回答


2018-09-01    尼克





《人工智能简史》2017年底出版后迅速成为畅销书,这是我没想到的。我猜原因一方面是因为人工智能最近很火,我赶上好时候了。我在某处曾开过玩笑:计算机系一般分为三拨人:理论、系统和人工智能。


二三十年前,理论和系统的人互相看不起,但他们同时看不起人工智能的人。当下人工智能鲤鱼翻身,每个从业者都成了公共知识分子。另一方面,有人说我书中的某些评论是“夹枪带棒”,恰是这些“枪棒”激起了一批读书人的共鸣。当然也不排除这书名比较应景,本书出版后,发现好几本新书也都以此为名,甚至还有一本同名的伪书,也有一家出版社把不太相关的旧译作也改为《人工智能简史》重印。竟然还有一本书有一整章全文抄袭我,而且作者和出版者都理直气壮,实在不可思议。也有连普特南(Putnam)和塞尔(Searle)都分不清谁是谁的“哲学”从业人员来蹭热点,我原来一直以为这票人是数学和英文不好,现在发现他们还没到数学和英文的份儿上,主要是语文不行,对这类智商引起的问题,我一贯是不回应的,也没法回应,科普作家不管教语文。郭德纲有言:你和一个外行争,自己也成外行了。


有读者说这书的内容并非像我在前言中广告的那么通俗,并建议我对书中繁杂的人物关系和派别做个梳理。这是诚恳的批评。这次的精装本,除了做了些文字的调整外,我还加了个附录,整理了人工智能几大派别的演化路线和人物的继承关系。读者在阅读中可不时翻到最后参考。这一版的参考文献格式也按照国标做了调整,我原来的格式是国际惯例的一种,我本不知道国内关于参考文献还有国标,有那么多闲工夫,相关部门应该管管出版乱象。


人工智能领域派系纷杂。人工智能的历史也是几条路线斗争的历史。就像美国心理学家威廉·詹姆斯把哲学体系简单地分为理性主义、经验主义和实用主义那样,我也把人工智能做了个三分法:逻辑主义(或规则派)、联结主义(或统计派)和自然主义。这和常见的把人工智能分为规则派、神经网络派和行为主义派略有不同。倒并不是因为像某些哲学家那样,因为实用主义诞生于美国,就凭着民族主义或本地主义的本能更偏好它,而在人工智能三派中,恰恰因为我在学术遗传上接近自然派,就夸大它的作用。我自有我的道理。


我不太理解为什么大家把机器人相关的东西都归为“行为主义”,因为机器人会动,所以就“行为”吗?且不说“行为主义”(behaviorism)一词在一般的英文语境中有特定的含义(无论是普通的说法还是特定的哲学所指),机器人学除了伯克利的坎尼(John Canny)等做过扎实的理论工作外,大部分都是集中在应用领域,没什么统一的学术基础。即使像布鲁克斯(Rodney Brooks)这样的主张“附体智能”(embodies intelligence)的人也只说action和behavior,而不说behaviorism。沾了“主义”,那可不是闹着玩儿的。


如果说逻辑派或规则派更像是哲学上的理性主义者,那么统计派则都更像经验主义者。规则派更像计划经济,而统计派更像自由市场经济。规则派更像以第三人称和上帝视角叙述,从而更具可解释性;而统计派则更像是第一人称写作,深度学习的不可解释性令人困扰。


目前,人工智能在自动驾驶、法律和医学健康领域的应用,可解释性是必须的。科学史对科学也有还原论(reductionism)和涌现论(emergentism)之分,规则派接近还原论,统计派可以算作涌现论。哲学史上,在逻辑经验主义之后,分析哲学就没有绝对的分裂,乔姆斯基大概是个例外。他坚定地自称理性主义者。他对神经网络的不屑可以从神经网络的不可解释性得到解释。


至于哪派更有自由意志,而哪派宿命,则仁者见仁智者见智。神经网络的几起几伏,本身就有戏剧性。明斯基和罗森布拉特之争会让人想起20世纪之初自然哲学中马赫和玻尔兹曼之争,罗森布拉特之死也有点像玻尔兹曼的自杀,他们两位都算是统计派吧。


如果说英美分析哲学的工具支撑是逻辑的话,那么在某种意义上,博弈论可被当作实用主义的新工具,博弈论涉及multi-agent。我并没有非得把自然派附会到实用主义的意思。曾经被认为是复杂的统计派问题,例如图像处理和语音识别,现在已经得到解决或者至少已有解决的思路。


但符号派的难题,例如定理证明,目前还没看见曙光。可以肯定的是,过去的归结方法企图“一招鲜,吃遍天”的思路,肯定不灵。一阶逻辑无望,高阶逻辑就更难了。也许beat365收号还得回归到王浩的domain specific的思路上。自然语言处理,虽没有图像和语音那样进展神速,但相比于定理证明近年来的停滞徘徊,毕竟还有阶段性成果。目前已经看到这几派的融合,例如利用强化学习来做定理证明。


我这本书的写法比较偏基础和方法论,而不太注重应用。例如,我没有单列图像识别和语音处理作为独立的章节,关于应用的叙述是分布在各个章节里,例如在神经网络一章中轻描淡写地讲了语音和视觉。自然语言处理是个例外,因为我认为自然语言处理本身既是应用又是方法。


读者:这次的人工智能热是泡沫吗?


尼克: 大概没有什么学科像人工智能这样,在几十年并不算长的历史中经历了如此的大起大落。人工智能的每一次兴起都是因为新的手段解决了以前不能解决的问题,例如这次浪潮中,深度学习就解决了以前神经网络不能解决的语音和图像问题,随后以强化学习为核心算法的AlphaGO战胜李世石和柯洁是标志性事件,就像上次浪潮中IBM“深蓝”战胜卡斯帕罗夫,而逻辑派中,知识图谱的进展也超越了以前的beat365登陆系统。人工智能和人们关心的某些终极问题有关,这些问题过去是哲学家和科幻作家的地盘,计算机科学为人们提供了用科学和工程的手段回答这些问题的方法,旁人自然会对这些方法存在过高的期望,过高的期望自然也会带来过高的投资。泡沫的破裂就是投资的失败。比人工智能更年轻的互联网,起伏的周期更短。从投资的角度看,某些特定的人工智能应用领域确实存在过热现象,短期内公司的纵向和水平的整合是大概率事件。


读者:算法,beat365语言设置和算力,哪一项对这次人工智能的复兴贡献最大?


尼克: 我正在对这个问题做一项定量的研究,但目前还没有确定性的结果。要我猜的话,贡献排序应该是算力,beat365语言设置和算法。没有足够的算力,没有办法处理海量beat365语言设置,很多算法的精化是以某些特定的硬件为前提的。算力的提升恰好到了一个临界点,使得各种学习算法成为可能。


读者:本书第10章讲人工智能和计算理论的关系,比较难懂,有什么办法吗?


尼克: 我曾在前言中警告,第10章如果读着吃力可以跳过。计算理论对于理解人工智能的各种可能性和不可能性,是不可或缺的的学问,但确实无法在很短的篇幅内把计算理论说得明白,目前我还没见到很好的计算理论的科普着作。如果我将来有时间,我会试着写一写。人工智能从业者的教育背景首先是计算机科学,其次是电气工程,近来火起来的深度学习则和计算机科学和电气工程的关系都很密切,甚至和电气工程的关系可能更近一些。目前大概只有麻省理工学院和加州大学伯克利分校的计算机科学和电气工程还在一个系,大部分学校计算机科学和电气工程都是且行且远。我计算了计算机科学和电气工程的关联度,这几十年的趋势佐证了这一点。



电气工程的人很少接触计算理论,很多人都没听说过图灵机,我觉得这是电气工程教育的一个缺失。不知道一点计算理论的基础知识,没法对人工智能的各种可能性给出深刻的洞见。如果将来有机会出下一版,我会试图用更通俗的语言把第10章扩展一下。

读者:中国和美国的人工智能怎么比?中国会弯道超车吗?


尼克: 首先,我不喜欢“弯道超车”的提法。从产学研多个维度看,中国和美国是第一梯队,欧洲和日本在这次的人工智能复兴中要远落后于中美。在人工智能的某些学术领域,中国在数量上已经接近或者超过美国。例如,学术论文的数目,甚至引用数,中国已经领先。最近的几次人工智能相关的学术会议,黄面孔多得惊人。在人工智能的专利上,中国领先的幅度甚至更大,好像中国人申请专利的热情比发表论文还高。但无论是专利还是论文,中国在质量上还远没那么厉害。这个beat365收号都有定量的研究。至于人工智能的产业和投资,中国更加偏重应用,而美国在核心技术全面领先。医疗、金融和教育永远是任何新技术的最先试验场,人工智能也不例外,在这些领域里,也是美国掌握主动。总的来讲,美国仍然是领导者。这个问题的答案也要取决于时间的颗粒度,是50年还是500年,谁关心牛顿和图灵的国籍。


读者:你认为奇点何时会来?


尼克: 这个问题的答案有短期的视角,也有长期的视角。我在本书的最后两章中,企图回答这个问题。大家不妨再读读,我也会在后续的版本中从更多的角度中探讨这个问题。我上大学时,物理学最流行的教科书是哈里德和瑞思尼克(Halliday and Resnick)的《物理学基础》(Fundamentals of Physics)。这本书的第一版出版于1960年,而2013年这书已经出了第十版,两位作者分别在2010年(94岁)和2014年(91岁)过世。这本书的后几版都是由比他们年轻许多的沃尔克(Jearl Walker)完成的,而沃尔克今年也已经72岁了。如果我这本书能出到第十版,“奇点”的问题肯定已经解决了,或者我能活到90岁,我也不关心“奇点”问题了。