图源:pixabay
撰文丨张天蓉
2024年初,自然杂志公布了2024年重要的七项科技,其中一項是“蛋白质序列的深度学习模型”。这起源于近来几年谷歌公司旗下DeepMind的AlphaFold在识别蛋白质结构方面的重大进展,也例证了人工智能在解决复杂科学问题方面的杰出能力。
尽管AlphaFold识别蛋白质使用的是深度学习技术,但正如一条英语谚语所言:“罗马不是一天建成的”,AI技术在几十年的发展过程中,经历了一场又一场的变革之旅。从最初的“专家系统”的出现,到现在复杂的“机器学习”模型时代,有一段长长的历史进程。反思变革过程,回溯早期历史,可以为充分利用人工智能的潜力来解决复杂的现实问题铺平道路。因此,今天我们回顾用专家系统解决化学领域复杂问题的第一个AI模型,即1965年的DENDRAL。
图1:自然杂志公布2024年重要的七项科技
专家系统是什么?
在上世纪的 60 年代初,计算机科学家埃德·费根鲍姆(Ed Feigenbaum,1936-)受到科学家思维过程的启发,开始创建模型来模拟专家的经验归纳法,这一历程导致了第一个专家系统的诞生。费根鲍姆与1958年的生理医学诺奖得主莱德伯格(Lederberg,1925-2008)合作,率先开发了化学领域开创性的专家系统 DENDRAL,同时也开启了一段专家系统引领人工智能的时代。
专家系统在上世纪80 年代,曾经引领AI,占据AI的主导地位。第一个专家系统DENDRAL,是研究有机分子识别的工具。继DENDRAL 之后,又有 MYCIN和CADUCEUS等医疗诊断的专家系统被开发出来,用户向这些计算机系统描述他们的症状,就像向医生描述症状一样,然后,计算机返回医疗诊断。
这些专家系统成为改进决策的催化剂,彻底改变了行业。它们可以帮助化学家鉴定化合物,或者协助医生诊断感染。随着他们的成功,专家系统在80 年代获得了广泛的应用,渗透到财富 500 强公司中并展示了一定的用处和优越性。
之后,还有用于评估多种残疾学生的专家系统;澳大利亚医学研究所开发的,可对病理实验室的内分泌报告提供自动临床诊断评论的医学专家系统;意大利于 20 世纪 90 年代开发的监测大坝安全的专家系统,第一个版本于 1992 年安装在 意大利Ridracoli 大坝上,至今仍在继续运行。
后来,由于当年没有高速的计算机,没有先进的互联网,当然也没有大数据的支撑。然而,尽管时机尚未成熟,人们对人工智能的期望却过高,最终导致了上世纪 80 年代末被称为“人工智能冬天”的衰退时期。专家系统也未能幸免于难。
不过,了解一下当年热门的专家系统,对深一步理解如今的AI会有所启发和帮助。
专家系统(expert system)的意思与其名称一致,是人类社会的“专家”在机器系统中的对应物。
我们通常所说的人类中的专家,指的是那些擅长解决特定问题的专门人才。专家为什么能解决专门的问题呢?有3个条件:一是具有某个领域的专业知识,二是具有利用这些知识来进行逻辑推理的能力,最后第三条,是根据推理结果和他们的经验,具有作出正确决策的能力。
于是,计算机科学家便自然地想到:如果让机器也拥有了这三种能力,不也就成为专家了吗?有实干家们将此想法变成了现实,给计算机编程序,真正实现了这种具备“专家”功能的机器系统!于是,便取其名曰“专家系统”。
具体而言,专家系统是一个包括了某个领域的大量专门知识与经验的程序系统,它应用人工智能技术和计算机技术,对这些知识和经验进行推理和判断,并模拟人类专家的决策过程,模仿人类来解决所面临的问题。
所以,专家系统,不过是“知识就是力量”在机器智能上的具体体现,它是早期人工智能的一个重要分支,是人工智能应用研究中比较活跃和广泛的课题之一。
一般来说,专家系统必须具备三要素:领域专家级知识(知识库);模拟专家思维,作出专家级水准的决策(推理机);问题输入(界面);如图2所示。
图2:专家系统结构示意图
费根鲍姆其人
美国科学家费根鲍姆于1936年出生于新泽西州。他的父亲是从波兰移民的犹太人,但当费根鲍姆不到一岁时父亲就去世了。年轻的费根鲍姆从他的继父那儿,接触到早期机电式计算器。继父是一名会计,拥有一台重型机械计算器,配有可转动数字轮的电机,以及一个非常大的数字键盘。那个年代的中学生中,很少人喜欢这种庞大的计算器,但却令费根鲍姆着迷。他曾经吃力地将这个笨重机器搬上校车,展示给同学们看。但多数人都对此不感兴趣,唯有费根鲍姆引以为傲自得其乐。之后,费根鲍姆由于对计算技术的极大好奇和痴迷,进入了卡内基梅隆大学学习电气工程[1]。在那里他遇到了著名的诺贝尔经济学奖获得者赫伯特·西蒙(Herbert Simon,1916—2001)教授,后来又在西蒙的指导下于1960年获得了博士学位。
在西蒙的指导下,费根鲍姆在读博期间,实现了一个模拟人在刺激反应环境中记忆单词时的反应的程序,叫做EPAM。这是第一个模仿人类学习能力的电脑系统,费根鲍姆发明了动态增长的决策树,以EPAM为题完成了他的博士论文。EPAM 通过一个简单的模型实现了许多固定目标。之后,由它改进的模型结构持续了许多年,在心理学领域一直活跃且富有成果。
获得博士学位之后,费根鲍姆到英国国立物理实验室NPL工作了一段时间,这段经历对他的影响很大。图灵曾经是NPL的研究员,在那里设计和制造了最早的计算机之一。遗憾的是图灵早在1954年便已经去世,费根鲍姆无缘见到图灵,却仍然感受到图灵在NPL的巨大影响力。
在人工智能初创的第一个10年中,人们着重的是问题求解和推理的过程。费根鲍姆的重大贡献是最早倡导了"知识工程",并使知识工程成为人工智能领域中取得实际成果最丰富、影响也最大的一个分支。
1994年,费根鲍姆因其在人工智能和智能系统上的显著贡献荣获图灵奖。
费根鲍姆本人,不仅是知识工程的倡导者,也是实践者。他对此的早期实践便是考虑开发一种知识密集型的,基于知识的计算机系统。这种程序适合于人类专家短缺或专门知识十分昂贵的的情况,可以模仿人类的专家,用比较经济、易于复制推广的运行计算机程序的方法,由“专家系统”来完成专家才能完成的任务。如此一来,企业就不需要聘请很多有经验的专家,所以可以极大地减少劳务开支和培养费用,为用户带来经济效益。
因此,费根鲍姆如此定义专家系统:“专家系统是一种智能的计算机程序,其内部含有大量某个领域专家水平的知识与经验,能够模拟人类专家的思维过程,求解该领域内需要专家才能解决的困难问题。”
第一个专家系统
费根鲍姆十分欣赏他在卡内基梅隆大学读博的美好时光:活跃的学术气氛,充满创新和挑战的环境。在那儿,费根鲍姆还有几位良师益友:博士导师西蒙是AI先驱,又是经济学诺奖得主,西蒙的学生中,还有另一位人工智能的先驱人物:纽厄尔,1975年和西蒙一起荣获图灵奖。博士毕业后,费根鲍姆在加州大学伯克利分校的商学院任教五年,但他对当年的伯克利缺乏计算机科学项目感到十分不满,于是,在 1965 年,费根鲍姆穿过旧金山湾来到了斯坦福大学。
事实证明,斯坦福的环境更适合费根鲍姆的人工智能兴趣,他的经历也说明了环境对科研的重要性,适合的环境、志同道合的合作者,会使科学家如鱼得水。你别看如今AI很热门,在60年前不是这个样子。即使是硅谷,那年头是晶体管和半导体等等公司争夺天下的年代,此外还有处于萌芽状态却颇具商业潜力的集成电路。而研究人工智能的人却没几个,所谓“思考机器”,实际上还只能算是少数几位科学家深藏心中的梦。
不过,斯坦福大学别出一格,真正研究AI的人数虽然不多,但愿意朝此方向思考的人物却不少。在约翰·麦卡锡等的带头倡议下,从1964 年开始,旧金山湾区少数几个对机器智能感兴趣的人,开始每月在斯坦福举行一次聚会。
费根鲍姆十分强调“知识”对思考的重要性,到斯坦福大学后,他改变了研究方向,从计算机的认知模拟转向工程,即对计算机进行编程,使其不仅能与人一样聪明,而且还有可能比人聪明得多。费根鲍姆在斯坦福聚会上讨论他的想法时,有幸认识了斯坦福大学遗传学系主任莱德伯格。
图3:费根鲍姆在卡内基梅隆大学和斯坦福大学
约书亚·莱德伯格(Joshua Lederberg,1925-2008)是美国分子生物学家,主要研究方向为遗传学、人工智能和太空探索。他因为发现细菌遗传物质及基因重组现象而获得1958年诺贝尔生理医学奖,那年他才33岁。
莱德伯格比费根鲍姆年长11岁,同是出生于新泽西的犹太人。他的专业是遗传学,却曾经对符号计算以及类似人工智能的目标有过浓厚的兴趣。费根鲍姆谈到他对建造人工智能系统的一些想法,重新燃起了莱德伯格长期以来对计算的兴趣。当时费根鲍姆想选择一个领域来研究科学家对知识和经验的推理行为,莱德伯格立即给出了一个具体建议:从质谱中推导出分子拓扑结构的任务。因为莱德伯格正在指导一个项目,其目标是探索火星上的生命,为此莱德伯格的实验室正在测量氨基酸的质谱,他认为质谱分析是一项可以产生实际影响的有用的任务,经验丰富的化学家,利用他们关于化合物的质谱分析知识来猜测化合物的结构。并且,莱德伯格告诉费根鲍姆,他最近开发的一种“树突”算法,也许可以派上用场。
于是,两人一拍即合,1965年,他们开始聚集一支出色的团队,招募科学家及研究生参与该项目,开始了长达10年左右的DENDRAL专家系统开发的长期旅途。
刚得博士学位的布鲁斯·布坎南(Bruce Buchanan)以及两位硕士生首先加入其中,他们后来都在人工智能领域留下了自己的印记。
名为“专家系统”,专家的知识及经验积累举足轻重,费根鲍姆认为“知识蕴含力量”,这一主题很快浮出水面,成为DENDRAL及后来的专家系统项目的旗帜。对DENDRAL来说,重要的是有机化学、拓扑学和质谱方面的知识,而莱德伯格的质谱知识还不够,必须另请专家!
其实,需要的专家近在眼前,他们看中了莱德伯格的朋友卡尔·杰拉西。
卡尔·杰拉西(Carl Djerassi,1923—2015),是保加利亚与奥地利裔美国化学家。他最出名的贡献是开发了口服避孕药,但他也是一位颇有声名的作家,是几本科幻小说的作者。他于1978年获得第一届沃尔夫化学奖。杰拉西是斯坦福大学质谱实验室的负责人,那当然是质谱分析领域专家中的专家。
为此两人设计了一个“圈套”:向杰拉西演示他们构建的DENDRAL的雏形:DENDRAL这位机器“专家”,能够对付简单的氨基酸,但是,对其他的化合物,例如酮和醇的族类,却表现得无能为力。原因是显而易见的,因为它没有“获取”这方面的有机化学家已经了解的化学知识,当时的DENDRAL对这些族的质谱几乎一无所知。这个演示对杰拉西太有诱惑力了,他不就是这方面的专家么,于是,杰拉西欣然同意参与到项目中,使得该程序在酮和醇方面的性能显着提高。
DENDRAL的四人团队中,布坎南的贡献也不容小觑,他是LISP程序专家,并且有他的特殊兴趣:他希望系统能够“自己做出发现,而不仅仅是帮助人类做出发现”。因此,DENDRAL被设计为由两部分组成:“Meta-Dendral”和“Heuristic Dendral“,前者是一个“假设制造者”,后者将作为知识丰富的学习系统的模型,可作为模板用于其他领域。
专家系统的意义
第一个专家系统DENDRAL诞生了,在不断完善的过程中,该计划处理了数百甚至数千数万个案例[2]。DENDRAL是一个化学分析专家系统,保存着化学家的知识和质谱仪的知识,可以根据给定的有机化合物的分子式和质谱图,从几千种可能的分子结构中挑选出一个正确的分子结构。不过,专家就是专家,仅仅拥有某一特定领域专家的方法和知识。DENDRAL程序,对于某些分子家族,即使与人类的最佳表现相比,它也是该领域的专家。但是,专家不能通吃,某个领域的专家很难转移到其它专业。例如,国际象棋大师不太可能是专业的代数学家或专业的质谱分析师。
DENDRAL的经验为下一个专家系统的创建提供了信息,MYCIN,帮助医生诊断血液感染。因此,DENDRAL的研究成功被认为是人工智能研究的一个历史性突破。
上世纪70-80年代,专家系统从实验室出现并进入市场,“专家系统”这个短语开始流行,很快地在各个地方使用。专家系统成为最早真正成功的人工智能软件形式之一,是第一个成功的商业人工智能产品,在许多制造业和军队中都发挥了作用。专家系统的成功不仅验证了费根鲍姆关于知识工程的理论的正确性,还为专家系统软件的发展和应用开辟了道路,逐渐形成具有相当规模的市场,其应用遍及各个领域、各个部门。
正如人工智能历史上一次又一次的新突破一样,专家系统这个“新事物”,在20世纪80年代产生了大量的炒作,得到一些令人兴奋但却是错误的预测,对其发展起了反作用。在20世纪90年代以后,“专家系统”一词逐渐从IT词典中消失,原因有多种,有人认为因为专家系统没有兑现其过度炒作的承诺,因而成为其成功的受害者。但是实际上,早在1983年[3],费根鲍姆就发现了导致它们最终消亡的“关键瓶颈”,是因为“扩大知识获取的过程非常艰苦,我们必须拥有更自动化的手段来取代目前非常繁琐、耗时且昂贵的程序。知识获取问题是人工智能的关键瓶颈问题。”
不过,正是专家系统的局限性,促使研究人员开发新型方法。他们开发了更高效、灵活和强大的方法来模拟人类决策过程,特别是具有反馈机制的机器学习和数据挖掘方法。
现代AI系统可以更容易地处理大量复杂数据(大数据)而吸收新知识,从而进行自我更新,这些类型的专家系统,后来被称为“智能系统”。
如今,费根鲍姆期待的“知识获取的自动化”最终实现了,但并不是通过他当时设想的方法,而是要归结于“机器学习”方法的使用,尤其是在网络出现之后,知识变成了可以通过互联网及其他方式访问的数字化实体,再通过机器学习以及近十年发展的“深度学习”方法,来挖掘和分析这些知识。所以,尽管专家系统这个名词现在不常用,但当年发展出来的若干概念和思想,已经融入到AI的血液里。
参考文献:
[1] “Interview of Edward Feigenbaum“,2012 Fellow,Interviewed by:Jon Plutte,CHM Reference number: X6409.2012
https://archive.computerhistory.org/resources/access/text/2012/06/102746203-05-01-acc.pdf
[2]Feigenbaum, E., & Lederberg, J. (1987). On Generality and Problem Solving: A Case Study Using the DENDRAL Program.
[3]Feigenbaum, E. (1983). Knowledge Engineering: The Applied Side of Artificial Intelligence.
0
推荐