第三章 推理系统的分类与应用
第一节 认知范畴与命题形式
康德在《纯粹理性批判》一书中,将先验知性分为量、质、关系、模态四大类共十二种范畴,其中量就是数数,质就是程度,关系就是次序,模态就是时间的包容性。逻辑最上面的根目录比较公认的是形式逻辑,但众多游手好闲之徒为了抢地盘吃饭又加了一个只是与论证修辞相关的非形式逻辑。
在形式逻辑之下,根据命题形式的不同又可以分为命题逻辑和谓词逻辑。前者以复合命题为研究对象,主要分析命题之间的关系。而后者主要把简单命题,又称直言命题中的元素分解成个体词、谓词、量词和连接词等成分,而个体词与量词可组合成命题中的原子命题。谓词逻辑也称一阶逻辑,是希尔伯特简化罗素《数学原理》中逻辑的结果,它只有语法,没有本体和语义,也就是没有关于特定世界的公理,因此哲学家、逻辑学家蒯因把逻辑等同于一阶逻辑。在他的眼里,高阶逻辑其实是“披着伪装的集合论”。为了建立严格的谓词逻辑演算系统,必须要有严格的形式化语言作为支撑。为此弗雷格建立了逻辑形式系统,一个包含字母,字以及关系组成的有限集合,我们常见的欧几里得几何、集合论、布尔代数其实都是形式系统。基于形式系统的逻辑研究是知识工程领域的重要内容,比如最著名的人工智能编程语言LISP就是以它作为基础而编制的。谓词逻辑中又将包括“可能与不可能、现实与非现实,必然性与偶然性”等使用模态判决算子表示的逻辑叫做模态逻辑。现代的模态逻辑是公理化、形式化的,其构成方式是在经典逻辑公理系统的基础上再添加模态算子和相关的模态公理,并以此来描述和界定“必然性”。“必然性”概念的界定与“可能世界”密切相关,在分析现实世界中事物的本质属性时,应限制可能世界概念的范围,摒弃现实世界中的非真实情形。
模态逻辑及其各种扩展,如时态逻辑、认知逻辑、动态逻辑、表述逻辑和行为逻辑等目前已在人工智能的知识表示与知识推理和计算机科学等领域得到广泛应用。特别地,时态逻辑语言LT由一般逻辑语句加上时态算子F,P,G,H组成,时态逻辑在不同时间,同一个语句可以有不同的真值。
第二节 逻辑学中推理的分类
逻辑学根据思维活动从前提到结论推理过程中的不同特点,将推理类型分为演绎推理、归纳推理、类比推理三类。演绎推理又分为模态与非模态两种类型,在模态推理中还有简单和复合两大类,分别包括直言判断、关系判断和联言、选言、假言、二难判断,以及假言联言推理、假言选言推理等等。
学术研究中占有统治地位的演绎推理是一种从一般性、普遍性认识推出个别性、特殊性认识的推理,欧几里德是第一个将以三段论形式表述的演绎法用于构建实际知识体系的人。欧氏几何学从五个公理出发,运用严格的演绎逻辑推导出众多的定理,再用这些定理去解决实际问题,为人类知识的系统整理与阐述提供了一种有效的模式。相比所创造的几何知识而言,其蕴含的方法论意义更加重大。归纳推理是一种从个别知识的前提推出一般知识结论的推理。主要是由个别事物的观点过渡到范围较大的观点,由特殊具体的事例推导出一般原理、原则的解释方法。从形态上看可以分为传统归纳推理(完全归纳)和现代归纳推理(不完全归纳),前者主要指简单枚举推理,科学归纳推理等,而后者主要指概率推理,统计推理等。归纳推理的前提是一些关于个别事物或现象的命题,而结论则是关于该类事物或现象的普遍性命题。例如黎曼猜想、哥德巴赫猜想等很多数学猜想的提出就是典型归纳推理的过程。麦克斯韦在得到电磁方程组的过程中同时应用了三种推理方法,堪称是一个集大成者的典范。他在1865年写了三篇文章,分别用归纳法、类比法和演绎法最终从数学角度证明了电磁波的存在,并成功预言了光是一种电磁波。后来,物理学家惠更斯运用类比推理的方法把光和声音进行了详细的比较,从它们之间具有的一些共性中推导出光具有波动的特性。
类比推理分为性质类比推理和关系类比推理,和归纳推理一样,类比推理也是一种或然性推理。作为论证说明的重要手段,它可以帮助我们找出两种不同事物之间的相似性和共有的特殊性,进而反向推导出两者之间的其他共有特性,有助于我们在事物的原有基础上推陈出新。
第三节 专家系统的结构原理
专家系统产生于20世纪60年代中期,是早期人工智能的一个重要分支,一般采用产生式知识表示和启发式推理技术来解决通常由领域专家才能解决的复杂问题,其核心是如何通过已有的知识推出新的知识与结论。它实现了人工智能从一般推理策略探讨转向运用专门知识解决问题的重大突破。
专家系统通常由人机交互界面、知识库、推理机、解释器、综合数据库、知识获取等6个部分构成。它能够利用某领域一个或多个专家提供的知识经验以及解决问题的方法进行判断推理从而解决复杂问题,其体系结构随自身的类型、功能和规模的不同而有所差异,尤以知识库与推理机相互分离而别具特色。知识库用于存取和管理所获取的专家知识和经验,具有存储、检索、编辑、增删和修改等功能。知识表示大体可分为基于逻辑、基于规则、基于语义网络和基于框架等四种方法。推理机利用知识库中的知识进行推理,求解专门问题,主要包括启发推理和算法推理两种形式,并可同时模拟人类思维过程中的正向和反向推理过程,根据任务需要随机切换且不断交替的使用以提高推理的效率。解释器作为专家系统与用户之间的人机接口,其功能是向用户解释系统行为的逻辑依据与推理过程。数据库用来存放系统推理过程中所需的控制信息、中间假设和中间结果。知识获取主要包括知识工程师采用“专题面谈”、“记录分析”等方式进行,所获取的知识经过整理后输入知识库。一个成功的专家系统必须具备领域专家级知识、模拟专家思维、达到专家级的水平等特征,目前已经可以完成包括预测、诊断、解释、调试、维修、规划、设计、监护、控制、教育等多种任务。
早期专家系统使用的经典逻辑包括形式逻辑和数理逻辑,其推理采用演绎逻辑推理,这种推理是单调的,逻辑值也都是二值的。但由于它的局限性无法解决许多实际应用问题,因此一些被称为非经典逻辑的新逻辑学派应运而生。非经典逻辑具有更多的逻辑运算符和逻辑值,因此经典逻辑中的许多运算法则在在其中不能成立。
第四节 专家系统流派的比较
我们在机器学习一篇中介绍过各种智能流派,而专家系统就属于符号学派。伟人教导我们说:“派外无派,江湖不败;派内无派,千奇百怪。”对专家系统中知识和逻辑两个概念更加准确的定义应该是语义和语法。实践证明,定理证明派纯粹依靠逻辑语法之力号令江湖的图谋力不从心,但如果加入问题求解派的知识语义后确实会提高效率。
美国人工智能的标准语言LISP是成熟的表处理函数式编程语言。从1965年到1968年,麦卡锡教主的门徒,美国斯坦福大学费根鲍姆教授成功研制了世界上第一个化学专家系统DENDRAL。欧洲学者也利用Horn子句可以计算所有递归函数这一逻辑结论研发了逻辑程序语言Prolog,后来科瓦尔斯基从谓词逻辑的角度证明了即使是Prolog中不完全的Horn子句仍可计算所有递归函数,他还提出过“算法=逻辑+控制”,有点类似于“程序=算法+数据结构”,“数学=逻辑+计算”之类空洞却响亮的口号。芝加哥大学哲学家卡尔纳普的兴趣是归纳推理,他深刻影响了神经网络的奠基者之一皮茨,司马贺也承认听老卡的课开始逻辑启蒙,并开始对智能相关的问题感兴趣,由于和逻辑定理证明派之间的冲突,他也批判过度数学化和形式化。这么看来,人工智能的符号逻辑和神经网络两大学派竟然都发源于老卡。达特茅斯会议中还有一位被后人忽视的“先知”所罗门诺夫也深受老卡的影响,他开创性研究了贝叶斯推理,提出了奇点的原型概念,并根据麦卡锡的“反向图灵机”和乔姆斯基文法,发明了“归纳推理机”。著名的ExSys是第一个商用专家系统,我国的第一个实用专家系统是由涂序彦教授领导开发的“关幼波肝病诊断治疗专家系统”。早期的专家系统通常都是针对某个单一应用领域,模仿单个专家,使用单一的知识表示与推理方法开发的,其缺陷包括知识获取的“瓶颈”问题和知识的“窄台阶”问题。
专家系统早期是逻辑学派的天下,但神经网络却是最新的当红花旦,其数据特性允许当环境和状态改变时通过对一组新的训练数据集合重新训练,而不用修改程序或重新构造规则,还可以使用专用神经芯片来提高推理速度。相信这种百花齐放的良性竞争能够帮助智能之光更加绚烂。
第五节 非单调逻辑推理与归纳联想
日常生活中经常发生新知识与已有知识之间的冲突,此时人们会修改已有知识,以适应对新情况的解释。传统逻辑系统是基于真这一概念,而常识推理则是基于合理这一基本概念,这种合理性依赖于认知的主体和目的。
为解决单调推理的局限性这一难题,非单调推理于上世纪70年代应运而生。所谓非单调推理,指的是一个正确的公理或事实加到理论T中,反而会使理论T中原先所得到的一些结论变得无效了,而寻求失效的结论是单调逻辑中不能解决的问题。非单调推理主要可分为模态非单调推理和缺省推理两类,它们对应的逻辑分别为模态非单调逻辑和缺省逻辑。非单调性即非演绎性,推理的合理性往往带有时效性和主观性,这种时效性与主观性体现出模态的特征,归纳推理、概率推理、和模糊推理都具有非单调性的特征。非单调推理随着新信息的出现,可以不断修正结论,这满足了常识推理的要求。非单调推理可以处理日常情景中所遇到的复杂推理问题,它作为形式化的一种逻辑方法,不仅描述了主体的认知状态,使我们能够形式地描述主体的思维活动,而且成功地捕捉刻画了人类推理过程中的非单调性;它不仅对人工智能研究的发展有所建树,而且对于扩展逻辑学的范围、推动逻辑学的发展都做出了贡献。基于缺省理论的缺省推理是在知识不完全的情况下,采用“默认”方法,使推理得以进行下去的推理。如果没有足够的证据证明某一命题为假,那么就先承认它为真。当新证据出现,且与默认命题相矛盾时,则撤销这一命题以及由此得出的全部结论,这就是缺省规则。
联想是由某一事物想到另一事物的心理过程,联想逻辑又称逻辑误推效应,也属于非单调推理,显性联想非单调推理包括全形式和缺省式;隐性非单调推理主要是通过联想,根据辞面作恰当的推测。比如言外之意的理解过程就是一个推理过程,不管是显性还是隐性联想,都需要接受者了解表达者表达时的认知语境,在此基础上才能作出恰当的推理,实现语境重译,真正理解言外之意。
第六节 高效的图网络归纳推理
人类智能的一个关键特征是“无限使用有限方法”的积木式能力,其中一小部分元素(如单词)可以以无限的方式(如新句子)有效地组合在一起。这反映了泛化组合归纳的原则,即从已知的构建块构造新的推论、预测和行为。如果AI要实现人类一样的能力,结构化的表示和计算就是实现这一目标的关键。
最近DeepMind联合谷歌大脑、MIT等机构的27位作者发表重磅论文,提出在“图网络”中,将端到端学习与归纳推理相结合,并探索如何在深度学习结构(比如全连接层、卷积层和递归层)中,使用关系归纳偏置,促进对实体、关系,以及组成它们的规则进行学习。人类的组合概括能力主要取决于我们表达结构和推理关系的认知机制,我们习惯将复杂系统表示为实体及其相互作用的组合。正如生物学里先天因素和后天因素是共同发挥作用的,因此“人工构造”和“端到端”学习也应该能够从它们之间的优势互补中受益。该论文提出了一个新的AI图网络模块,其框架定义了一类用于图形结构表示的关系推理的函数,具有强大的关系归纳偏置,为操纵结构化知识和生成结构化行为提供了一个直接的界面。它的框架概括并扩展了各种的图神经网络、MPNN、以及 NLNN 方法,并支持从简单的构建块来构建复杂的结构。但是如果用拟合路径来训练图谱,存在训练过程与过程结束后的评价两者的脱节。解决的办法是强化学习,它的精髓在于把最终的评价,通过回溯和折现的方法,给路径过程中每一个中间状态,评估它的潜力。但面临的困难在于当中间状态数量太多时,它的训练过程收敛困难。一个有希望的解决办法是用深度学习模型,来估算所有状态的潜力值。换句话说,不需要估算所有状态的潜力值,而只需要训练一个模型的有限参数。
如何构建表现出组合归纳能力的智能系统一直是AI结构化方法的核心,它们包括逻辑、语法、经典规划、图形模型、因果推理、贝叶斯非参数化和等等。而图网络理论上能够将图的一阶逻辑和概率推理结合到一起,有望高效解决关系推理和组合泛化,为更复杂、可解释和灵活的推理模式打下基础。
第七节 周易中的类比推理智慧
西方数理逻辑即符号逻辑的体系结构,大致包含三个组成部分:一是需要被讨论的对象语言,即人类使用的某种特定的符号语言;二是语法语言,这是在讨论对象语言时所使用的语言,这种语言又称元语言;三是元元语言,是讨论元语言时所使用的语言。
《周易》是一个名符其实的符号推理系统,其推理系统也包含有三个组成部分即三种语言,也可以借用西方符号逻辑中对三种语言的冠名加以表达。《周易》的对象语言包括卦象和爻象,不仅六十四个重卦都是需要讨论的对象,而且六十四卦中的每一个爻画也是需要讨论的对象。只有对所有的卦象和爻象都进行了讨论,我们才能真正理解《周易》这个符号系统。所以,六十四个重卦卦象及其爻象便是《周易》推理系统中的“对象语言”(相当于数理逻辑中的“符号集”)。读懂了这些对象语言,也就读懂了《周易》。《周易》语法语言包括六、九、初、上、阳爻、阴爻、内卦、外卦、经卦、复卦(重卦)、本卦、之卦、位、中、应、乘、承、据、比等等。这些既是《周易》推理系统中的基本概念,也是解读《周易》中的卦象爻象时必不可少的元语言。将这些元语言视为《周易》符号推理系统中的“语法语言”也是比较合适的。在《周易》符号推理系统中还有一种分量很重的自然语言,这就是卦名、卦辞、爻辞,这些自然语言是根据卦象爻象而写的,可以通过它们去认识卦象爻象所蕴含的意义。这自然使我们联想到西方传统逻辑中的那些自然语言与抽象的逻辑格式关系,因为人们正是通过自然语言的具体内容,理解到了直言三段论的六十四式中为什么只有十九种有效式等逻辑知识。综上所述,《周易》符号系统里的初始符号,不同于西方符号系统里的那些没有属性内容、绝对抽象的初始符号。由绝对抽象的初始符号构建而成的推理系统,具有演绎性质;而由属性明确的初始符号构建而成的推理系统,只能具有类比性质。《周易》类推的主要方法包括根据卦象进行类比推理、根据卦辞爻辞进行类比推理以及卦象、卦辞、爻辞相的结合推理。
人类思维对类比隐喻存在严重依赖,因此科学模型和知识结构就显得至关重要。如果能把优秀文学作品和数学物理等学科模型内化为自己的思维方式,类推这种思维方式就会带来更好的结果。
第八节 贝叶斯因果概率推理
为了提高人工智能领域常识推理的准确性,人们引入了概率理论。最早由Judea Pearl于1988年提出的贝叶斯网络实质上就是一种基于概率的不确定性推理网络,是Bayes方法的扩展,是一种不定性因果关联模型。
贝叶斯网络又称信度网络,是一个由代表变量节点及连接这些节点有向边构成的有向无环图。每个节点代表一个随机变量,这个变量可以是离散的、连续的或者同时包含离散和连续随机变量的混合节点。节点间的有向边代表了它们的互相关系(由父节点指向其子节点),用条件概率表达关系强度,没有父节点的用先验概率进行信息表达。节点变量可以是如测试值,观测现象,意见征询等任何问题的抽象。贝叶斯网络的因果推理是给定一组证据变量的赋值后,计算一组查询变量的后验概率分布,在计算过程中可以用消去求和变量的方法来避免重复计算,而且每次只考虑一个查询变量,当然也可以很容易扩展到有多个查询变量的情况。将贝叶斯网络运用到大规模、多连通网络中的精确推理是不实际的,这种情况下的近似推理可以结合蒙特卡洛剪枝算法,它能够给出一个问题的近似解,其精度依赖于所生成的采样点的多少,而采样可使用直接采样和马尔可夫链采样等两种方法。贝叶斯网络本身可以从不精确或不确定的知识或信息中做出推理,可应用于有条件地依赖多种控制因素的决策,是目前处理不确定知识表达与推理领域最有效的主流理论模型之一。它将多元知识图解为可视化的一种概率知识表达与推理模型,更为贴切地蕴含了网络节点变量之间的因果关系及条件相关关系。它用条件概率表达各个信息要素之间的相关关系,并能有效地进行多源信息表达与融合,可将故障诊断与维修决策相关的各种信息纳入网络结构中,按节点的方式统一进行处理,并将信息的相关关系进行融合。
老爷子最近一直在强调因果关系,批评神经网络和其它大数据中的关联性应用。但其实关联就是一种弱因果,因为如果我们能够把所有的关联都筛一遍的话,那概率最高的一条边不就是他说的因果关系吗?人们习惯于把苹果往地上掉说成是引力的后果,但会不会也是由于这个苹果离太阳太远呢?也许现实世界中的绝对因果是不存在的。
第九节 筚路蓝缕的第五代计算机
上世纪八十年代,日本通产省决定开始建造第五代计算机,其终极目标包括在当时语境下特指的专家系统和自然语言理解的知识信息处理,并计划突破电脑所谓“冯·诺依曼瓶颈”。这是日本版的从制造大国到经济强国转型计划,他们认为日本已经进入“无人区”,必须搞“双创”。
日本在《第五代计算机系统初步报告》中提出了逻辑程序机、函数机、关系代数机、抽象数据类型机、数据流机和创新冯诺依曼机等六种先进体系结构。这种机器将以Prolog为机器的语言,其应用程序将达到知识表达级,具有听觉、视觉甚至味觉功能,能够听懂人说话,自己也能说话,自然语言识别率达到95%。能认识不同的物体,看懂图形和文字。人们不再需要为它编写程序指令,只需要口述命令,它自动推理并完成工作任务。五代机计划最终目标是组装1000台要素信息处理器来实现并行处理,解题推理速度达到每秒10亿次;与此相连接的是容量高达10亿信息组的数据库和知识库,包括1万个日语和外国语言的基本符号,以及语法规则2000条,可以分析95%以上的文章等等。由于定理证明存在无法避免中间子句指数爆炸式的增长的困难,逻辑程序其实是自动定理证明的“歪打没正着”的副产品。进入七十年代,人们开始研究线性归结证明模式,即整个定理证明过程沿着一条主线(中央子句),这样的优点是证明过程是类似于人的目标制导。由于那时的自然语言理解还是规则为王的时代,Prolog很明显比LISP更适合这些应用。而且在小规模数据的基准测试中,Prolog作为数据库查询语言甚至不用输关系代数。 1992年6月,ICOT展示了它研制的五代机原型试制机,由64台处理器实现了并行处理,已初步具备类似人的左脑的先进功能,可以对蛋白质进行高精度分析,而且还在基因研究中发挥了作用。
1992年,因最终没能突破关键性的技术难题,无法实现自然语言人机对话、程序自动生成等目标,导致了该计划在最后阶段的流产。“五代机”的命运是悲壮的,有人说日本失去的30年是《广场协议》的结果,但以过度自信的政府计划完全代替企业之间的良性竞争可能也是重要原因吧。应该时刻保持谦虚与敬畏,不可妄言弯道超车,否则就很容易变成“非物质文化遗产”哦。
第十节 医疗诊断的专家系统及发展
1971年斯坦福大学的硕士研究生Shortiffe等人成功研制了血液感染病医疗诊断系统MYCIN,而现在IBM公司的Watson已经能在几秒内筛选数十年中产生的150万份患者病历和治疗效果,为医生提供可选择的循证治疗方案。它还与Medical Sieve技术相结合,使原本仅擅长从文本信息中进行自我学习的Watson系统具有医学图像高速处理和分析的能力。
医学专家系统是一个具有大量专门知识与经验的程序系统,MYCIN是专门针对有关传染病诊断和治疗的咨询系统,肖特利夫把大量传染病专家长期积累的知识知识归纳成200多条规则(后扩充至500多条)存放在计算机中,它能教会不擅长诊治传染病的医生,怎样从患者症状出发,确定病的种类及相应的治疗方法。我们知道,传染病种类繁多,与其相应的抗生素种类也不少。要在限定的时间内确定病症,选择出恰当的治疗方法决非易事。MYCIN系统中存放的规则都具有“如果…那么…”这种形式,当系统获得一个数据且与某个“如果…”相一致时(称为匹配),则相应的“那末…”就代替了该数据,再继续搜寻是否存在与这个新数据匹配的“如果…”。这样一个过程含有“产生”、“做出”的含义,因此获得“产生式规则”的名称。当使用MYCIN进行医疗诊断时,医生将病人数据送入计算机,系统将外来数据不断与内部知识进行匹配,直到获得最终结果。Babylon Health 创立于 2013 年,目前的注册用户超过1000万人次,每天提供约4000次的临床咨询服务。就连英国NHS都已经引入了其聊天triage APP作为非重症急病病人在 111 帮助热线之外的咨询方式,它能够提供给用户关于症状缓解的一些基础性建议,而对于其中有就诊需求的用户还能够完成“分诊建议”。在2020年早些时候,Babylon 已经和一些医疗权威合作来帮助自己的聊天机器人 “triage” 进行深度学习。
中医学关于辨证论治中的“证”具有主观性比较强的特点。过去数十年间,通过实验研究和临床观察,积累了大量关于症状表现及用药的丰富资料。如果将其作为人工神经网络模型的基本输入,让机器根据以往的学习经验提出中医诊断方案,就有望帮助更多的中医专家系统从学术研究进入临床应用。