作为世界三大尖端技术之一,人工智能(ArtificialIntelligent)自1956年诞生之日起,就成为科学发展史上一颗令人瞩目的新星,吸引着无数科学工作者从事相关的研究与创造。
人工智能是一门新理论、新技术、新方法和新思想不断涌现的前沿交叉学科,与计算机科学、控制论、信息论、神经生理学、哲学、语言学等密切相关,研究领域除了经典的知识表示、启发式搜索理论、推理技术、人工智能系统和语言之外,还涉及专家系统、自然语言理解、机器学习、博弈、机器人学、模式识别、智能检索、自动程序设计、数据挖掘、计算机视觉、分布式人工智能、人工神经网络、智能控制、智能决策支持系统、智能电网等领域,相关研究成果也已广泛应用到生产、生活的各个方面。
我们所处的时代是知识爆炸的时代,各种海量信息充斥着世界各个角落,而仅仅依靠人类自身,很难实现对这些信息的有效处理。人工智能作为一门研究和制造智能机器或智能系统的学科,目标在于模拟和延展人类的智能,这与当今时代发展的需求是不谋而合的。因此,培养更多高水平的人工智能技术人才迫在眉睫。
本书是一本综合、全面、实用的教材,反映了作者多年来的教学思路和经验,具有内容全面、重点突出、层次分明、特色鲜明等特点,具体体现在以下各方面。
(1)内容全面。本书详细介绍了人工智能研究中的经典理论和方法,而且对专家系统、机器学习、模式识别、分布式人工智能等也有较为全面的概括和说明,有利于帮助相关读者充分掌握人工智能的基本理论,并为其后续深入研究奠定扎实基础。
(2)重点突出。本书定位为人工智能的入门级教材,因此重点放在启发式搜索、推理、知识表示、人工智能系统和语言等经典理论、方法和技术,并对如模式识别、多智能体、机器学习等发展相对成熟的人工智能热点和重点研究领域有较为全面的介绍和说明,有助于读者循序渐进地了解这门学科。
(3)层次分明。本书在章节安排上结合了智能系统构建的过程,首先介绍知识表示技术和方法,然后引入各种搜索技术、推理技术和其他研究热点,*后通过实例对人工智能的应用详细说明,层次分明,有利于帮助读者理解这一学科的发展研究初衷。
(4)特色鲜明。电力行业是关系国计民生的基础性行业,随着电力市场化以及电网建设的进一步发展,人工智能相关技术对电力信息化、智能化发展的重要促进作用也逐步凸现,编者结合自身的研究工作,对近年人工智能在电力系统中的应用进行了介绍,特色鲜明,尤其适合具有“大电力”研究背景的读者。
读完本书并且亲自动手实践了书中的人工智能程序之后,读者将能够做到以下几点。
(1)熟悉人工智能的发展概况、研究内容和应用领域等,对人工智能这个学科有较为全面和深入地理解。
(2)扎实地掌握人工智能的基础理论、基本原理和经典算法等,具备运用基本人工智能方法解决实际问题的能力。
(3)熟悉人工智能的研究热点和*新成果,了解应用人工智能技术解决实际问题的基本思路,掌握一定的人工智能新技术和新方法,能很快地开展相关领域的深入研究。
本书共11章,在内容安排上可以划分为三大部分。*部分详细介绍了人工智能的核心研究课题,第二部分阐述了一些人工智能的基本技术和方法,第三部分介绍了人工智能在实际生产生活中,尤其是在电力行业中的应用,内容编排体现了人工智能这一学科的发展脉络。第1章为绪论,介绍了人工智能的基本概念、发展历史、研究目标、研究途径以及研究领域等。第2章为知识表示,讨论了人工智能的典型知识表示技术,以及基于这些知识表示技术的推理方法等。第3章为搜索策略,主要讨论状态空间图的盲目搜索、启发式搜索、与/或图搜索和博弈树搜索等。第4章为逻辑推理,对命题逻辑、谓词逻辑、非单调逻辑、多值逻辑和模糊逻辑及其推理技术作了介绍,重点给出了归结原理的基本原理和应用方法。第5章为不确定性推理,讨论了确定性理论、主观Bayes方法、证据理论、贝叶斯网络、模糊推理等不确定性推理技术。第6章为专家系统,给出了专家系统构建的基本原理、方法和实例。第7章为机器学习,讨论了有关机器学习的基本概念,以及一些重要的机器学习方法,主要包括决策树学习、变型空间学习、基于解释的学习、人工神经网络和进化计算等。第8章为模式识别,主要介绍统计模式识别方法,并对其他模式识别技术如结构模式识别方法、模糊模式识别方法、神经网络识别方法加以概述。第9章为Agent和多Agent系统,从分布式人工智能的概念出发,介绍Agent基本理论、多Agent系统的体系结构、通信机制以及协调协作机制,为分布式系统的分析、设计、实现和应用提供解决方法。第10章为人工智能程序设计语言,对人工智能程序设计语言的研究发展进行了概述,并详细讨论了LISP和PROLOG两种程序设计语言。第11章为人工智能在电力系统中的应用,给出了人工智能在电力系统故障诊断、电力巡检和电力大数据分析中的应用实例。
本书参编人员包括鲁斌、刘丽、李继荣和姜丽梅。在本书编写过程中参阅了国内外大量的文献资料,在此谨向这些文献的作者表示由衷的敬意和感谢。
由于编者水平有限,尤其是人工智能这门学科发展很快,不断有新的技术和方法涌现,书中难免有不足之处,恳请广大读者批评指正。
本书可用作高等学校计算机类和电气信息类相关专业高年级本科生和研究生的教材或教学参考书,也可供其他教学、研究、设计和技术开发人员参考。
编者
2017年3月
第5章不确定性推理
在科学研究和日常生活中,人们曾经一度追求用某一确定的数学模型来解决问题或表征现象,但逐渐发现大多数情况下并不具有这种确定性和清晰性。事实上人脑中的大多数概念和经验都没有明确的边界,不确定性是客观存在的,它在专家系统、乃至人工智能的很多研究中都是不可避免的。
5.1概述
从上一章的学习中已经知道,推理就是从已知事实出发,运用相关知识推出结论或者证明某一假设成立或不成立的思维过程。其中,已知事实也称为证据,用于指出推理的出发点;知识则是推理得以进行并*终达到目标的依据。
确定性推理中,已知事实和规则都是确定性的,推出的结论或证明了的假设也都是确定性的,它们的真值或者为真,或者为假,是非真即假的刚性存在,如上一章讨论的归结原理就是建立在经典逻辑基础上的确定性推理。
本章将要讨论的不确定性推理则不然,对于已知事实和规则、推出的结论等,它们的真值都是柔性的,可能为真、可能为假,这与现实世界中事物及事物之间关系的复杂性是对应的。不确定性推理也是众多推理技术中非常重要的一种。
5.1.1不确定性推理概述
人工智能的本质是要构建一个智能机器或智能系统,来模拟、延展人的智能,而这个智能系统的核心就是知识库。在这个知识库中,包含了大量具有模糊性、随机性、不可靠性或不知道等不确定性因素的知识,采用标准逻辑意义下的推理方法很难达到模拟延展人类智能的目的,因此,不确定性推理方法应运而生。
不确定性推理一直是人工智能与专家系统的一个重要的研究课题,相关学者也提出了多种表示和处理不确定性的方法。例如,考虑到随机性是不确定性的一个重要表现形式,而概率论作为研究随机性的一门学科已经有很深厚的理论发展,因此概率论是解决不确定性推理问题的主要理论基础之一;贝叶斯网络由于其广泛的适应性和坚实的数学理论基础,成为表示不确定性专家知识和推理的流行方法;同属概率推理的主观贝叶斯方法被成功应用于著名专家系统PROSPECTOR;结合专家系统MYCIN的开发提出的确定性理论在20世纪70年代非常有名;作为经典概率论的一种扩充形式,证据理论不仅在人工智能、专家系统的不确定性推理中得到广泛应用,还被用于模式识别领域;扎德提出的模糊逻辑理论也被应用在不确定性推理、智能控制等方面。
不确定性推理是建立在非经典逻辑基础上的一种推理,它是对不确定性知识的运用与处理。严格地说,不确定性推理就是从不确定的初始证据出发,通过运用不确定的知识,*终推出既保持了一定程度的不确定性,又合理或基本合理的结论的推理过程。
在第4章中介绍的确定性推理是一种单调性推理。单调推理系统是指,在基于谓词逻辑的系统中,随着新命题的加入(包括经过系统推出的),系统中的真命题数是严格增加的,而且新加入的命题与系统已有的命题是相容的,不会因为新命题的加入而使旧命题变得无效。
在进行不确定性推理时,推出的结论并不总是随着知识的增加而单调增加的,其研究还涉及非单调性推理。非单调性推理系统是指,在非单调系统中,一个新命题的加入,可能会导致一些老命题为假。非单调推理系统模型适合以下3种情况。
(1)知识不完全情况下要求进行默认推理的系统。
在知识不完全的情况下进行推理或判断,通常可以借助一些经验或知识。例如,假设约翰要去朋友杰克家吃饭,在经过路边的花店时,对于“杰克的太太珍妮喜欢花吗?”这个问题,约翰可能没有任何头绪,但考虑到一般的知识“大多数女人都喜欢花”,约翰就买了一束鲜花,打算送给珍妮。如果珍妮喜欢花,她会非常高兴。然而,如果珍妮看到花,突然打起喷嚏来,说明约翰以前的假设“珍妮喜欢花”是错误的,应该撤销掉,因为珍妮的行为说明她对花粉过敏。
(2)一个不断变化的世界必须用适应不断变化的知识库来描述。
在非单调系统中,应该对知识库的一致性进行维护。一旦新的命题加入引起了知识库的不相容,就应该取消某个或某些命题以及这些命题的一些推论命题,保证知识库的一致性。
(3)产生一个问题的完全解可能需要利用暂时假设的部分解的系统。
例如,教学秘书要找一个适当的时间使3个工作繁忙的教授能同时参加一个会议。一个方法是首先假设会议在某个具体的时间举行,如周二上午,并将此假设命题放入数据库中,再从3个教授的时间安排表中检查不相容性。如果出现冲突,说明假设的命题必须取消,代之以一个希望不矛盾的命题,再进行不相容性检查。如此进行下去,直到一个假设加入数据库后库中的命题是相容的,则这个假设就是问题的解。如果再也没有假设可以提出了,此时问题无解。当然,上述过程中一个假设命题被取消后,依赖于此命题而建立起来的所有命题都应被取消。
5.1.2不确定性的表现
在不确定性推理中,已知事实(或证据)、规则及推理过程在某种程度上都是不确定的,它们的不确定性主要表现在以下方面。
1.事实的不确定性
事实的不确定性主要表现在事实的歧义性、不完全性、不精确性、模糊性、可信性、随机性和不一致性上。
(1)歧义性是指证据中含有多种意义明显不同的解释,如果离开具体的上下文和环境,往往难以判断其明确含义。
(2)不完全性是指对于某个事物来说,对于它的知识还不全面、不完整、不充分。
(3)不精确性是指证据的观测值与真实值存在一定的差别。
(4)模糊性是指命题中的词语从概念上讲不明确,无明确的内涵和外延。
(5)可信性是指专家主观上对证据的可靠性不能完全确定。
(6)随机性是指事实的真假性不能完全肯定,而只能对其真伪给出一个估计。
(7)不一致性是指在推理过程中发生了前后不相容的结论,或者随着时间的推移或范围的扩大,原来成立的命题变得不成立了。
2.规则的不确定性
规则的不确定性主要表现在规则的前件、规则自身以及规则的后件几个方面。
(1)规则前件的不确定性主要是指规则的前件一般是若干证据的组合,证据本身是不确定的,因此组合起来的证据到底有多大程度符合前提条件,其中包含着不确定性。
(2)规则自身的不确定性是指领域专家对规则也持有某种信任程度,专家有时也没有十足把握在某种前提下必能得到结果为真的结论,只能给出一个可能性的度量。
(3)规则后件的不确定性是指基于不确定的前提条件,运用不确定的规则,得到的后件不可避免地含有不确定性因素。
事实上,从系统的高层看,知识库中的规则还可能有冲突,规则的后件也可能不相容,知识工程的目的就是要尽可能地减少或消解这些不确定性。
3.推理的不确定性
推理的不确定性主要是由知识不确定性的动态积累和传播造成的。为此,整个推理过程要通过某种不确定度量,寻找尽可能符合客观世界的计算,*终得到结论的不确定性度量。
5.1.3不确定性推理要解决的基本问题
在不确定性推理中,除了要解决在确定性推理过程中所提到的推理方向、推理方法、控制策略等基本问题外,一般还需要解决不确定性的表示方式与取值范围、不确定性的匹配算法及阈值的设计、组合证据不确定性的算法、不确定性的传播算法以及结论不确定性的合成算法等问题。对这些问题进行总结归类,大致可以分为3个方面,即不确定性的表示问题、不确定性的计算问题和不确定性的语义问题。
1.表示问题
表示问题是指用什么方法描述不确定性,这是解决不确定推理问题关键的一步。表示的对象一般分为两类,即知识和证据,它们都要求有相应的表示方式和取值范围。在设计不确定性的表示方法时,一般要考虑两方面的因素:一是要能根据领域问题的特征把不确定性比较准确地描述出来,以满足问题求解的需要;二是要便于在推理过程中对不确定性的计算。事实上,由于要解决的问题不同、采用的理论基础不同,各种不确定性推理技术在表示问题的解决上也各有侧重。
目前,在专家系统中知识的不确定性一般是由领域专家给出的,通常是一个数值,它表示相应知识的不确定性程度,也称为知识的静态强度。静态强度可以是相应知识在应用中成功的概率,也可以是该条知识的可信程度或其他,它的取值范围可以根据它的意义与使用方法的不同而不同。当然,知识的不确定性也可以用非数值的方法表示。
在不确定性推理中,证据主要有两种来源:一种是用户在进行问题求解时提供的初始证据,如医疗诊断专家系统中用户提供的病患症状、检查结果等,由于初始证据一般来源于观察,通常是不精确的、不完全的、模糊的,因此具有不确定性;另一种是在推理过程中得到的中间结果,会用作后续推理的证据,如医疗诊断时根据病患描述先将其划分至不同的科室就诊,由于中间结论也是基于不确定性推理得到的,因此包含不确定性。
证据的不确定性一般也是一个数值,它表示相应证据的不确定性程度,也称为动态强度。对于初始证据,其值由用户给出;对于中间结果,其值由推理中不确定性的传播算法计算得到。同样,证据的不确定性也可以用非数值的方法表示。
一般来说,为了便于推理过程中对不确定性的统一处理,知识和证据不确定性的表示方法应该保持一致。尽管在某些系统中,为了方便用户使用,知识和证据的不确定性用不同的方法表示,但这只是形式上的,在系统内部会做相应的转换处理。
在不确定性的表示问题中,除了要考虑用什么样的数据来表示不确定性,还要考虑这个数据应该具有的取值范围,只有这样数据才有确定的意义,不确定性的表示问题才算圆满解决。例如,在确定性理论中,用一个[-1,1]闭区间上的数据来描述知识或证据的不确定性,其值越大表示相应的知识或证据越接近于“真”,其值为1表示知识或证据必为真,其值越小表示相应的知识或证据越接近于“假”,其值为-1表示知识或证据必为假。
在设计不确定性的表示方式和取值范围时,应注意以下几点。
(1)表示方式要能充分表达相应知识及证据不确定性的程度。
(2)取值范围的制定应便于领域专家级用户对不确定性的估计。
(3)表示方式要便于对不确定性的传播的计算,计算出的结论的不确定性不能超过设计的取值范围。
(4)表示方式应该是直观的,同时有相应的理论基础。
……