多自主体系统是当前系统控制界研究的热点问题 . 在实际中, 自主体系统通常并不是在理想的环境下执行任务, 而是面临多源头、多层次和多变化的各类不确定性因素的影响 . 它们通过在微观层面上影响各自主体决策的正确性 , 从而在宏观层面上对多自主体系统的整体行为产生显著影响 . 不确定性因素和多自主体系统的分布式信息架构交互耦合 , 给系统的设计与分析带来本质性困难. 《多自主体系统的分布式估计与控制》围绕分布式估计与分布式控制问题 , 研究在随机通信噪声、数据丢失、量化效应和系统未知结构参数等不确定因素影响下 , 如何为各自主体设计更加鲁棒、更加有效的分布式估计算法及分布式控制律 , 以实现全局估计与控制目标.
第1章绪论
多自主体系统是目前系统控制界的热点研究,在生物系统、经济系统、社会系统中有大量应用实例和许多亟待解决的问题.本章首先介绍多自主体系统的研究背景,对多自主体系统及其研究特点进行总结;然后针对与本书研究密切相关分布式估计、分布式控制和分布式自适应控制领域中的热点问题,对多自主体系统的分析与综合等方面的研究现状进行概括;*后,简要介绍本书的研究工作和主要成果.
1.1研究背景及意义
近年来,由于计算机、通信、微电子等技术的飞速发展以及多学科交叉研究的不断深入,多自主体系统吸引了来自生物学、物理学、经济学、计算机科学和系统控制科学等领域的众多学者,掀起了理论研究与实际应用的热潮.例如,在生物学领域,鸟群、鱼群、蚁群、企鹅等生物通过自发的个体行为集聚成宏观有序的集体行为,表现出单一个体所不具备的群体智能,保证了个体在觅食、交配、逃避天敌等活动中获得单独行动时无法取得的收益,从而实现群体利益**化[1.5].在社会经济学领域,专家学者采用多自主体系统建模方式对群体自组织现象进行解释,如人群的恐慌性逃跑、交通拥堵、股票市场涨跌、选民投票等[6.8].在控制科学与工程领域,由于多自主体系统能够通过通信与协作完成单个体系统无法完成的任务而被广泛应用,如多机器人灾场营救、卫星簇编队、传感器信息融合等[9.11].在计算机科学与工程领域,分布式计算在提高网络服务质量、网络资源利用率等方面发挥了巨大作用[12,13].
什么是多自主体系统?事实上,多自主体系统至今未有统一的、严格的定义[14].一般来讲,多自主体系统是由一个个相互间或与环境进行交互作用的自主体构成,而每个自主体是具有感知能力并可以作出反应的实体.它可以是人、机器人、小卫星、计算机程序,抑或是生命组织.从不同领域学者的研究可以看出,多自主体系统一般具有如下特点[15,16]:①自主性,即每个自主体具有一定的自主决策能力,能够通过自身有限的感知、计算和通信能力实现自身目的;②自理性,即每个自主体具有各自行动目标和利益准则,并基于利益**化的准则进行行动;③分布性,与集中性相对,是指系统中不存在统一的中央控制器收集各自主体信息,每个自主体仅能利用自身及邻居自主体的局部通信信息来调整自己的行为.
多自主体系统为何受青睐?除了其重要的应用前景之外,更重要的在于该课题的研究为人们提供了一个认识各种信息处理和控制系统的全新视角[17].在传统的控制理论中,系统由单一的传感、控制单元以及被动接受控制信号控制的被控对象组成,而在多自主体系统理论中,系统由处于不同层次的自主体构成.在同一个层次中,不同自主体间的地位是平等的,一个自主体是作为控制器还是作为被控对象依看待问题的角度而定.自主体甲对自主体乙的信息传输,在甲看来是对乙的某种控制信号,而在乙看来则是甲的某种信息反馈.任何一个自主体在控制其他自主体的同时,实际上也接受了其他自主体的控制,前向的控制过程和后向的反馈过程都只是不同自主体间通信过程的一个有机组成部分,这里,控制系统和通信系统完全融合为一体,不同自主体间的控制和协作过程就是彼此的通信过程.
综合来看,多自主体系统建模具有如下优点[18]:①一些领域建模的需求.多自主体系统是对由“行为”实体构成的系统的*自然描述,特别是行为个体具有不同(可能冲突)的行为目标和专有信息的情形②并行性.多自主体系统可以将一个任务分解,并行进行多个较容易完成的任务,从而可以提高任务完成的速度③鲁棒性.多自主体系统通过将控制任务充分地分配给多个个体,提高了系统对差错的容忍度,使得个别自主体的差错不会令整个系统崩溃④可扩展性.多自主体系统模块化的建模方式使新个体可以灵活进出,从而扩展了系统处理任务的能力.在某些具体领域的研究中,多自主体系统也发挥着极其重要的作用.社会科学和生命科学领域认为智能不可避免地与交互作用联系在一起,而多自主体系统对阐明这一基本问题有重要意义[19].多机器人系统利用地理分布性从多位置同时进行观测和行动,相对单机器人具有更好的性能/成本比[20].
1.2研究现状
通过研究分析社会经济学、系统控制、生物学等领域众多案例,我们可以归纳出多自主体系统领域的重要研究课题之一,即如何通过各自主体间的微观、局部行为实现多自主体系统的宏观、整体行为.目前,多自主体系统的理论研究主要涉及两方面:一是系统分析,即研究宏观层面的群体行为是通过怎样的局部相互作用导致的;二是系统综合,即研究如何设计分布式控制律和分布式估计算法影响个体的行为模式与相互作用方式,进而实现群体宏观目标.从理论分析的角度来讲,多自主体系统综合的出发点在于它扩展了任务处理的维度,不仅可以利用时间域上系统动态的演化或迭代,还可以利用空间域上自主体间的协作信息来有效提高系统性能.下面我们从多自主体系统的分布式估计、分布式趋同控制和分布式自适应控制三条主线出发,系统梳理本书涉及的相关热点问题的研究现状与进展.
1.2.1分布式估计
分布式估计问题研究的重要驱动力之一来自于传感器网络广泛应用的现实需求.传感器网络是由大量空间上分散分布的,具有一定传感、计算、通信能力的电子器件组成.随着微型传感技术、微机电系统技术和现代通信技术的飞速发展,传感器网络机动性强、容错性好、精度高、成本低及易布置等优点促使其实际中得到了广泛应用,如森林火灾监控、机器人灾区救援、飞机军事侦察等[21.25].
分布式参数/状态估计是传感器网络研究面临的一个基本理论问题,它是基于如下的实际应用需求提出的.一方面,由于传感器网络中各传感器的传感能力有限,仅能感知、观测到未知参数的部分信息,若只利用自身局部信息进行参数估计,往往不足以保证对未知参数全部信息的可观测性;另一方面,考虑到每个传感器具有有限的通信能力,它与其邻居传感器可进行局部通信.因此,自然的想法是,能否基于各传感器获取的局部观测信息,以及传感器间的局部信息交换,设计可扩展性强的分布式估计算法,通过传感器间的协作完成对未知参数的估计.与传统的基于信息融合中心的集中式参数估计算法相比,分布式估计算法通过传感器间的协作提高了整体的可观测能力,极大降低了传感器的通信和计算成本,并且对单个传感器的失效更具鲁棒性,提高了传感器网络的整体存活时间.因此,分布式估计理论研究得到人们越来越多的研究,尤其是当外界环境存在各种不确定性时,设计鲁棒性好、精度高的分布式参数估计算法成为传感器网络应用的迫切需要.
趋同型分布式估计算法是近来研究较多的一类算法.虽然形式各异,但都包含了一个体现传感器间相互协作的趋同机制,以期达到如下的目标:趋同机制的分布式协同性使算法对通信噪声、观测噪声、通信失效等不确定性因素更具鲁棒性,提高参数估计的可靠性.趋同机制对传感器网络信息的“凸平均化”,对于提高算法收敛速度和抑制噪声能力具有积极的作用.文献[26]、[27]考虑了由N个传感器节点组成的传感器网络,每个传感器对未知参数向量θ的局部观测由回归模型描述:
通过设计如下随机逼近–趋同型分布式估计算法:
可以保证各传感器的参数估计θ.i(t)均方收敛到参数真值,其中P=[Pij]1.i,j.N为随机矩阵,即满足P1N=1N.式(1.2.1a)采用通常的梯度型随机逼近算法进行局部预估计,得到局部预估值θ.i(t).与文献[28]、[29]通过对预估值在时间域上进行平均化来提高随机逼近算法性能不同,式(1.2.1b)采用趋同算法在空间域上对各节点预估值进行“凸平均化”,以提高算法对付各类不确定性的能力以及算法收敛速度.文中考虑了独立随机通信噪声、通信拓扑独立随机切换等不确定性因素对算法收敛性的影响.
文献[30]、[31]提出了增量型分布式参数估计算法,这类分布式算法具有良好的收敛速度及稳态估计误差,但估计信号在传感器间的顺序传输要求通信拓扑中含有Hamiltonian环,致使此类算法机制不适合大规模传感器网络.为避免这一问题,并改善算法的可扩展性,文献[32]、[33]提出了基于扩散策略的算法,但为此付出了较大的通信成本.文献[34]~[36]通过定义“桥”传感器子集合,将全局凸优化问题转化为便于分布式应用的约束等价形式,并采用分布式优化方法[37],分别得到了分布式*小二乘算法[34],以及分布式*小均方算法[35].在无环境噪声的条件下,证明了算法以指数速度依概率1收敛到未知真实参数,但若存在观测和通信噪声时,所设计的算法仅能保证参数估计误差的大多数轨道在一有界区域,即弱随机有界性.文献[38]分别针对线性和非线性观测模型,在量化误差及随机信号丢失等不可靠通信因素影响下,设计了随机逼近型分布式估计算法,分析了算法的渐近无偏性、强一致性(几乎处处收敛性)以及渐近正态性.文中,为使量化误差具有良好的统计性质,在待传输信号量化前加入了随机激励信号;此外还要求随机通信拓扑图的Laplacian矩阵序列是独立同分布的,这蕴含着要求通信信道的随机失效在时间域上是独立的.
关于分布式Kalman滤波算法的设计与分析可参见文献[39]~[42],此时要求每个传感器的状态模型和观测模型都已知.
1.2.2分布式趋同控制
分布式趋同控制问题是分布式控制领域的一个基本问题,研究如何为各自主体设计基于局部信息的分布式网络协议,使得自主体的状态趋于某个共同值.趋同控制已在很多领域中得到广泛应用,如前一节中的分布式估计,以及聚集[43]、队形控制[44,45]、分布式计算[13]、传感器信息融合[46,10]等.趋同性问题的研究可追溯到20世纪七八十年代的统计科学和计算机科学领域[47.49].系统控制界对趋同性问题的研究主要是源于对多自主体系统的集体行为以及分布式协作任务的研究Vicsek等通过研究非平衡系统中的聚类、相变以及群体动物的聚集等行为,于1995年提出著名的Vicsek模型[50].具体来说,每个个体以相同的速率在平面内运动,而每时刻的运动方向θi则根据如下的“*近邻居规则”进行更新:其中Ni(k)为k时刻第i个个体的邻居集合,wi(k)为k时刻对个体i的噪声干扰.仿真表明所有个体的前进方向*终趋于一致,验证了基于简单的规则可以产生复杂的集体行为.
2003年,Jadbabaie等对Vicsek模型进行了线性近似,给出了个体速度方向实现趋同的一个充分条件,即网络拓扑的联合连通性[51].Olfati-Saber和Murray在有向拓扑下,针对一阶积分型离散时间模型
和一阶积分型连续时间模型
设计了基于局部信息的加权平均趋同协议
给出了多自主体系统实现平均趋同的充分必要条件[52].文中也分析了网络拓扑时变和通信时延对系统性能的影响.
自此之后,系统控制理论界掀起了对分布式趋同问题研究的热潮,涌现出众多研究成果.总的来说,主要围绕以下几个方面展开研究:①自主体系统动态结构的复杂程度,即自主体系统是由一阶模型,还是高阶模型描述[53,54];是由线性模型描述,还是非线性模型描述[55,56];各自主体是同质的,还是异质的[57,58].②通信网络受到不确定性因素的影响,如随机通信噪声[59.62]、异步采样[63]、数据丢失[64]、量化[65.67]、时延[68]以及网络拓扑时变[69.71]等,这些不可靠因素大大降低了自主体间通信信息流的传输质量和准确度,进而对自主体系统的整体行为产生重要影响③趋同目标的差异.当趋同值是所有自主体初始状态{x1(0),???,xN(0)}的N元函数值χ(x1(0),???,xN(0))时,称为χ-趋同[72,75].当趋同值不再是常数,而是随时间变化的量时称为动态趋同,如跟踪控制[73.76]、领导者–跟随者型趋同[77,78]、牵引(pinning)控制[79]均属于这一范畴④对趋同算法性能的分析,如关于通信拓扑和信道权重的收敛速度估计[80,52,81],以及实现**收敛速度时的通信拓扑和信道权重设计问题[82,83]等.
此外,在对分布式趋同问题的讨论中,通信
……