神经网络自适应PID控制及其应用

总结来自重庆大学宋永瑞教授2022暑期校园行学术会议

1. 研究背景

  目前人工智能的发展为很多领域里的研究提供了可延展性,提供了新的研究问题的思路,无人系统和人工智能正走向深度融合,无人系统里具有核心驱动作用的智能控制算法的研究成为了热点问题。
人工智能的理论深度依赖人工神经网络,而人工神经网络又是人工智能的核心支撑,先进的控制系统实现了可靠的无人系统的底层支撑,当人工智能与无人系统深度融合时,可以使得实现一个可信、可靠、通用、普适的神经网络驱动的控制系统变得具有很强的可行性,所以,智能无人系统的一个热点就是聚焦于神经网络驱动的控制系统功效性及可靠性的研究。

2. PID

2.1 PID控制器系统简介

  PID算法是控制工程中的一种经典控制理论,其在控制系统中作用效果明显,适用范围广,在目前的实际工程应用中仍然是一种影响力最大适用最多的控制系统。

神经网络整定pid参数 rbf神经网络pid控制_控制系统


  PID控制器中的P指的是Proportional,即比例,反映参数为比例因子,是对输入到目标趋近速度影响最大的因子,其线性控制系统的驱动;I指的是Integral,即积分,反映参数为积分因子,是对于误差的累计,从而根据之前的误差来修正本次误差的修正;D指的是Derivative,即微分,反映参数为微分系数,是对于抑制误差的修正,防止过度修正和稳态误差的形成。

2.2 PID对于人类智慧的类比

神经网络整定pid参数 rbf神经网络pid控制_人工智能_02为比例部分的调节描述,神经网络整定pid参数 rbf神经网络pid控制_人工智能_03为比例系数,确定参数后,系统将会根据输入与目标差值相关的误差,进行按照比例系数线性调节系统,使得系统能够快速的接近目标值,这部分的调节类似于人类的奖惩机制,当误差大时,比例参数的作用就会大,系统变动大,当误差小时,比例参数的作用相对会小,对系统的调整输入量就会变小一些,当误差为正值的时候,其修正量为正继续修正,当误差为负值时,系统的修正量就要为负值,适当拉回过度修正的表现值,当系统误差为0时则比例部分不会做修正;当神经网络整定pid参数 rbf神经网络pid控制_神经网络_04为积分部分的调节描述,神经网络整定pid参数 rbf神经网络pid控制_神经网络整定pid参数_05为积分系数,此部分将每次的误差进行累计,在积分部分,此前系统的每一次误差都对系统有贡献,积分项蕴含了人类的记忆、经验、总结的机制,对之前所修正的每一次输入的误差都进行了考量,从而防止了稳态误差的出现,累加误差的过程就是吸取经验和教训的过程;神经网络整定pid参数 rbf神经网络pid控制_控制系统_06为微分项部分的调节描述,神经网络整定pid参数 rbf神经网络pid控制_人工智能_07为微分系数,此部分将对误差进行微分,以此来根据误差的变化趋势进行适当的修正,微分部分的蕴含了未来信息、预测机制,一定程度上可以防止过度修正情况的发生。
综上所述,一个PID控制器就是一个人类奖惩+记忆(经验)+预测(预判)运用在控制系统中的典范。

2.3 PID的当前存在的局限

  1. PID参数总是常量,从一开始设置之后就不会变动,在整个系统的运行过程中都会保持不变,这在应付复杂多变的工业系统环境时略显局限。
  2. PID的参数的设置往往是在大量的实验过程中确定的,效果表现良好达到要求时才会确定,这个确定参数的过程是很痛苦且耗费时间的。
  3. PID在非线性系统中的应用效果不明显,具有模糊性。
  4. 对于闭环系统缺乏理论上的保证。
    这几点体现在了灵活性、鲁棒性、适应性和其他的表现上。

3. 基于神经网络的自适应PID的设计

3.1 可信、可靠、可解释的PID

神经网络整定pid参数 rbf神经网络pid控制_神经网络整定pid参数_08神经网络整定pid参数 rbf神经网络pid控制_人工智能_09神经网络整定pid参数 rbf神经网络pid控制_神经网络_10来得到奖惩、预测、经验的分量,加权求和后形成输出神经网络整定pid参数 rbf神经网络pid控制_神经网络_11,而误差神经网络整定pid参数 rbf神经网络pid控制_人工智能_12的运作机制往往不是单纯的计算输入与目标的差值,而是使用一种加权的形式进行重映射,这样做也更合理一些,将误差神经网络整定pid参数 rbf神经网络pid控制_人工智能_12映射输出为z之后,利用确定好的比例系数、积分系数、微分系数,来对系统进行调节。

神经网络整定pid参数 rbf神经网络pid控制_神经网络_14

3.2 稳定性分析

神经网络整定pid参数 rbf神经网络pid控制_神经网络整定pid参数_15,其中神经网络整定pid参数 rbf神经网络pid控制_神经网络_16为设计的输入,神经网络整定pid参数 rbf神经网络pid控制_人工智能_17为不可控部分,神经网络整定pid参数 rbf神经网络pid控制_控制系统_18,为健康指示,当神经网络整定pid参数 rbf神经网络pid控制_神经网络_19为1且神经网络整定pid参数 rbf神经网络pid控制_人工智能_20为0时,系统处于正常的执行器;当神经网络整定pid参数 rbf神经网络pid控制_神经网络_19小于1且神经网络整定pid参数 rbf神经网络pid控制_人工智能_20为0时,系统会损失一些有效性;当神经网络整定pid参数 rbf神经网络pid控制_神经网络_19小于1且神经网络整定pid参数 rbf神经网络pid控制_人工智能_20为常量时,系统能够在突发情况发生时进行适当的修正;当神经网络整定pid参数 rbf神经网络pid控制_神经网络_19小于1且神经网络整定pid参数 rbf神经网络pid控制_人工智能_20为随时间变化的量时,系统在突发故障发生时将会失去有效性。

神经网络整定pid参数 rbf神经网络pid控制_神经网络整定pid参数_27


  一般神经网络整定pid参数 rbf神经网络pid控制_神经网络_28不为1的情况反应如下

神经网络整定pid参数 rbf神经网络pid控制_神经网络整定pid参数_29


  一般神经网络整定pid参数 rbf神经网络pid控制_控制系统_30不为0的信号反应如下

神经网络整定pid参数 rbf神经网络pid控制_神经网络整定pid参数_31

3.3 误差滤波处理

神经网络整定pid参数 rbf神经网络pid控制_神经网络_32,对误差进行加权求和,即引入滤波误差神经网络整定pid参数 rbf神经网络pid控制_人工智能_33神经网络整定pid参数 rbf神经网络pid控制_神经网络整定pid参数_34,两者为导数关系,经过1991年Slotine和Li的论文验证,当神经网络整定pid参数 rbf神经网络pid控制_人工智能_35时,神经网络整定pid参数 rbf神经网络pid控制_神经网络整定pid参数_36,也即滤波后的神经网络整定pid参数 rbf神经网络pid控制_人工智能_33最小时神经网络整定pid参数 rbf神经网络pid控制_神经网络_38也最小,所以误差的问题研究滤波后的误差更具有代表性和可行性。

由于我们的目标是设计一个自适应的容错的PID控制器来获得神经网络整定pid参数 rbf神经网络pid控制_人工智能_33神经网络整定pid参数 rbf神经网络pid控制_神经网络_40,使其确保所有的闭环系统的信号达到边界,生成最小的残差集。将系统中所有的不可控因素都添加进来,得到了神经网络整定pid参数 rbf神经网络pid控制_控制系统_41,如下所示

神经网络整定pid参数 rbf神经网络pid控制_控制系统_42


  其第一部分为不确定项,第二部分为未知的生成输入,第三部分为已知项,通过标准化误差z函数,获得以下公式如下

神经网络整定pid参数 rbf神经网络pid控制_神经网络_43


  所讨论的系统应当分为两类,一类是方系统,一类是非线性的非方系统,方系统指的是输入个数与输出个数相同的系统,反之,非方系统指的就是输入与输出不同的系统,一般方系统的分析较为标准,解决方法灵活,对于控制系数矩阵,其正定性决定了控制系统的走向,正定矩阵代表着系统要朝增强的方向输出信号,负定则代表着系统要朝着反向进行输出信号。

引入一般化的误差神经网络整定pid参数 rbf神经网络pid控制_神经网络_38,即神经网络整定pid参数 rbf神经网络pid控制_神经网络_45,对其进行再次滤波,可得到

神经网络整定pid参数 rbf神经网络pid控制_神经网络整定pid参数_46
  那么整个建模的设计思路就是通过神经网络整定pid参数 rbf神经网络pid控制_人工智能_47反映了神经网络整定pid参数 rbf神经网络pid控制_人工智能_48,而神经网络整定pid参数 rbf神经网络pid控制_人工智能_48反映了神经网络整定pid参数 rbf神经网络pid控制_人工智能_12,将E最小化是我们的目标。
神经网络整定pid参数 rbf神经网络pid控制_控制系统_51为所有不确定因素的综合,不确定因素包括系统的抖动、故障、人为因素、环境因素等等,而对于不确定因素的处理是整个系统设计最困难的部分,目前的处理方法有三种:

  1. 参数分解法:神经网络整定pid参数 rbf神经网络pid控制_神经网络整定pid参数_52,其中神经网络整定pid参数 rbf神经网络pid控制_神经网络整定pid参数_53为未知参数向量,神经网络整定pid参数 rbf神经网络pid控制_神经网络整定pid参数_54为已知的矩阵函数(回归算子),这种处理方式的解是理想的解,但是处理过程和执行难度复杂,且通常不可分解。
  2. 提取核函数神经网络整定pid参数 rbf神经网络pid控制_神经网络整定pid参数_55为未知参数向量,神经网络整定pid参数 rbf神经网络pid控制_控制系统_56为已知的光滑函数,此方式基于本质信息且易于实现,缺点是效果不明显容易受扰动。
  3. 采用神经网络(NN)逼近,此种方式为与人工智能神经网络结合解决问题的典型思路,思路来源为万能逼近定理,但是运用此定理解决问题的数据集是有条件的,要求数据必须是同一紧集,处理数据时可以采用引入约束的方式规范数据为同一紧集,第二个就是被逼近的函数本身是要连续光滑的,第三个点就是神经元的数目,神经元的数目决定了网络的复杂性,对于神经元的数据和网络的复杂程度的问题,只能在实验中去迭代发现,具体可以在一开始设置一个合理的数目,然后引入神经元数目的增减机制,这个增减机制在生物学上是有理可据的,其与生物的细胞凋亡与生长是完全吻合的。

3.4 控制器的设计

  经过引入滤波后的误差,可以进行PID控制器的设计,PID的建模设计如下:
神经网络整定pid参数 rbf神经网络pid控制_控制系统_57
  这样设计之后,原本的PID的参数由Kp(比例系数)、Ki(积分系数)、Kd(微分系数)三个变为了神经网络整定pid参数 rbf神经网络pid控制_控制系统_58神经网络整定pid参数 rbf神经网络pid控制_控制系统_59∙、神经网络整定pid参数 rbf神经网络pid控制_神经网络整定pid参数_60神经网络整定pid参数 rbf神经网络pid控制_控制系统_61∙、神经网络整定pid参数 rbf神经网络pid控制_神经网络整定pid参数_62神经网络整定pid参数 rbf神经网络pid控制_神经网络整定pid参数_63∙六个参数,三个常量参数神经网络整定pid参数 rbf神经网络pid控制_控制系统_58神经网络整定pid参数 rbf神经网络pid控制_神经网络整定pid参数_60神经网络整定pid参数 rbf神经网络pid控制_神经网络整定pid参数_62以及三个随时间变化的参数神经网络整定pid参数 rbf神经网络pid控制_控制系统_67神经网络整定pid参数 rbf神经网络pid控制_控制系统_61∙、神经网络整定pid参数 rbf神经网络pid控制_神经网络整定pid参数_63∙,但是经过实际的推演,其约束如下:
神经网络整定pid参数 rbf神经网络pid控制_控制系统_70
  上面约束中的神经网络整定pid参数 rbf神经网络pid控制_神经网络_71神经网络整定pid参数 rbf神经网络pid控制_神经网络_72和自适应的参数a的更新准则在后面会给出,神经网络整定pid参数 rbf神经网络pid控制_人工智能_73是与神经网络中的激活函数有关的函数量,且将这几个参数作为已知量看待,通过对于上面的约束的观察,发现其实只要确定了神经网络整定pid参数 rbf神经网络pid控制_控制系统_74,其他参数全部可以通过约束关系确定下来,所以,通过引入误差的滤波函数,控制器的建模参数其实简化了很多,控制系统变得更加的可靠。
对于一般化误差神经网络整定pid参数 rbf神经网络pid控制_神经网络整定pid参数_75的可解释性问题,考虑设神经网络整定pid参数 rbf神经网络pid控制_神经网络整定pid参数_76,那么神经网络整定pid参数 rbf神经网络pid控制_人工智能_47可以转换为神经网络整定pid参数 rbf神经网络pid控制_人工智能_78,将神经网络整定pid参数 rbf神经网络pid控制_人工智能_47通过拉普拉斯变换,转换成神经网络整定pid参数 rbf神经网络pid控制_人工智能_80,便于进行因式分解,将本式进行等价转换,得到神经网络整定pid参数 rbf神经网络pid控制_神经网络整定pid参数_81,这在控制系统中属于非常稳定的滤波器,其有两个极点,位于实轴的两侧,一个神经网络整定pid参数 rbf神经网络pid控制_神经网络整定pid参数_82一个神经网络整定pid参数 rbf神经网络pid控制_神经网络_83,这样得到极值保证了神经网络整定pid参数 rbf神经网络pid控制_人工智能_47最小,就可以保证神经网络整定pid参数 rbf神经网络pid控制_人工智能_48最小,从而保证了神经网络整定pid参数 rbf神经网络pid控制_人工智能_12(误差)最小。

3.5 对于方系统与非方系统的应用

  对于方系统的PID控制数学建模考虑加入可控的参数在神经网络中,根据上面章节的推论,可以得到方系统PID控制的数学模型:

神经网络整定pid参数 rbf神经网络pid控制_控制系统_87

  可见此处模型只是将上节推论的公式的各项添加了一个参数矩阵神经网络整定pid参数 rbf神经网络pid控制_神经网络_88,在方系统中,神经网络整定pid参数 rbf神经网络pid控制_神经网络_88是一个单位矩阵,其约束与上节相同:

神经网络整定pid参数 rbf神经网络pid控制_控制系统_70

  在对自适应参数神经网络整定pid参数 rbf神经网络pid控制_神经网络整定pid参数_91在神经网络的更新策略中,遵循以下原则:

神经网络整定pid参数 rbf神经网络pid控制_神经网络_92

  其中,神经网络整定pid参数 rbf神经网络pid控制_神经网络整定pid参数_93神经网络整定pid参数 rbf神经网络pid控制_控制系统_94为正数参数。经过下列引理证明,其具有可行性。

神经网络整定pid参数 rbf神经网络pid控制_控制系统_95


  对于非方系统的PID控制器设计模型,由于其输入信号与输出信号不同,所以其矩阵并非方阵,非方系统的矩阵设为神经网络整定pid参数 rbf神经网络pid控制_神经网络整定pid参数_96,其中神经网络整定pid参数 rbf神经网络pid控制_神经网络整定pid参数_97为行满秩的有界矩阵,神经网络整定pid参数 rbf神经网络pid控制_神经网络_98为严格正定或者负定的矩阵,关于非方系统的PID设计数学模型基本与方系统相同。

神经网络整定pid参数 rbf神经网络pid控制_控制系统_87

  对于神经网络整定pid参数 rbf神经网络pid控制_神经网络_88,其与方系统中的单位阵不同,在非方系统的数学模型中,神经网络整定pid参数 rbf神经网络pid控制_人工智能_101,其余约束与方系统相同,分别为:

神经网络整定pid参数 rbf神经网络pid控制_控制系统_70

  自适应参数的更新过程仍然遵循神经网络整定pid参数 rbf神经网络pid控制_控制系统_103,经过以下图示引理可以证明其在MIMO系统中的可行性:

神经网络整定pid参数 rbf神经网络pid控制_神经网络_104

4. 总体设计

4.1 参数更新总体设计

神经网络整定pid参数 rbf神经网络pid控制_人工智能_12映射成为神经网络整定pid参数 rbf神经网络pid控制_人工智能_106,通过乘积形式的神经网络整定pid参数 rbf神经网络pid控制_神经网络_107参数神经网络整定pid参数 rbf神经网络pid控制_人工智能_108神经网络整定pid参数 rbf神经网络pid控制_神经网络整定pid参数_82神经网络整定pid参数 rbf神经网络pid控制_神经网络_83为拉普拉斯变换再因式分解后的极点)和和形式的神经网络整定pid参数 rbf神经网络pid控制_神经网络_111参数神经网络整定pid参数 rbf神经网络pid控制_神经网络整定pid参数_112以及随时间变化的神经网络整定pid参数 rbf神经网络pid控制_神经网络_113,将PID的比例部分、积分部分、微分部分进行等价变换、因式分解和加权求和的形式得到一般化的误差神经网络整定pid参数 rbf神经网络pid控制_人工智能_47,将神经网络整定pid参数 rbf神经网络pid控制_人工智能_47与神经网络中的激活函数的运算乘参数神经网络整定pid参数 rbf神经网络pid控制_控制系统_94,将累积的旧的神经网络整定pid参数 rbf神经网络pid控制_神经网络整定pid参数_91神经网络整定pid参数 rbf神经网络pid控制_控制系统_118,将两部分求和去更新自适应参数神经网络整定pid参数 rbf神经网络pid控制_神经网络整定pid参数_91,最终的更新学习训练的过程并不是通过设置比例系数、积分系数、微分系数来逼近良好的结果,而是有单一的自适应参数神经网络整定pid参数 rbf神经网络pid控制_神经网络整定pid参数_91

神经网络整定pid参数 rbf神经网络pid控制_神经网络整定pid参数_121

4.2 系统总体设计

神经网络整定pid参数 rbf神经网络pid控制_控制系统_58和随时间变化的比例系数神经网络整定pid参数 rbf神经网络pid控制_控制系统_123进行加权求和,从而生成比例部分的设计,恒定比例系数部分神经网络整定pid参数 rbf神经网络pid控制_控制系统_58包括了神经网络整定pid参数 rbf神经网络pid控制_神经网络整定pid参数_112决定的神经网络整定pid参数 rbf神经网络pid控制_控制系统_74,随时间变化部分的部分包含了神经网络整定pid参数 rbf神经网络pid控制_神经网络整定pid参数_112决定的自适应的环节,细节已经在上面的系统设计中阐释,不再赘述;通过恒定的积分系数部分神经网络整定pid参数 rbf神经网络pid控制_控制系统_128和随时间变化的积分系数神经网络整定pid参数 rbf神经网络pid控制_控制系统_129进行加权求和,从而生成积分部分的设计,恒定积分系数部分神经网络整定pid参数 rbf神经网络pid控制_控制系统_128包括了神经网络整定pid参数 rbf神经网络pid控制_人工智能_108决定的神经网络整定pid参数 rbf神经网络pid控制_控制系统_74,随时间变化部分的部分包含了神经网络整定pid参数 rbf神经网络pid控制_人工智能_108决定的自适应的环节;通过恒定的微分系数部分神经网络整定pid参数 rbf神经网络pid控制_控制系统_74和随时间变化的比例系数神经网络整定pid参数 rbf神经网络pid控制_神经网络_135进行加权求和,从而生成微分部分的设计,恒定微分系数部分神经网络整定pid参数 rbf神经网络pid控制_控制系统_74,随时间变化部分的部分属于自适应的环节;综上三个部分的设计,将输出信号给予执行器,在实际的闭环系统工作中得到反馈信号,将反馈信号再次作为输入计算误差输入误差滤波器,反复迭代,直到结果收敛到满意的程度。

神经网络整定pid参数 rbf神经网络pid控制_控制系统_137

5. 应用与扩展

5.1 机器人机械臂方面的应用

  在机器人的关节空间当中,关节空间是典型的方系统,而末端执行结构(抓取结构)的任务空间是非方系统,其n关节严格物理连接的机器人操作器的数学建模如下图所示:

神经网络整定pid参数 rbf神经网络pid控制_神经网络整定pid参数_138


  在方系统的关节空间轨迹中,执行器的建模如下图所示:

神经网络整定pid参数 rbf神经网络pid控制_神经网络_139


  设定神经网络整定pid参数 rbf神经网络pid控制_人工智能_140用于表征关节空间的角度误差,那么多关节机器人PID控制器的数学建模如下:

神经网络整定pid参数 rbf神经网络pid控制_控制系统_87

  约束与第三章的设计中所述一致,由于关节空间中是方系统,所以神经网络整定pid参数 rbf神经网络pid控制_神经网络_88为单位阵,在自适应参数的更新原则神经网络整定pid参数 rbf神经网络pid控制_控制系统_103 中,神经网络整定pid参数 rbf神经网络pid控制_神经网络整定pid参数_144是NN逼近或者说重构的核心函数。

  在任务空间的非方系统中,设定三维笛卡尔坐标系空间下的神经网络整定pid参数 rbf神经网络pid控制_人工智能_145,动态映射神经网络整定pid参数 rbf神经网络pid控制_神经网络_146,设定神经网络整定pid参数 rbf神经网络pid控制_神经网络_147(也即末端操作空间的位置误差),误差滤波函数如下:

神经网络整定pid参数 rbf神经网络pid控制_控制系统_148

  其约束神经网络整定pid参数 rbf神经网络pid控制_控制系统_149为雅可比矩阵,同时F与B满足下图的要求:

神经网络整定pid参数 rbf神经网络pid控制_人工智能_150


  多关节机器人任务空间PID控制器的数学建模如下:

神经网络整定pid参数 rbf神经网络pid控制_神经网络_151

  其约束不再赘述,其误差神经网络整定pid参数 rbf神经网络pid控制_神经网络整定pid参数_152(末端操作空间位置误差),由于是非方系统,那么神经网络整定pid参数 rbf神经网络pid控制_神经网络_153,在自适应参数的更新原则神经网络整定pid参数 rbf神经网络pid控制_控制系统_103中,神经网络整定pid参数 rbf神经网络pid控制_神经网络整定pid参数_144是NN逼近或者说重构的核心函数。

6. 总结

  神经网络自适应的PID具有极强的现实意义,因为PID作为影响力和应用面极大的经典控制算法,对于其优化能够带来工业界、控制工程领域的极大便利,在实际的应用场景中,对于PID的使用,往往通过手动调参的方式去实验,在一些损失影响不大的系统中,往往耗费时间,在损失影响较大的系统中,往往会造成一些不可估量的成本耗费,而引入神经网络自适应的PID能够完成无需人工试错的环节,节省大量的人力和资源成本;同时,经典控制理论与人工智能神经网络的结合,将会给控制工程带来很强扩展性,能够实现PID控制算法的参数关联自动调整-解析算法,通过自动编程的方式实现实时自适应调整;由于PID控制系统有了自适应的参数,其容错率将大大提高,鲁棒性也大大提高;通过学术前辈的工作,将神经网络自适应的PID的数学建模建立出来,优化参数量,通过神经网络的方式去逼近,易于实现且使得成本可控,当然在神经网络的调优上,仍然需要做一些工作,目前关于PID的学术论文在LTI系统和UNS系统两个领域里近年来出现了很多可行性高的新思维的碰撞,在可解释性、自适应性和容错性上也各不相同,足以证明PID在控制领域的重要地位,也足以证明PID和神经网络结合的必要性和可扩展性。