【原理】RBF神经网络-训练原理(插值法)

作者 : 老饼发表日期 : 2023-03-01 07:58:53 更新日期 : 2024-12-10 20:13:29

本站原创文章，转载请说明来自《老饼讲解-BP神经网络》www.bbbdata.com

插值法是构建RBF神经网络的一种基础方法，它使用RBF函数对样本进行插值，可以逼近任意曲线

本文讲解插值法构建RBF径向基神经网络的思想与原理，以及具体的参数求解方法和推导过程

通过本文，可以了解RBF径向基神经网络插值法是什么，以及如何使用插值法来构建一个RBF神经网络

01. RBF径向基神经网络-插值法

本节讲解插值法构建一个RBF神经网络的思想和原理

RBF径向基神经网络-插值法原理

RBF神经网络的几何意义
径向基神经网络就是多个径向基之和，它的模型表达式形式如下：

其中，隐层权重的第i行，代表第i个径向基的中心
隐层阈值，则控制了第i个径向基的宽度
输出层权重的第i行，代表第i个径向基的高
输出层阈值，则是第i个输出的基本值
从RBF神经网络的数学表达式可以看到，它的输出就是多个RBF函数之和
所以，RBF神经网络在几何意义上，就是使用多个径向基曲线来叠加出目标函数曲线

RBF神经网络插值法的思想
由于径向基具有局部非0性，它只对中心一定的范围产生影响
因此，RBF插值法以每一个样本作为中心，各生成一个径向基，使它们叠加出目标曲线

如图所示，RBF神经网络以各个样本数据点为中心，来生成多个RFB径向基曲线
然后通过叠加所有RBF曲线，就可得到一条能够光滑拟合各个样本数据点的曲线
因此，插值法实际就是企图对于每一个样本点，都使用一个RBF去负责该样本点附近的拟合
通过对每一个样本都进行局部拟合，从而达到整体样本曲线的全局拟合

02. RBF神经网络-求解原理(插值法)

本节讲解使用插值法构建一个RBF神经网络时各个参数是如何求解的

RBF神经网络-隐层参数的取值(插值法)

使用插值法构建RBF神经网络时，隐层权重 W(2)与阈值 b(2)如下取值：
一、隐层权重的取值
RBF神经网络插值法以每个样本为中心生成径向基
因此在插值法中，隐层权重就是输入样本，并不需求解
二、隐层阈值的取值
RBF神经网络的隐层阈值则一般由以下公式设定：

其中，spread称为径向基宽度系数
公式意义详见《RBF的spread参数是什么》
  也即是说隐层权重、阈值并都不需求解，而是由样本和预设的spread超参数来决定

RBF神经网络-输出层参数的求解(插值法)

下面讲解使用插值法构建RBF神经网络时，输出层权重 W(3)与阈值 b(3)的求解方法
为方便理解，先以单输出的情况进行讲解，再拓展到多输出的情况
输出层权重、阈值的求解方法(单输出)
在单输出时，每个样本的是一个标量，是一个向量，是一个标量
要求解一组和，使得RBF神经网络的输出与样本的一致
  即要求、满足以下方程组：


其中
代表第j个样本第i个隐节点的激活值

  将上式写为矩阵形式，则为：



由于隐层的权重和阈值是确定的
故每个样本的隐节点激活值也是确定的，即上述线性方程组中，RBF矩阵是已知的
因此，只需直接求解上述方程组，就可得到RBF神经网络输出层的参数的解
注意到待解参数个数大于方程个数，因此上述方程必有解，且是精确解
也就是说，径向基神经网络在训练数据上的预测误差会为0

输出层权重、阈值的求解方法(多输出)
当RBF神经网络为多输出，只需把待解方程推广如下即可

其中
    ：输出个数
    ：样本个数
     ：第j个隐节点到第i个输出的权重
    ：第i个输出节点的阈值
  ：第j个样本第i个隐节点的激活值
      ：第j个样本的第i个输出
上述方程一般也可简记为：

其中，是第j个样本第i个隐节点的RBF值(即激活值）

老饼-编后语

插值法是RBF神经网络最基础和最简单的构建方法，也非常易于理解
由于RBF神经网络插值法必有精确解，因此模型在训练数据上的预测误差会为0，这是它最大的特色
但由于它基于插值法，有多少个样本就有多少个径向基，这使得模型庞大
因此，就有了OLS、k-means等求解方法，对它进一步优化，减少径向基个数

好了，以上就是RBF神经网络插值法的训练原理了~

End

添加评论