本站原创文章,转载请说明来自《老饼讲解-BP神经网络》www.bbbdata.com
插值法是构建RBF神经网络的一种基础方法,它使用RBF函数对样本进行插值,可以逼近任意曲线
本文讲解插值法构建RBF径向基神经网络的思想与原理,以及具体的参数求解方法和推导过程
通过本文,可以了解RBF径向基神经网络插值法是什么,以及如何使用插值法来构建一个RBF神经网络
本节讲解插值法构建一个RBF神经网络的思想和原理
RBF径向基神经网络-插值法原理
RBF神经网络的几何意义
径向基神经网络就是多个径向基之和,它的模型表达式形式如下:
其中, 隐层权重的第i行,代表第i个径向基的中心
隐层阈值,则控制了第i个径向基的宽度
输出层权重 的第i行,代表第i个径向基的高
输出层阈值,则是第i个输出的基本值
从RBF神经网络的数学表达式可以看到,它的输出就是多个RBF函数之和
所以,RBF神经网络在几何意义上,就是使用多个径向基曲线来叠加出目标函数曲线
RBF神经网络插值法的思想
由于径向基具有局部非0性,它只对中心一定的范围产生影响
因此,RBF插值法以每一个样本作为中心,各生成一个径向基,使它们叠加出目标曲线
如图所示,RBF神经网络以各个样本数据点为中心,来生成多个RFB径向基曲线
然后通过叠加所有RBF曲线,就可得到一条能够光滑拟合各个样本数据点的曲线
因此,插值法实际就是企图对于每一个样本点,都使用一个RBF去负责该样本点附近的拟合
通过对每一个样本都进行局部拟合,从而达到整体样本曲线的全局拟合
本节讲解使用插值法构建一个RBF神经网络时各个参数是如何求解的
RBF神经网络-隐层参数的取值(插值法)
使用插值法构建RBF神经网络时,隐层权重 W(2)与阈值 b(2)如下取值:
一、隐层权重的取值
RBF神经网络插值法以每个样本为中心生成径向基
因此在插值法中,隐层权重就是输入样本,并不需求解
二、隐层阈值的取值
RBF神经网络的隐层阈值则一般由以下公式设定:
其中,spread称为径向基宽度系数
公式意义详见《RBF的spread参数是什么》
也即是说隐层权重、阈值并都不需求解,而是由样本和预设的spread超参数来决定
RBF神经网络-输出层参数的求解(插值法)
下面讲解使用插值法构建RBF神经网络时,输出层权重 W(3)与阈值 b(3)的求解方法
为方便理解,先以单输出的情况进行讲解,再拓展到多输出的情况
输出层权重、阈值的求解方法(单输出)
在单输出时,每个样本的是一个标量,是一个向量,是一个标量
要求解一组和,使得RBF神经网络的输出与样本的一致
即要求、满足以下方程组:
其中
代表第j个样本第i个隐节点的激活值
将上式写为矩阵形式,则为:
由于隐层的权重和阈值是确定的
故每个样本的隐节点激活值也是确定的,即上述线性方程组中,RBF矩阵是已知的
因此,只需直接求解上述方程组,就可得到RBF神经网络输出层的参数的解
注意到待解参数个数大于方程个数,因此上述方程必有解,且是精确解
也就是说,径向基神经网络在训练数据上的预测误差会为0
输出层权重、阈值的求解方法(多输出)
当RBF神经网络为多输出,只需把待解方程推广如下即可
其中
:输出个数
:样本个数
:第j个隐节点到第i个输出的权重
:第i个输出节点的阈值
:第j个样本第i个隐节点的激活值
:第j个样本的第i个输出
上述方程一般也可简记为:
其中,是第j个样本第i个隐节点的RBF值(即激活值)
老饼-编后语
插值法是RBF神经网络最基础和最简单的构建方法,也非常易于理解
由于RBF神经网络插值法必有精确解,因此模型在训练数据上的预测误差会为0,这是它最大的特色
但由于它基于插值法,有多少个样本就有多少个径向基,这使得模型庞大
因此,就有了OLS、k-means等求解方法,对它进一步优化,减少径向基个数
好了,以上就是RBF神经网络插值法的训练原理了~
End