RBF神经网络

【原理】RBF神经网络-训练原理(插值法)

作者 : 老饼 发表日期 : 2023-03-01 07:58:53 更新日期 : 2024-12-10 20:13:29
本站原创文章,转载请说明来自《老饼讲解-BP神经网络》www.bbbdata.com



插值法是构建RBF神经网络的一种基础方法,它使用RBF函数对样本进行插值,可以逼近任意曲线

本文讲解插值法构建RBF径向基神经网络的思想与原理,以及具体的参数求解方法和推导过程

通过本文,可以了解RBF径向基神经网络插值法是什么,以及如何使用插值法来构建一个RBF神经网络





     01. RBF径向基神经网络-插值法    





本节讲解插值法构建一个RBF神经网络的思想和原理



 


     RBF径向基神经网络-插值法原理     


RBF神经网络的几何意义
 
径向基神经网络就是多个径向基之和,它的模型表达式形式如下:
 
                     
 其中, 隐层权重的第i行,代表第i个径向基的中心           
隐层阈值
,则控制了第i个径向基的宽度        
输出层权重 
的第i行,代表第i个径向基的高  
输出层阈值
,则是第i个输出的基本值               
从RBF神经网络的数学表达式可以看到,它的输出就是多个RBF函数之和
所以,RBF神经网络在几何意义上,就是使用多个径向基曲线来叠加出目标函数曲线
 RBF神经网络插值法的思想
由于径向基具有局部非0性,它只对中心一定的范围产生影响
因此,RBF插值法以每一个样本作为中心,各生成一个径向基,使它们叠加出目标曲线
 RBF神经网络插值法的思想
 如图所示,RBF神经网络以各个样本数据点为中心,来生成多个RFB径向基曲线
然后通过叠加所有RBF曲线,就可得到一条能够光滑拟合各个样本数据点的曲线
 
因此,插值法实际就是企图对于每一个样本点,都使用一个RBF去负责该样本点附近的拟合
通过对每一个样本都进行局部拟合,从而达到整体样本曲线的全局拟合








   02. RBF神经网络-求解原理(插值法)   





本节讲解使用插值法构建一个RBF神经网络时各个参数是如何求解的





    RBF神经网络-隐层参数的取值(插值法)    


使用插值法构建RBF神经网络时,隐层权重 W(2)与阈值 b(2)如下取值:
一、隐层权重的取值                                                                                
RBF神经网络插值法以每个样本为中心生成径向基                      
因此在插值法中,隐层权重就是输入样本,并不需求解
二、隐层阈值的取值                                                                              
RBF神经网络的隐层阈值则一般由以下公式设定:           
  
 其中,spread称为径向基宽度系数
公式意义详见《RBF的spread参数是什么》
  也即是说隐层权重、阈值并都不需求解,而是由样本和预设的spread超参数来决定






    RBF神经网络-输出层参数的求解(插值法)    


下面讲解使用插值法构建RBF神经网络时,输出层权重 W(3)与阈值 b(3)的求解方法
 为方便理解,先以单输出的情况进行讲解,再拓展到多输出的情况
 输出层权重、阈值的求解方法(单输出)        
在单输出时,每个样本的是一个标量,是一个向量,是一个标量
 要求解一组,使得RBF神经网络的输出与样本的一致
  即要求满足以下方程组:
 

  
 其中
 
代表第j个样本第i个隐节点的激活值   
  
  将上式写为矩阵形式,则为:
   
   
    
由于隐层的权重和阈值是确定的
故每个样本的隐节点激活值也是确定的,即上述线性方程组中,RBF矩阵是已知的
因此,只需直接求解上述方程组,就可得到RBF神经网络输出层的参数的解
 注意到待解参数个数大于方程个数,因此上述方程必有解,且是精确解
 也就是说,径向基神经网络在训练数据上的预测误差会为0
 输出层权重、阈值的求解方法(多输出)     
 当RBF神经网络为多输出,只需把待解方程推广如下即可 
  
 其中
 
   :输出个数                   
 
   :样本个数                  
     :第j个隐节点到第i个输出的权重  
 
   :第i个输出节点的阈值         
 
 :第j个样本第i个隐节点的激活值  
  
    :第j个样本的第i个输出            
上述方程一般也可简记为:
  
其中,是第j个样本第i个隐节点的RBF值(即激活值)





    老饼-编后语    


插值法是RBF神经网络最基础和最简单的构建方法,也非常易于理解 
 由于RBF神经网络插值法必有精确解,因此模型在训练数据上的预测误差会为0,这是它最大的特色
但由于它基于插值法,有多少个样本就有多少个径向基,这使得模型庞大
因此,就有了OLS、k-means等求解方法,对它进一步优化,减少径向基个数






好了,以上就是RBF神经网络插值法的训练原理了~









 End 




联系老饼