深度学习-入门教程

【模型】MLP神经网络-模型结构

作者 : 老饼 发表日期 : 2022-11-12 22:03:14 更新日期 : 2025-05-14 17:20:03


本站原创文章,转载请说明来自《老饼讲解-深度学习》www.bbbdata.com



多层感知机(MLP,Multilayer Perceptron)是一种全连接神经网络,属于深度学习的一种基础模型

本文讲解MLP的模型结构,前馈计算公式,以及展示一个MLP具体的计算例子,并进一步讲解MLP的仿生原理

通过本文可以快速了解MLP多层感知机神经网络是什么,MLP的详细结构和输出的计算过程,以及它的背后原理是什么





    01. 多层感知机MLP的结构     




本节讲解MLP多层感知机神经网络的模型结构与计算





     MLP多层感知机    


多层感知机(MLP,Multilayer Perceptron)是深度学习中最基础、最常用的一种神经网络
 MLP在ANN中一般被称为BP神经网络,而在深度学习中,则常被称为全连接神经网络
MLP神经网络最基础的用途是数值预测,即解决输入为连续的数值,输出也为连续的数值的任务
 MLP多层感知机的结构如下:
  MLP多层感知机的拓扑结构   
如图,MLP由输入层、隐层、输出层组成(其中隐层可以是有多层的),各层则由神经元构成
 
MLP以前馈方式进行计算,即每层的输出作为下层的输入,不断套娃,直到输出层
 每层的计算公式如下:
y=T(WX+B)\text{y} = T(WX+B) 
其中,X:该层的输入           
W:该层的权重     
B:该层的阈值     
T:该层的激活函数 
输出层一般不设激活函数,而隐层比较经典的激活函数是S型函数,例如tanh函数
但在深度学习中,由于层数过多tanh会导致训练困难,所以隐层往往用ReLu函数作为激活函数





    MLP神经网络计算例子     


MLP是一个前馈神经网络,它的计算过程是逐层计算的,一个计算实例如下:
MLP神经网络的计算实例 
1. 由输入x=[2,3],可算得第一个隐层的输出值为:                                           
                       H(1)=tanh(W(1)X+b(1))=tanh([212103][2,3]+[211])=[111]\small H^{(1)}= \text{tanh}(W^{(1)}X+b^{(1)}) = \text{tanh}\left ( \begin{bmatrix} 2 & 1\\ 2 & 1\\ 0 &3 \end{bmatrix}*[2,3]+\begin{bmatrix} 2\\ 1\\ 1 \end{bmatrix} \right ) =\begin{bmatrix} 1 \\ 1 \\ 1 \end{bmatrix}                   
2. 然后把H(1)\small H^{(1)}作为第二个隐层的输入,可算得第二个隐层的输出:                       
                       H(2)=tanh(W(2)H(1)+b(2))=tanh([011122][111]+[01])=[0.9641]\small H^{(2)}= \text{tanh}(W^{(2)}H^{(1)}+b^{(2)}) = \text{tanh}\left ( \begin{bmatrix} 0 & 1& 1\\ 1 & 2&2 \end{bmatrix}*\begin{bmatrix} 1\\ 1\\ 1 \end{bmatrix} +\begin{bmatrix} 0\\ 1 \end{bmatrix} \right ) =\begin{bmatrix} 0.964 \\ 1 \end{bmatrix}     
3. 将H(2)\small H^{(2)}作为输出层的输入,就可算得输出层的输出为:                                    
 y=W(3)H(2)+b(3)=[11][0.9641]+1=2.964\text{y}= W^{(3)}H^{(2)}+b^{(3)} = \begin{bmatrix} 1 & 1 \end{bmatrix}*\begin{bmatrix} 0.964\\ 1 \end{bmatrix} +1 =2.964            







    02. MLP多层感知机的生物意义     





本节讲解多层感知机MLP的仿生原理





     MLP神经网络的生物意义     


MLP神经网络的设计思路是什么呢?它借鉴于人脑的工作原理
 在人的眼睛看到符号“5”的后,大脑将判别出它是5
 MLP神经网络的生物意义
 MLP多层感知机正是要模仿这个行为,把这个行为过程简单拆分为: 
  (1)  眼睛接受了输入                    
  (2)  把输入信号传给其它脑神经元        
  (3)  脑神经元综合处理后,输出结果为5   

我们都知道, 神经元与神经元之间相互连接
当神经元的电信号超过阈值时,就会触发信号传递,将电信号传给其它神经元 
MLP神经网络就是模仿人的大脑,每个神经元都有自己的激活值和激活函数
在接受到输入后,每层的神经元都接受来自上层各个神经元的值,将值进行逐层传递,直到输出层






好了,以上就是MLP神经网络的模型结构了~








 End 





图标 评论
添加评论