本站原创文章,转载请说明来自《老饼讲解-机器学习》www.bbbdata.com
在使用梯度下降法求解逻辑回归时,需要用来逻辑回归损失函数的梯度公式
本文讲解逻辑回归损失函数的梯度公式,以及梯度公式的详细推导过程
通过本文,可以知道逻辑回归损失函数的梯度公式以及它的是如何推导出来的
01. 逻辑回归-梯度公式与推导
本节讲解逻辑回归损失函数的梯度公式,以及推导过程
逻辑回归损失函数-梯度公式
逻辑回归的损失函数为:
L(W)=lnP=i=1∑N[yiXiW−ln(1+eXiW)]
逻辑回归损失函数的梯度公式如下:
∂W∂L(W)=XT(y−p)
其中
X:N×M矩阵, N样本数, M为特征个数
即一行为一个样本,一列为一特征
y:N×1的列向量
p:N×1的列向量, p=1+e−XW1
p实际就是逻辑回归模型的预测值
逻辑回归损失函数-梯度公式的推导过程
逻辑回归的损失函数的梯度(即一阶偏导)推导过程如下:
一、单个分量的偏导
由于逻辑回归的损失函数为:
L(W)=lnP=i=1∑N[yiXiW−ln(1+eXiW)]
它对单个分量Wj 的偏导:
∂Wj∂L(W)=∂Wj∂i=1∑N[yiXiW−ln(1+eXiW)]
=i=1∑N(yi(Xi)j−1+eXiW(Xi)jeXiW)
(Xi)j 代表 第i个样本第j个特征的 x 数据
=i=1∑N(yi−e−XiW+11)(Xi)j
=i=1∑N(yi−pi)(Xi)j // pi=1+e−XiW1
---- 用矩阵形式替换连加形式 -----------
=(Xj列)T(y−p)
这里的 Xj列 即第j个特征的数据
二、整体的偏导
根据单个分量的偏导形式,可得到整体偏导如下:
∂W∂L(W)=XT(y−p)
其中
X:N×M矩阵, N样本数, M为特征个数
即一行为一个样本,一列为一特征
y:N×1的列向量
p:N×1的列向量, p=1+e−XW1
由此即可得到逻辑回归损失函数的梯度公式~
好了,以上就是逻辑回归损失函数的梯度推导了~
End