从原理到代码之线性模型 (5)

从原理到代码之线性模型

比值

从原理到代码之线性模型

表示样本为正例的可能性比反例的可能性,称为概率(odds),反映了样本作为正例的相对可能性。概率的对数称为对数概率(log odds,也称为logit)。

逻辑回归模型参数估计,估计原理是极大似然估计法估计模型参数:

将参数b吸收,令:

从原理到代码之线性模型

从原理到代码之线性模型

从原理到代码之线性模型

从原理到代码之线性模型

则似然函数为:

从原理到代码之线性模型

对数似然函数为:

从原理到代码之线性模型

又由于

从原理到代码之线性模型

因此:

从原理到代码之线性模型

从原理到代码之线性模型

求极大值,

得到

从原理到代码之线性模型

的估计值

从原理到代码之线性模型

则逻辑回归模型为:

从原理到代码之线性模型

通常用梯度下降法或者拟牛顿法(后续章节会讲到)来求解该最大值问题。

以上讨论都是二类分类的逻辑回归模型,可将此推广到多类分类逻辑回归模型。设离散型随机变量 Y 的取值集合为:{1,2,...,K},则多分类逻辑回归模型为:

从原理到代码之线性模型

其参数估计方法类似二类分类逻辑回归模型。

3.4 线性判别分析

似二类分

4. 梯度下降 

4.1 

5. 代码实现

6. sklearn代码实现

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/zyxwdd.html