GLM
Generalized Linear Models, 广义线性模型GLM。
一类灵活的统计模型,用于处理不同类型的数据。GLM 扩展了传统的线性回归模型,允许响应变量(因变量)与预测变量(自变量)之间的关系通过各种分布来建模。GLM 主要包括线性回归、逻辑回归、泊松回归等模型。
1. GLM 的基本组成
广义线性模型由以下三部分组成:
- 随机成分:响应变量
的分布,通常假设为指数家族分布,如正态分布、二项分布、泊松分布等。 - 系统成分:线性预测器
,即自变量的线性组合: 其中, 是设计矩阵, 是回归系数。 - 链接函数:链接函数
将线性预测器 与响应变量的期望 联系起来: 其中, 是响应变量的期望。
2. GLM 的数学推导
2.1 随机成分
假设响应变量
2.2 系统成分
线性预测器
2.3 链接函数
链接函数
- 对数链接函数:用于泊松回归,
- 逻辑链接函数:用于逻辑回归,
- 恒等链接函数:用于线性回归,
2.4 估计和推断
GLM 的参数估计通常使用最大似然估计(MLE)。最大似然函数
3. GLM 的模型示例
3.1 线性回归
线性回归模型属于 GLM 的特殊情况,其中响应变量
3.2 逻辑回归
逻辑回归用于二分类问题,响应变量
3.3 泊松回归
泊松回归用于计数数据,响应变量
All articles in this blog are licensed under CC BY-NC-SA 4.0 unless stating additionally.