GAM | Wenliang Liang

Generalized Additive Models, 广义加性模型 GAM。

通过对预测变量应用平滑函数来捕捉非线性关系。GAM 扩展了传统的线性模型，使得每个预测变量对响应变量的影响可以通过非线性函数来建模。

GLM vs. GAM - Generalized Additive Models

1. GAM 的基本组成

广义加性模型包括以下几个主要成分：

响应变量：\(Y\) 是模型的目标变量。
预测变量：\(X = (X_1, X_2, \ldots, X_p)\) 是自变量或特征。
平滑函数：\(f_i(X_i)\) 是每个预测变量 \(X_i\) 对响应变量的影响，通过平滑函数建模。
线性预测器：将每个预测变量的平滑函数加总起来得到模型的线性预测器。

2. GAM 的模型形式

GAM 的模型可以表示为： \[ g(\mathbb{E}[Y]) = \beta_0 + \sum_{i=1}^p f_i(X_i) \] 其中：

\(g(\cdot)\) 是链接函数，将期望值 \(\mathbb{E}[Y]\) 与线性预测器联系起来。
\(\beta_0\) 是截距项。
\(f_i(X_i)\) 是对每个预测变量 \(X_i\) 施加的平滑函数。

2.1 平滑函数

平滑函数 \(f_i(X_i)\) 通过使用平滑器来捕捉预测变量和响应变量之间的非线性关系。常用的平滑方法包括：

样条函数（Splines）
局部回归（Local Regression）
核平滑（Kernel Smoothing）

2.2 链接函数

链接函数 \(g(\cdot)\) 将期望值 \(\mathbb{E}[Y]\) 映射到线性预测器 \(\eta\)： \[ g(\mathbb{E}[Y]) = \eta \] 常见的链接函数包括：

恒等链接函数：用于线性回归。
逻辑链接函数：用于逻辑回归。
对数链接函数：用于泊松回归。

3. GAM 的模型推导

3.1 建模步骤

选择链接函数：根据响应变量的分布选择合适的链接函数 \(g(\cdot)\)。
选择平滑函数：为每个预测变量选择适当的平滑函数 \(f_i(X_i)\)。
优化估计：通过最大似然估计或其他优化方法估计模型参数。

3.2 平滑函数的估计

平滑函数的估计通常通过最小化以下目标函数来实现： \[ \text{Objective} = \text{Deviance} + \text{Penalized Smoothing Terms} \] 其中，Deviance 是模型的拟合优度，Penalized Smoothing Terms 是对平滑函数复杂度的惩罚，以防止过拟合。

3.3 参数估计

通过最小化下述目标函数来估计模型参数： \[ \text{GAMLSS} = \sum_{i=1}^n \text{Log-Likelihood} + \text{Penalty Terms} \] 其中，Penalty Terms 用于控制平滑函数的复杂度，以避免过度拟合。

4. GAM 的优点

灵活性：GAM 可以捕捉非线性关系，不需要对数据的具体形式做出强假设。
可解释性：每个预测变量的影响通过平滑函数明确表示，易于解释。
平滑：通过平滑函数处理噪声和非线性，增强模型的鲁棒性。