AdaBoost提升方法

2023-12-20 21:09:22

提升方法的基本思想是通过改变训练样本的权重学习多个分类器，并将这些线性分类器进行线性组合，提高分类性能。

AdaBoost

提高前一轮被分类错误样本的权值，降低前一轮被分类正确的权值；
加大分类误差率小的弱分类器。

算法
输入：训练集 $T=\{(x_1,y_1),(x_2,y_2),...,(x_N,y_N)\}$ ，其中 $x_i\in X \subseteq R^n$ ， $y_i\in Y \subseteq\{-1,1\}$ ；弱学习算法。
输出：最终分类器 $G (n)$ 。

初始化训练数据的权值分布
$D_1=(w_11,...,w_1i,...,w_{1N}),w_1i=\frac{1}{N}$
对 $m = 1, 2, ..., M$
- 使用具有权值分布 $D_m$ 的训练集学习，得到基本分类器：
  $G_m(x):X\longrightarrow\{-1,1\}$
- 计算 $G_m(x)$ 在训练集上的分类误差率：
  $e_m=\sum_{i=1}^{N}P(G_m(x_i)\neq y_i)\\=\sum_{i=1}^{N}w_miI(G_m(x_i)\neq y_i)\\=\sum_{G_m(x_i)\neq y_i}w_mi$
- 计算 $G_m(x)$ 的系数：
  $\alpha_{m}=\frac{1}{2}log\frac{1-e_m}{e_m}$
- 更新训练集的权值分布
  $D_{m+1}=(w_{m+1,1},...,w_{m+1,i},...,w_{m+1,N})$
  $w_{m+1,i}=\frac{w_{m,i}}{Z_m}exp(-\alpha_{m}y_{i}G_{m}(x_i)),{i=1,2,...,N}$
  其中 $Z_m$ 是规范化因子
  $Z_m=\sum_{i=1}{N}w_{m,i}exp(-\alpha_{m}y_{i}G_{m}(x_i))$
  它使得 $D_{m+1}$ 成为一个概率分布，即 $\sum_{i=1}^{N}w_{m,i}=1$ 。
构建基本分类器的线性组合
$f(x)=\sum_{m+1}^{M}\alpha_{m}G_{m}(x)$
得到最终分类器
$G(x)=sign(f(x))=sign(\sum_{m=1}^{M}\alpha_{m}G_{m}(x))$
注：式①可写成
$w_{m+1,i}=\left\{\begin{aligned}\frac{w_{m,i}}{Z_m}e^{-\alpha_m},G_{m}(x_i)=y_i\\\frac{w_{m,i}}{Z_m}e^{\alpha_m},G_{m}(x_i)\neq y_i\\\end{aligned} \right.$
可知误分类样本在每一轮学习后权重会被放大 $e^{2\alpha_m}=\frac{1-e_m}{e_m}$ 倍，系数 $\alpha_m$ 表示分类器 $G_m(x)$ 的重要性，所有 $\alpha_m$ 之和并不等于1。

文章来源:https://blog.csdn.net/PyDarren/article/details/135114782
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系我的编程经验分享网邮箱：veading@qq.com进行投诉反馈，一经查实，立即删除！