K-means 算法

2023-12-15 21:05:54

K-means 算法

算法过程描述

随机选取k个点作为簇的中心
对于每一个样本的计算到中心的距离，并将样本分到最近的簇中
更新簇的中心位置
重复上述2-3步，直至簇的中心位置不在发生改变

其中目标函数为
$J=\sum_{i=1}^N\sum_{k=1}^Kr_{i,k}||x^i-\mu^k||^2$
其中 $r_{i,k}\in\{0,1\}$ 表示样本 $x_i$ 是否属于簇 $k$

因为如果簇中心位置 $\mu^k$ 确定，那么 $r_{i,k}$ 也同时将确定，为了优化目标函数，k-means采用迭代求解的方法，首先固定 $\mu^k$ ，优化 $r_{i,k}$ ；然后固定 $r_{i,k}$ 优化 $\mu^k$ 。

首先初始化簇中心,固定 $\mu^k$ ，最小化 $J(r_{i,k})$ :

分配每个样本点到其最近的中心点所在的簇
$z_i= \mathrm{arg\ min}_{k^{\prime}}\text{dist}(x^i,\mu^k)\\ \begin{cases}r_{i,k}=1,k=z_i\\r_{i,k}=0,k\neq z_i\end{cases}$
然后固定簇中心 $\mu^k$ ，最小化 $J(\mu^k)$ :
${\mu}^k=\frac{\sum_ir_{i,k}{x}^i}{\sum_ir_{i,k}}$

文章来源:https://blog.csdn.net/qq_43309286/article/details/134933967
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系我的编程经验分享网邮箱：veading@qq.com进行投诉反馈，一经查实，立即删除！