人工智能_机器学习081_聚类评价指标_轮廓系数_公式理解---人工智能工作笔记0121
2023-12-28 12:08:10
然后我们再来看,那么对于数据来说,我们分成几类比较合适呢,怎么衡量呢?
我们之前做分类的时候,用的是准确率对吧,然后做回归问题的时候,用均方误差.
而我们在Kmeans衡量分成几类比较好用的函数是,轮廓系数对吧,可以看到上面是
轮廓系数的公式
可以看到,他有两个点? 可以看到公式中的a和b
a,表示?某个样本?和?它所在的簇内的,其他样本的平均距离,?其实聚类分的好不好,主要是,我们希望一个类别,也就是一个簇中,的数据点,帖的越紧密越好对吧.
b.某个样本?与其他簇内样本的平均距离,?这个其实就是说簇?与?簇之间的距离越远越好对吧,就表示分的越开?对吧
所以根据公式我们可以看到,
假如当a=0 ,那么这个时候 S的值最大对吧,因为?分子最大?对吧,所以轮廓系数公式 的值越大越好
我们希望a越小越好,最小是0? 然后b越大越好对吧.
这个就是轮廓系数公式,用来衡量?聚类算法分的好不好
文章来源:https://blog.csdn.net/lidew521/article/details/135262837
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。 如若内容造成侵权/违法违规/事实不符,请联系我的编程经验分享网邮箱:veading@qq.com进行投诉反馈,一经查实,立即删除!
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。 如若内容造成侵权/违法违规/事实不符,请联系我的编程经验分享网邮箱:veading@qq.com进行投诉反馈,一经查实,立即删除!