人工智能_机器学习083_聚类评价指标_调整兰德系数_算法公式原理解析_手写代码使用兰德系数对聚类结果评分---人工智能工作笔记0123

2023-12-29 10:26:26

然后我们再来看一下另一个评价聚类指标的系数,可以看到兰德系数

上面RI= a+b/C2 ... 首先要知道这里的C,就是实际的类别,就是我们在业务上知道的类别数,然后K表示聚类以后的结果

当然当C==K 一样的时候,说明聚类效果是最好的对吧.

a表示在C中被划分为同一类,也就是,比如一组数据实际被分为了3类,那么a,就表示在C这种实际划分为比如3类,中的划分为同一簇的实例的数量, 也就是实际C这种划分,被划分为同一簇的数据的数量

比如一组数据,实际被划分为3类,这就是C,这种实际划分情况,那么3类就有3个簇,那么a就表示在这3个簇,比如c,d,e 这3个簇中,归属于c这一个簇的数据的数据量

同时同时使用聚类算法获取的K类中对应的同一簇的数据的数量对

b表示在C中被划分为不同类别,在K中被划分为不同簇的实例的数据量比如一个数据在C中被划分到了c簇,在K中被划分到了d簇对吧,这样的数据的数量

后面ARI是对兰德系数进行了一下改进,这个改进了以后的兰德系数,更有说服力

然后我们看一下如何实际使用

首先我们导入兰德系数

from sklearn.metrics import adjusted_rand_score 导入兰德系数

for k in range(2,7): 划分的数据的范围指定从2到7中找,最合理的分类个数

kmeans = KM

文章来源:https://blog.csdn.net/lidew521/article/details/135282393
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系我的编程经验分享网邮箱：veading@qq.com进行投诉反馈，一经查实，立即删除！