简述K-means算法的基本过程及其不足.《数据挖掘》作业题追分100

来源:学生作业帮助网 编辑:作业帮 时间:2024/07/20 21:01:09
简述K-means算法的基本过程及其不足.《数据挖掘》作业题追分100
xSMn@ pKBD\ H"\4̯[cJH!(#0of }b]3{L<`ӷۛ=tVg#t]j džE Y[@6-[ԠV-I#|m` Z"{CxD_ntxH8# ɊO{yZ\uO 63a1AH_VB{#LIɁ|M+\{Aʩ'qH %S[aL6nMxhJ8hy[Pj/i?\_ 6#V c\RX{}eПX+%pt*_o9D3ס4ύ`9 ,C "/t2K}'DB"*wvOꊬXlpƘa]c= eANh]L&8!3Sh^%@>PhPX=mpe7T| ܠM[VA[)Dzާn 5d

简述K-means算法的基本过程及其不足.《数据挖掘》作业题追分100
简述K-means算法的基本过程及其不足.《数据挖掘》作业题追分100

简述K-means算法的基本过程及其不足.《数据挖掘》作业题追分100
1、 从 n个数据对象任意选择 k 个对象作为初始聚类中心;
2、 根据每个聚类对象的均值(中心对象),计算每个对象与这些中心对象的距离;并根据最小距离重新对相应对象进行划分;
3、 重新计算每个(有变化)聚类的均值(中心对象)
4、循环步骤2和3,直到每个聚类不再发生变化为止
缺点:
1、聚类个数K需要自己决定,因此在不知道具体有多少类时需要从2开始多次尝试,选择最好的
2、当k确定时,聚类效果和初始中心选择有关,所以算法很不稳定
3、算法在维数较多时,由于需要多次迭代,花费时间较长