无监督算法(一)

作者 : icbug 发布时间: 2020-06-7 文章热度:164 共617个字,阅读需2分钟。 手机浏览

目 录

上上篇文章已经介绍过无监督算法了,所以这里不做详情讲解,如果不了解请返回查看

聚类算法

聚类就是将相似的事物聚集在一起,而将不相似的事物划分到不同的类别过程。它是一种探索性分析,不必事先给出分类标准,聚类分析从样本出发,自动进行分类。聚类分析所使用使用方法的不同,常常会得到不一样的结论

常见算法:层次聚类,划分聚类,基于密度的聚类


K-Means

K-Means即K均为聚类,属于划分聚类。其工作原理为根据初始化的聚类中心信息,计算每个样本到这些中心的聚类,可以判断每个样本均属于某个类簇,更新类簇中心信息,重新计算每个样本到新的聚类中心的距离,重新划分样本到新的聚类中新对应的类中,进行重复执行,直达满足终止条件

我们举一个例子:

假设有N个样本,我们使用K-Means将其进行聚类的步骤如下:

  1. 确定聚类的个数k,并指定k个聚类中心C1,C2 ....Ck

  2. 计算每个样本的Si,点到k个中心的距离,并将该点归入最近的Cj类中

  3. 重新计算一下我们k个类聚的中心点,更新原有中心点的位置C1,C2 .... Ck

  4. 重复步骤2,3直到我们的中心点位置不再进行变化或者变化幅度小于约定的阀值,或者达到最大的循环次数,结束,得到最终的类聚结果


以上步骤详解:

1.确定个数

  1. 观察法

  2. 枚举法

  3. 其他的技术手段

我们确定三个中心

2.计算点和聚类中心的距离

对应的点就会归到最近的那一类上去了

3.计算最新的聚类中心

重复进行执行,进行更新。


实现伪码

详情可以了解一下K-Mean


The END...

常见问题FAQ

本站资源是否全部免费?
本站文章和普通速度下载资源免费,高速下载资源和讲解视频需要成为SVIP才能查看哦!
本站采用标准 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明!
icbug创客 » 无监督算法(一)

发表评论

CAPTCHAis initialing...