DBSCAN聚类算法Python实现

原理

DBSCAN是一种基于密度的聚类算法,这类密度聚类算法一般假定类别可以通过样本分布的紧密程度决定。同一类别的样本,他们之间的紧密相连的,也就是说,在该类别任意样本周围不远处一定有同类别的样本存在。

通过将紧密相连的样本划为一类,这样就得到了一个聚类类别。通过将所有各组紧密相连的样本划为各个不同的类别,则我们就得到了最终的所有聚类类别结果。

一些概念

 

x1是核心对象,x2由x1密度直达,x3由x1密度可达,x3与x4密度相连

伪码

python代码

 

效果

选用iris鸢尾花数据集更改

 

缺点

参数敏感Eps , MinPts ,若选取不当 ,会造成聚类质量下降。

 

留下评论

您的电子邮箱地址不会被公开。 必填项已用 * 标注