简介
聚类分析,又称群分析,指对样本数据的一种划分与归类的一种方法。聚类算法以相似性为基础,将样本数据中按照相似度不同分成不同的族群(类别)中。同一族群中,样本相似性相差小;不同族群中,样本相似性差异较大。
Meanshift,又称均值漂移算法,是一种基于核密度的估计算法,将每个族群的中心点移动到该族群的密度最大的位置,来对样本进行分类。
相较于其他分类算法,$Meanshift$ 不需要指定分类的族群数量,而是根据样本特性自动生成不同类别的族群。其广泛应用于聚类、图像平滑、分割、跟踪等方面。
本文以聚类为例,探讨 $Meanshift$ 的原理及实现。