聚类与分类分析之间有什么区别

来源:学生作业帮助网 编辑:作业帮 时间:2024/04/29 17:01:48
聚类与分类分析之间有什么区别

聚类与分类分析之间有什么区别
聚类与分类分析之间有什么区别

聚类与分类分析之间有什么区别
通常,为有监督分类提供若干已标记的模式(预分类过),需要解决的问题是为一个新遇到的但无标记的模式进行标记.在典型的情况下,先将给定的无标记的模式用来学习〔训练),反过来再用来标记一个新模式.聚类需要解决的问题是将已给定的若千无标记的模式聚集起来使之成为有意义的聚类.从某种意义上说,标一记也与聚类相关,但这些类型的标记是由数据驱动的,也就是说,只是从数据中得到这些标记.聚类与数据挖掘中的分类不同,在分类模块中,对于目标数据库中存在哪些类是知道的,要做的就是将每一条记录分别属于哪一类标记出来:与此相似但又不同的是,聚类是在预先不知道目标数据库到底有多少类的情况下,希望将所有的记录组成不同的类或者说“聚类”,并且使得在这种分类情况下,以某种度量为标准的相似性,在同一聚类之间最小化,而在不同聚类之间最大化.事实上,聚类算法中很多算法的相似性都是基于距离的,而且由于现实数据库中数据类型的多样性,关于如何度量两个含有非数值型字段的记录之间的距离的讨论有很多,并提出了相应的算法.在很多应用中,聚类分析得到的每一个类中的成员都可以被统一看待.