聚类分析统计量有哪些

聚类分析统计量有哪些


一、栖霞网友解答:


1.聚类分析是研究“物以类聚”的一种科学有效的方法.做聚类分析时,出于不同的目的和要求,可以选择不同的统计量和聚类方法.

2.系统聚类是目前应用最为广泛的一种聚类方法,其基本思想是:先将待聚类的n个样品(或者变量)各自看成一类,共有n类;

3.然后按照实现选定的方法计算每两类之间的聚类统计量,即某种距离(或者相似系数),将关系最为密切的两类合为一类,其余不变,即得到n-1类;

4.再按照前面的计算方法计算新类与其他类之间的距离(或相似系数),再将关系最为密切的两类并为一类,其余不变,即得到n-2类;


二、临湘网友解答:


1.无论是R型聚类还是Q型聚类,关键是如何定义相似性.即如何把相似性数量化.聚类的第一步需要给出两个指标或两个样本间相似性度量的统计量.

2.聚类分析中用来衡量样本个体之间属性相似程度的统计量以及指标变量之间属性相似度的统计量是不同的,前者用的统计量是距离系数,后者用的统计量是相似系款.

3.距离系数的定义有很多,如欧式距离、极端距离、绝对距离等.相似系数的定义也很多,如相关系数、列联系数等.