陈老师SPSS论坛

标题: SPSS系统聚类分析中,测量部分选择“区间”后,有多种距离计算方式,应该选哪一个? [打印本页]

作者: spss初学者    时间: 2016-6-25 15:37
标题: SPSS系统聚类分析中,测量部分选择“区间”后,有多种距离计算方式,应该选哪一个?
    SPSS系统聚类分析中,测量部分选择“区间”,而区间下面有多种距离计算方式。具体应该选择哪一个?


作者: 陈老师    时间: 2016-6-25 15:38
SPSS系统聚类分析中,测量部分选择“区间”,区间下面有多种距离计算方式,每一种距离的定义和运算如下:
① Euclidean距离和平方Euclidean距离:表示[display]欧式距离和欧式距离的平方,为两变量取值之差的平方和的平方根。
② 余弦:计算两个变量之间的余弦度量变量之间的相似性。
③ Pearson相关性:通过计算两个变量之间的pearson相关系数来度量变量之间的相似性
④ 切比雪夫:两个变量取值之差最大绝对值
⑤ 块:两个变量取值之差的绝对值之和
⑥ Minkowski距离:两个变量之间的距离是对取值之差的P次幂的绝对值之和再开P次方根。
⑦ 定制:两项之间的距离是对取值之差的P次幂的绝对值之和再开T次方
综合以上的解释,可以知道,“Euclidean距离”是能效性、准确度最高的,一般而言,都选择“Euclidean距离”方法,这也是SPSS中默认的方法。






欢迎光临 陈老师SPSS论坛 (http://www.spssbbs.com/) Powered by Discuz! X3.2