K-Means聚类分析
一、实验方法
K-Means聚类分析
二、实验目的
根据2001年全国31省市自治区各类小康和现代化指数的数据,用Spass对地区进行K-Means聚类分析。
三、实验数据
北京 上海 天津 浙江 广东 江苏 辽宁 福建 山东 黑龙江 吉林 湖北 陕西 河北 山西 海南 重庆 内蒙古 湖南 青海 四川 宁夏 安徽 云南
综合指数 社会结构 经济与技术发展 人口素质 生活质量 法制与治安 93.2 100 94.7 108.4 97.4 55.5 92.3 95.1 92.7 112 95.4 57.5 87.9 93.4 88.7 98 90 62.7 80.9 .4 85.1 78.5 86.6 58 79.2 90.4 86.9 65.9 86.5 59.4 77.8 82.1 74.8 81.2 75.9 74.6 76.3 85.8 65.7 93.1 68.1 69.6 72.4 83.4 71.7 67.7 76 60.4 71.7 70.8 67 75.7 70.2 77.2 70.1 78.1 55.7 82.1 67.6 71 67.9 81.1 51.8 85.8 56.8 68.1 65.9 73.5 48.7 79.9 56 79 65.9 71.5 48.2 81.9 51.7 85.8 65 60.1 52.4 75.6 66.4 76.6 .1 73.2 41 73 57.3 87.8 .1 71.6 46.2 61.8 54.5 100 69.7 41.9 76.2 63.2 77.9 63.2 73.5 42.2 78.2 50.2 81.4 60.9 60.5 40.3 73.9 56.4 84.4 59.9 73.8 43.7 63.9 47 80.1 59.3 60.7 43.5 71.9 50.6 78.5 58.2 73.5 45.9 67.1 46.7 61.6 .7 71.2 57.2 75.1 57.3 .6 56.7 61.3 41.2 63.5 52.5 72.6 56.7 59.4 49.8 59.8 48.1 72.3
甘肃 56.6 66 36.6 66.2 45.8 79.4
四、分析方法与结果
表一 31个省市自治区小康和现代化指数的K-Means聚类分析结果(一)
初始聚类中心
综合指数 社会结构 经济与技术发展 人口素质 生活质量 法制与治安
聚类
1 79.20 90.40 86.90 65.90 86.50 59.40 2 92.30 95.10 92.70 112.00 95.40 57.50 3 51.10 61.90 31.50 56.00 41.00 75.60
迭代历史记录 聚类中心中的变动 迭代 1 2 1 24.387 .000 2 6.307 .000 3 23.579 .000 aa. 由于聚类中心中不存在变动或者仅有小幅变动,因此实现了收敛。任何中心的最大绝对坐标变动为 .000。当前迭代为 2。初始中心之间的最小距离为 49.349。
ANOVA
综合指数 社会结构 经济与技术发展 人口素质 生活质量 法制与治安
聚类 均方 1633.823 1539.872 4381.296 1817.856 3315.174 530.188 自由度
2 2 2 2 2 2 均方
误差
自由度
28 28 28 28 28 28 F 72.556 32.547 77.190 24.446 55.928 6.950 显著性
.000 .000 .000 .000 .000 .004 22.518 47.312 56.760 74.363 59.276 76.284 由于已选择聚类以使不同聚类中个案之间的差异最大化,因此 F 检验只应该用于描述目的。实测显著性水平并未因此进行修正,所以无法解释为针对“聚类平均值相等”这一假设的检验。
每个聚类中的个案数目 聚类
1 2 3
有效 缺失
7.000 3.000 21.000 31.000 .000