数学中国

 找回密码
 注册
搜索
热搜: 活动 交友 discuz
查看: 3865|回复: 6

2010世界杯各队数据的主成分分析

[复制链接]
发表于 2010-7-12 08:47 | 显示全部楼层 |阅读模式
[这个贴子最后由luyuanhong在 2013/07/22 10:57pm 第 2 次编辑]

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
 楼主| 发表于 2010-7-12 10:19 | 显示全部楼层

2010世界杯各队数据的主成分分析

                     最长距离法得到的聚类结果(分为 8 类)
第1类:  乌拉 希腊 斯洛 韩国 斯洛 葡萄 美国 巴拉
第2类:  南非 喀麦 法国 塞尔 德国 荷兰 科特
第3类:  日本 新西 瑞士 洪都
第4类:  尼日 阿尔 加纳 澳大 丹麦
第5类:  朝鲜
第6类:  墨西 英格 智利 意大
第7类:  阿根 巴西
第8类:  西班
                     中间距离法得到的聚类结果(分为 8 类)
第1类:  乌拉 日本 新西 瑞士 洪都
第2类:  尼日
第3类:  阿尔 加纳 澳大 丹麦
第4类:  朝鲜
第5类:  墨西 英格 智利 南非 喀麦 法国 塞尔 德国 荷兰 科特 韩国 斯洛 希腊 斯洛
          美国 巴拉 葡萄
第6类:  意大
第7类:  阿根 巴西
第8类:  西班
                      重心法得到的聚类结果(分为 8 类)
第1类:  乌拉 日本 新西 瑞士 洪都
第2类:  墨西 英格 智利 法国 塞尔 德国 荷兰 科特 喀麦 南非 韩国 斯洛 希腊 斯洛
          美国 巴拉 葡萄
第3类:  尼日
第4类:  阿尔 加纳 澳大 丹麦
第5类:  意大
第6类:  朝鲜
第7类:  阿根 巴西
第8类:  西班
                     类平均法得到的聚类结果(分为 8 类)
第1类:  乌拉 日本 新西 瑞士 洪都
第2类:  朝鲜
第3类:  墨西 英格 智利 南非 喀麦 法国 塞尔 德国 荷兰 科特
第4类:  韩国 斯洛 希腊 斯洛 美国 巴拉 葡萄
第5类:  尼日
第6类:  阿尔 加纳 澳大 丹麦
第7类:  意大
第8类:  阿根 巴西 西班
                     离差平方和法得到的聚类结果(分为 8 类)
第1类:  乌拉 希腊 斯洛 葡萄 韩国 斯洛 美国 巴拉
第2类:  日本 新西 瑞士 洪都
第3类:  尼日
第4类:  朝鲜
第5类:  阿尔 加纳 澳大 丹麦
第6类:  墨西 英格 智利 意大
第7类:  阿根 巴西 西班
第8类:  南非 喀麦 法国 塞尔 德国 荷兰 科特
                     最短距离法得到的聚类结果(分为 8 类)
第1类:  乌拉 日本 新西 瑞士 墨西 南非 法国 塞尔 德国 荷兰 科特 英格 智利 韩国
          斯洛 斯洛 希腊 美国 巴拉 阿尔 加纳 澳大 丹麦 喀麦
第2类:  阿根 巴西
第3类:  西班
第4类:  洪都
第5类:  葡萄
第6类:  尼日
第7类:  意大
第8类:  朝鲜
发表于 2010-8-18 01:40 | 显示全部楼层

2010世界杯各队数据的主成分分析

陆教授能否解释一下这个图?看不太明白,不过挺好玩的。。。
 楼主| 发表于 2010-8-18 14:49 | 显示全部楼层

2010世界杯各队数据的主成分分析

下面引用由qingjiao2010/08/18 01:40am 发表的内容:
陆教授能否解释一下这个图?看不太明白,不过挺好玩的。。。
在“主成分分析”的图示中,每一个向量(从原点出发的箭头),表示一种统计指标
(如“进球数”“失球数”“控球率”等),每一个点,表示一次观测(如“巴西”
“阿根廷”“西班牙”“朝鲜”等各球队的统计数据)。
------------------------------------------------------------------------------
两个指标的向量方向相同或近似相同,表示这两个指标有正相关关系(如“传球率”
与“控球率”的方向近似相同,说明若传球好则控球也好,若传球差则控球也差)。
两个指标的向量方向相反或近似相反,表示这两个指标有负相关关系(如“进球数”
与“失球数”的方向近似相反,说明往往进球多就失球少,失球多就进球少)。
-------------------------------------------------------------------------------
一个点与一个向量的方向比较接近,说明这个点代表的球队在这个指标上有突出表现
(如“西班牙”这个点与“传球率”这个向量很接近,说明西班牙队传球特别好。
又如“朝鲜”这个点与“失球数”这个向量很接近,说明朝鲜队失球特别多。)
---------------------------------------------------------------------------
两个点比较接近,说明这两个点代表的球队风格很近似(如“德国”与“荷兰”风格
很相似,“巴拉圭”与“乌拉圭”风格很相似)。
发表于 2010-8-19 01:39 | 显示全部楼层

2010世界杯各队数据的主成分分析

“巴拉圭”与“乌拉圭”风格很相似
================================
是相似,但有不同。巴/乌都打防守反击,但巴守强于乌守,乌攻强于巴攻。
陆教授的图是否反映这一点?或者小组赛的数据不够全面?
发表于 2010-8-19 01:45 | 显示全部楼层

2010世界杯各队数据的主成分分析

另外,您这个是多维向量图了?
多维向量怎么决定每个点(就是每支队)的距离远近呢?
数据显示,巴西/阿根廷的传球成功率较高,但抢断成功率不高?
 楼主| 发表于 2010-8-21 00:14 | 显示全部楼层

2010世界杯各队数据的主成分分析

下面引用由qingjiao2010/08/19 01:45am 发表的内容:
另外,您这个是多维向量图了?
多维向量怎么决定每个点(就是每支队)的距离远近呢?
数据显示,巴西/阿根廷的传球成功率较高,但抢断成功率不高?

对,实际上这是一个多维向量图,但为了能显示出来,将它投影成了一个2维平面图。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|数学中国 ( 京ICP备05040119号 )

GMT+8, 2025-7-8 01:49 , Processed in 0.096281 second(s), 16 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表