[数学]2012数模.ppt

  1. 1、本文档共328页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[数学]2012数模

* * * * * * * * 非球状数据的聚类分析 * * * * * * * * * * * 方法六、主成分分析 * * * * * * * * 例3变量为:患病程度和牛群大小,原始数据如下表: 没有(0) 低(1) 高(2) 小 9 5 9 中 18 4 19 大 11 88 136 * * 这几个关联性统计量的取值范围:-1到1; 值接近1时表示正关联; 值接近-1时表示负关联; 值接近0时表示无关联; * 奶牛疾病数据 herdsize disease Frequency| Expected | 0| 1| 2| Total ---------|--------|--------|--------| large | 11 | 88 | 136 | 235 | 29.866 | 76.237 | 128.9 | ---------|--------|--------|--------| medium | 18 | 4 | 19 | 41 | 5.2107 | 13.301 | 22.488 | ---------|--------|--------|--------| small | 9 | 5 | 9 | 23 | 2.9231 | 7.4615 | 12.615 | ---------|--------|--------|--------| Total 38 97 164 299 * 奶牛疾病数据 Tatistic(统计量) Value ASE(标准差的估计值) ------------------------------------------------------- Gamma -0.4113 0.1009 Kendalls Tau-b -0.2173 0.0606 Stuarts Tau-c -0.1482 0.0436 Somers D C|R -0.2762 0.0780 Somers D R|C -0.1710 0.0482 Pearson Correlation -0.2816 0.0660 Spearman Correlation -0.2331 0.0656 Lambda Asymmetric C|R 0.0000 0.0000 Lambda Asymmetric R|C 0.1094 0.0794 Lambda Symmetric 0.0352 0.0264 Uncertainty Coefficient C|R 0.0990 0.0256 Uncertainty Coefficient R|C 0.1437 0.0375 Uncertainty Coefficient Symmetric 0.1172 0.0302 Sample Size = 299 * 结论: 因为Kendall的Tau-b的值为-0.217,所以随着牛群的增大患病程度也增加; Kendall的Tau-b的95%置信区间为 [-0.3362,-0.0984],该置信区间不包含零点,能完全地确信患病程度和牛群大小之间的有序关联是显著的。 * * 方法五、聚类分析 * * * 类个数的确定 1.由适当的阈值确定 2.根据数据点的散布图直观地确定类的个数 3.根据统计量确定分类个数 4.根据谱系图确定分类个数 * 二、系统聚类分析的方法

文档评论(0)

jiupshaieuk12 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6212135231000003

1亿VIP精品文档

相关文档