《数据分析》实验报告三.pdf

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

《数据分析》实验报告三--第1页

精品

课程名称数据分析方法课程编号

实验地点系统建模与仿真实验室SL110实验时间

校外指导教师无校内指导教师

实验名称实验3距离判别与贝叶斯判别分析

评阅人签字成绩

实验数据与内容

我国山区某大型化工厂,在厂区及邻近地区挑选有代表性的15个大气取样点,每日4次同时抽取

大气样品,测定其中含有的6种气体的浓度,前后共4天,每个取样点每种气体实测16次,计算

每个取样点每种气体的平均浓度,数据见表4-8。气体数据对应的污染地区分类见表4-8中最后一列。

现有两个取自该地区的4个气体样本,气体指标见表4-8中后4行,试解决以下问题:

1.判别两类总体的协方差矩阵是否相等,然后用马氏距离差别这4个未知气体样本的污染类别,并

计算回代误判率与交叉误判率;若两类总体服从正态分布,第一类与第二类的先验概率分别为7/15、

8/15,利用贝叶斯判别样本的污染分类。

2.先验概率为多少时,距离判别与贝时斯判别相同?调整先验概率对判别结果的影响是什么?

3.对第一类与第二类的先验概率分别为7/15、8/15,计算误判概率。

感谢下载载

《数据分析》实验报告三--第1页

《数据分析》实验报告三--第2页

精品

一、实验目的

1.熟练掌握MATLAB软件进行距离判别与贝叶斯判别的方法与步骤。

2.掌握判别分析的回代误判率与交叉误判率的编程。

3.掌握贝叶斯判别的误判率的计算。

二、实验原理

1)在MATLAB中,进行数据的判别分析命令为classify,其调用格式为:

class=classify(sample,training,group’type’)

将sample数据的每一行指定到训练集training的一个类中。Sample和training

必须具有相同的列数。group向量包含从1到组数的正整数,它指明训练营集中的每一

行属于哪一类。group和training必须具有相同的行数。’type’是可选项,

选’linear’表示总体为多元正态总体,选’quadratic’与’mahalanobis’。该函数

返回class,它是一个与sample具有相同行数的向量。Class的每一个元素指定sample

中对应元素的分类。通过计算sample和training中每一行的马氏距离,classify函数

决定sample中的每一行属于哪一个分类。

2)贝叶斯判别方法步骤

第1步,验证两个总体服从二元正态分布;第2步,检验两个总体的协方差矩阵相

等;估计两个总体的先验概p1率、p2;利用MATLAB软件计算。

3)回代误判率

设G1,G2为两个总体,x1,x2…和y1,y2…是分别来自G1,G2的训练样本,以全体

训练样本作为m+n个新样品,逐个代入已建立的判别准则中判别其归属,这个过程称为

回判。回判结果中若属于G1的样品被误判为属于G2的个数为N1个,属于G2的样品被

误判为属于G1的个数为N2个,则误判估计为:

P^=(N1+N2)/(m+n)

误判率的回代估计易于计算。但是,p^是由建立判别函数的数据反过来用作评估准

则的数据而得到的。所以有偏,往往比真实误判率小。当训练样本容量较大时,p^可以

作为真实误判率的一种估计。

4)交叉误判率估计是每次剔除一个

文档评论(0)

177****1893 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档