- 1、本文档共116页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第四章 相关分析与回归分析 4.1 简单相关分析 4.2 回归分析 4.3 非线性回归 4.1 简单相关分析 4.1.1 相关分析的基本概念 4.1.2 用INSIGHT模块作相关分析 4.1.3 用“分析家”作相关分析 4.1.1 相关分析的基本概念 1. 散点图 散点图是描述变量之间关系的一种直观方法。我们用坐标的横轴代表自变量X,纵轴代表因变量Y,每组数据(xi,yi)在坐标系中用一个点表示,由这些点形成的散点图描述了两个变量之间的大致关系,从中可以直观地看出变量之间的关系形态及关系强度。 图4-1就是不同形态的散点图。 (a) (b) (c) (d) 就两个变量而言,如果变量之间的关系近似地表现为一条直线,则称为线性相关,如图4-1(a)和(b);如果变量之间的关系近似地表现为一条曲线,则称为非线性相关或曲线相关;如图4-1(c);如果两个变量的观测点很分散,无任何规律,则表示变量之间没有相关关系,如图4-l(d)。 2. 相关系数 相关系数是对变量之间关系密切程度的度量。若相关系数是根据总体全部数据计算的,称为总体相关系数,记为ρ;总体相关系数的计算公式为: 其中COV(X,Y)为变量X和Y的协方差,D(X)和D(Y)分别为X和Y的方差。 若相关系数是根据样本数据计算的,则称为样本相关系数(简称为相关系数),记为r。样本相关系数的计算公式为: 一般情况下,总体相关系数ρ是未知的,我们通常是将样本相关系数r作为ρ的近似估计值。 相关系数r有如下性质: ● 相关系数的取值范围:–1 ≤ r ≤ 1,若0 r ≤ 1,表明X与Y之间存在正线性相关关系,若–1 ≤ r 0,表明X与Y之间存在负线性相关关系。 ● 若r = 1,表明X与Y之间为完全正线性相关关系;若r = –1,表明X与Y之间为完全负线性相关关系;若r = 0,说明二者之间不存在线性相关关系。 相关系数r有如下性质: ● 当–1 r 1时,为说明两个变量之间的线性关系的密切程度,通常将相关程度分为以下几种情况:当| r | ≥ 0.8时,可视为高度相关;0.5 ≤ | r | 0.8时,可视为中度相关;0.3 ≤ | r | 0.5时,视为低度相关;当| r | 0.3时,说明两个变量之间的相关程度极弱,可视为不相关。但这种解释必须建立在对相关系数进行显著性检验的基础之上。 3. 相关系数的显著性检验 相关系数的显著性检验也就是检验总体相关系数是否显著为0,通常采用费歇尔(Fisher)提出的t分布检验,该检验可以用于小样本,也可以用于大样本。检验的具体步骤如下: 1) 提出假设:假设样本是从一个不相关的总体中抽出的,即 H0:ρ = 0;H1:ρ ≠ 0 1) 提出假设:假设样本是从一个不相关的总体中抽出的,即 H0:ρ = 0;H1:ρ ≠ 0 2) 由样本观测值计算检验统计量: 的观测值t0和衡量观测结果极端性的p值: p = P{| t | ≥ | t0 |} = 2P{t ≥ |t0|} 3) 进行决策:比较p和检验水平?作判断:p ?,拒绝原假设H0;p ? ?,不能拒绝原假设H0。 4. 置信椭圆 可以生成两类置信椭圆: ● 均值置信椭圆:预测两变量均值的置信区域; ● 预测值置信椭圆:预测两变量分布个别观测值的置信区域。 关于预测值置信椭圆的两点说明: 1) 作为置信曲线,表示数据以设定的百分率(置信水平)落入的椭圆区域; 2) 作为相关性指标。若两个变量不相关,椭圆应该为圆;两个相关的变量有拉长的椭圆,可以用椭圆长短轴之比来衡量相关的程度。 4.1.2 用INSIGHT模块作相关分析 【例4-1】一家大型商业银行在多个地区设有分行,其业务主要是进行基础设施建设、国家重点项目建设、固定资产投资等项目的贷款。近年来,该银行的贷款额平稳增长,但不良贷款额也有较大比例的提高,这给银行业务的发展带来较大压力。为弄清楚不良贷款形成的原因,希望利用银行业务的为弄清楚不良贷款形成的原因,希望利用银行业务的有关数据做些定量分析,以便找出控制不良贷款的办法。表4-1就是该银行所属的25家分行2002年的有关业务数据。 表4-1 某商业银行2002年的主要业务数据 银行想知道,不良贷款是否与贷款余额、应收贷款、贷款项目的多少、固定资产投资等因素有关?如果有,是一种什么样的关
您可能关注的文档
- Red Hat Enterprise Linux服务器配置实例教程 白戈力 9新.ppt
- RFID技术与应用 方龙雄 RFID原理与应用-第六章新.ppt
- RFID技术与应用 方龙雄 RFID原理与应用-第三章新.ppt
- RFID技术与应用 方龙雄 RFID原理与应用-第四章新.ppt
- RFID技术与应用 方龙雄 RFID原理与应用-第五章新.ppt
- S7-200 PLC编程及应用 第2版 廖常初 第1、2章200新.ppt
- S7-200 PLC编程及应用 第2版 廖常初 第3章200新.ppt
- S7-200 PLC编程及应用 第2版 廖常初 第4章200新.ppt
- S7-200 PLC编程及应用 第2版 廖常初 第5章200新.ppt
- S7-200 PLC编程及应用 第2版 廖常初 第6章200新.ppt
文档评论(0)