基于偏最小二乘回归分析的大坝安全监控模型研究.docx

基于偏最小二乘回归分析的大坝安全监控模型研究.docx

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于偏最小二乘回归分析的大坝安全监控模型研究 在处理和分析灾害安全监测数据并建立安全监控模型的许多方法中,多因素回归法(例如逐步回归)分析方法在国内外得到了广泛应用。为了避免回归参数的偏差,使用最小二乘法进行无精确估计,因此也被称为最小二乘法回归法。最小二乘回归分析建立在模型因子之间不存在密切的线性关系的假定基础上。而实际情况常与该假定不符,在影响大坝安全监测变量(即因变量)的各类因子(自变量)之间,往往存在着一定程度的线性或近似线性相关性,也称为多重共线性。这种因子之间的多重共线性会导致回归分析的正则方程组出现严重病态,从而使最小二乘法的参数估计不稳定,回归效果也因此大大降低。此外,受气象、水文、地形、地质、坝体材料、坝工结构特性、观测精度等因素的影响,根据各类大坝安全监测变量建立的最小二乘回归模型,其模型因子之间的相互关联程度往往难以准确判断和确定,存在一定的模糊性和不确定性。这种模型因子相关的不确定性,将直接影响各监控模型的因子变量选择与确定,也会在一定程度上影响各模型分量的分离结果,从而导致回归结果偏离实际;或者虽然回归模型的复相关系数R较高,但由于各影响因子之间存在多重共线性干扰,使模型分离出的各个影响分量无法对大坝实测变量的变化作出合理的物理成因解释。针对目前常用的最小二乘法存在的不足,本文将偏最小二乘回归法(Partial Least-Sguares Regression,PLSR)引入水工建筑物安全监测变量的建模分析。 1 pcr方法的基本原理 长期以来,在处理多重共线性问题时,往往是沿着先进行多重相关性分析,然后剔除部分多重相关变量这一思路进行的。但对于如何检验因子之间的多重相关性,却始终没有切实可靠的方法和准则;同时,剔除部分多重相关变量,常会使模型产生一定的解释误差,甚至产生错误结论。 1965年,W.F.Massy提出了主成分回归(Principal Component Regression,简称PCR)方法。其具体做法是先对含p个自变量的解释变量系统X的信息进行调整组合,从中提取m个(mp)彼此完全无关的综合变量F1,F2,……,Fm(称为主成分),它们能最多地反映X中的数据信息,并对多重相关信息和无解释意义的干扰信息进行剔除;然后将F1,F2,…,Fm作为解释变量,再进行因变量系统Y的回归分析。主成分回归分析在力保数据信息损失最小的原则下,通过对高维(p维)自变量空间的降维处理,在一定程度上消除了原自变量系统X的多重共线性。然而,由于提取X的主成分是独立于因变量Y而进行的,没有考虑到X对Y的解释作用,这就增加了所建模型的不可靠性。不过,PCR方法这种信息提取的思想是非常有价值和值得借鉴的。 针对回归建模时因子间的多重共线性干扰问题,S.Wold和C.Albano在1983年提出了偏最小二乘回归(Partial Least-Squares Regression,简称PLSR)方法。PLSR吸取了主成分回归分析中从解释变量提取信息的思想,同时还注意了主成分回归中所忽略的自变量对因变量的解释问题。 1.1 lagrange乘数法,主要考 大坝安全监测数据建模,一般只针对水平位移、垂直位移、挠度变形、接缝开合度、渗透压力或者应力应变等监测量中的某一个因变量进行。因此,利用PLSR方法建立的大坝安全监控模型,称为单因变量的偏最小二乘回归分析模型。 记大坝安全监测某一实测变量(因变量)为y∈Rn,由水压、温度、雨量及时效等影响因子(自变量)组成的自变量集合为X=[x1,x2,…,xm],xj∈Rn。记E0、F0分别为X、y进行中心化-压缩标准化处理后的标准化单位向量。 第一步,分别对E0、F0提取第一个主成分t1=E0w1和u1=F0c1,其中w1、c1是相应于E0、F0的第一主轴,且‖w1‖=1,c1=1。 利用PLSR方法提取主成分时,必须保证自变量系统的主成分对因变量系统的主成分具有最大的解释能力,为此所提取的主成分之间必须满足两个基本要求:(1)应尽可能大地提取它们各自原变量系统中的数据信息;(2)二者的相关程度达到最大。这也正是PLSR方法对PCR方法的改进所在。 为了使第一主成分t1和u1满足基本要求(1)、(2),应使t1和u1的协方差取最大值,即 Cov(t1,u1)=√Var(t1)Var(u1)r(t1,u1)?max(1)Cov(t1,u1)=Var(t1)Var(u1)????????????√r(t1,u1)?max(1) 式中:Cov(*,*)为协方差算子;Var(*)为方差算子;r(t1,u1)为主成分t1和u1的相关系数。 式(1)实际上是在‖w1‖=1和c1=1的约束条件下,求w′1E′0F0c1的最大值优化问题。采用Lagrange乘积算法,记S=w′1E′0F0c1-λ1

您可能关注的文档

文档评论(0)

xlwkyc + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档