基于plsr的工程安全监测数据拟合与预测分析.docx

基于plsr的工程安全监测数据拟合与预测分析.docx

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于plsr的工程安全监测数据拟合与预测分析 在工程安全监测和研究中,为了回归参数,广泛应用了最小二乘法方法。 的无偏估计, 以实现对各种观测数据的模型拟合与预测, 该方法被称为最小二乘回归法。根据最小二乘法对于因变量Y={y1,y2, …,yp}和自变量X={x1,x2, …,xm}, 当它们满足高斯-马尔科夫条件假设, 则有Y的最佳估计量?Y=XB=X(X′X)-1X′YY?=XB=X(X′X)?1X′Y, 其中X′X必须为可逆矩阵。然而, 当X中不同自变量因子之间存在较密切的线性相关关系 (称为多重共线性) 时,X′X为奇异性矩阵或接近奇异, 这时如果仍然采用常规最小二乘法进行拟合, 则会使回归系数B的估计量极不合理[7,8,9,10,11,12,13,14]。实际上, 最小二乘法是建立在自变量因子之间不存在密切线性关系的假定基础 上, 而实际工程情况往往与该假定不符, 在自变量因子之间或多或少存在着一定的多重共线性, 它会导致回归分析的正则方程组出现病态, 从而使最小二乘法的参数估计不稳定, 回归拟合效果也因此大大降低。 1 处理方法的欠缺 长期以来, 在处理多重共线性问题时, 往往是沿着“先进行多重相关性分析, 然后剔除部分多重相关变量”这一思路进行的。而对于如何检验和更加有效合理地消除因子之间的多重相关性, 却始终没有切实可靠的方法和准则;同时, 按照以往的处理思路剔除部分多重相关变量, 常会使模型产生一定的解释误差, 甚至产生错误结论。 1965年, W.F.Massy提出了主成分回归 (Principal Component Regression, 简称PCR) 方法, 在力保数据信息损失最小的原则下, 通过对高维自变量空间的降维处理, 在一定程度上消除了原自变量系统X的多重共线性。 然而, 由于PCR提取X的主成分是独立于因变量Y而进行的, 没有考虑到X对Y的解释作用, 这就增加了所建模型的不可靠性。不过, PCR方法这种信息提取的思想是非常有价值和值得借鉴的。 2 偏最小二乘回归 针对多重共线性干扰问题, S.Wold和C.Albano在1983年提出了偏最小二乘回归 (Partial Least-Squares Regression, 简称PLSR) 方法。PLSR方法吸取了主成分回归分析中从解释变量提取信息的思想, 同时还考虑了自变量对因变量的解释问题。 2.1 lagrange乘子法 设有p个因变量{yk,k=1, 2, …,p}和m个自变量{xj,j=1, 2, …,m}。为了研究自变量对因变量的影响关系, 观测了n个样本点, 由此分别构成了自变量和因变量数据矩阵Xn×m=[x1,x2, …,xm]n×m、Yn×p=[y1,y2, …,yp]n×p。记Xn×m和Yn×m标准化处理后的数据矩阵分别为E0和F0。这样, 可以采用迭代算法, 在某一满意精度下, 建立自变量与因变量之间的PLSR拟合模型方程。 第1步, 分别对E0、F0提取第一个主成分t1=E0w1和u1=F0c1, 其中w1、c1是相应于E0、F0的第一主轴, 且‖w1‖=1, ‖c1‖=1。 提取主成分时, 须保证自变量系统的主成分对因变量系统的主成分具有最大的解释能力, 为此须满足两个基本要求:1) 应尽可能大地提取它们各自原变量系统中的数据信息;2) 二者的相关程度达到最大。这也正是PLSR方法对PCR方法的改进所在。 为了使第一主成分t1和u1满足基本要求1) 和2) , 应使t1和u1的协方差取最大值, 即 Cov(t1?u1)=√Var(t1)Var(u1)r(t1,u1)?max(1)Cov(t1?u1)=Var(t1)Var(u1)????????????√r(t1,u1)?max(1) 式中, Cov (*, *) 为协方差算子;Var (*) 为方差算子;r(t1,u1) 为主成分t1和u1的相关系数。 式 (1) 实际上是在‖w1‖=1和‖c1‖=1的约束条件下, 求w1′E0′F0c1的最大值优化问题。为此, 可采用Lagrange乘积算法, 记S=w1′E0′F0c1-λ1(w1′w1-1) -λ2(c1′c1-1) , 分别对S求以下偏导, 并令其为零, 有: ?S?w1=0;?S?c1=0;?S?λ1=0;?S?λ2=0(2) 根据式 (2) 可求得第一主轴w1, 并由此得第一主成分t1=E0w1。然后, 分别进行E0对t1和F0对t1的回归, 得E0=t1p1′+E1;F0=t1r1+F1。其中,E1、F1为残差矩阵,p1和r1为回归系数。 第2步, 用E1和F1取代E0和F0, 重复第1步, 求得第二主轴w2和第二主成分t2;并实行E1和F1在t1、t2上的回归, 得E1=t2p2′+E2、F1=t2r

文档评论(0)

xlwkyc + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档