基于Adaboost-BP神经网络的个人信用评估研究.docx

基于Adaboost-BP神经网络的个人信用评估研究.docx

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

?

?

基于Adaboost-BP神经网络的个人信用评估研究

?

?

2.华北理工大学以升创新教育基地河北省唐山市063210

3.华北理工大学理学院河北省唐山市063210

摘要:随着我国社会主义经济转型,国内各大商业银行积极扩展个人信贷业务。同时为了符合银行风控的要求,个人信用评估体系的建立变得尤为重要。为保证银行和借贷人员双方的利益,根据所给信息以及相关数据,建立对应评估模型至关重要。

关键词:Adaboost-BP神经网络;个人信用评估;研究

引言

伴随着全球市场化,金融自由化的迅猛发展,国内银行业竞争加剧,借贷业务得到大面积推广,个人信贷业务种类也越来越丰富,银行自身对风控评估也愈发重视。

1课题研究现状

由于我国的个人信用评估系统刚刚起步,且没有统一体系,所以大部分商业银行仍然靠人为审查和人民银行征信系统来进行对借款人优劣的判定。少数大型商业银行则引进国外个人信用评估体系,如招行银行采用了Fairsaac公司的信贷审核决策系统,浦发银行则引入SAS的风险审批系统,这些都对掌握客户基本信息,了解客户还贷能力和风控方面有积极作用,但仍有其自身在某方面与我国国情不符的缺陷。

2模型建立与求解

2.1基于BP神经网络的个人信用评估模型的建立

首先,运用MATLAB将数据标准化并随机抽取560名优质客户和240名不良客户作为训练集,其余140名优质客户和60名不良客户作为测试集。基于这些数据,利用基础BP神经网络法和Adaboost改进BP神经网络算法构建模型并进行测试。

(1)权重的修改方式

一般情况下,权重的修改有两种方式:意识对于每个训练集样本,只调整一次权重,称为On-line处理;另一种是输入全部训练集样本之后才修改一次权重,称为Batch处理。本文将采用第二种方式。

(2)初始权重与初始输入的确定

由于输入初始值和初始权重对训练是否达到局部最小和是否收敛的关系很大,有必要对输入的初始值进行归一化处理。

(3)网络层次的选择

网络层次的增加可使各隐层神经元个数减少,同时使训练过程变得更容易,但有可能增加网络的训练时间。本文所建立的模型是用于模式分类的判别函数的神经网络,因此将采用三层BP网络。

(4)隐层神经元个数的确定

对于三层BP网络,确定隐层节点的主要原则是:隐层节点既不是各层中节点数最少的,也不是最多的,隐层节点数介于输入输出节点数之和的53%-70%之间;隐层节点数应小于训练样本数,若节点数大于样本数,则必有多余的节点可归并,若节点数等于样本数,则网络为插值网络,其泛化能力相对较差。

(5)权重的调整公式及训练参数的确定

采用最速下降法调整权重,对那些严重缠绕的非凸函数效果欠佳,往往不易收敛,即使能够收敛也将花费很长时间,这里采用改进BP算法。

(6)训练过程与结果

在训练过程中,在数据集中分别随机抽取80%的数据(560个优质客户和240个不良客户)作为训练集,并进行拟合;将剩余的数据作为测试集,包含140个优质客户和60个不良客户。使用train函数来训练创建的BP神经网络,设置训练步长值为1200,预期误差目标,0.165,根据题中规定,设定最优隐层节点数为20。其运算结果可以看出,经过3次迭代后,达到达到预期误差目标,且训练时间较短,模型较优。

模型训练运算结果可以看出,BP神经网络模型在训练过程中的误差比预期要大,拟合情况一般。

通过计算,得出模型测试正确率为79.50%。然而,此方法虽然运行速度快,而精度并不让人满意,所以本文拟在其基础上加入其他算法,对模型进行改进。

2.2基于Adaboost的改进算法

通过以上结果可以看出,仅凭BP神经网络算法虽能够建立相应模型,但其性能还不能达到预期,本文将把BP神经网络与Adaboost算法相结合,来对模型进行改进。

2.2.1Adaboost算法简介

Adaboost算法通过对同一个训练集训练不同的弱分类器,然后将这些弱分类器组合形成强分类器,使弱分类器间能得到互补,从而使组合后得到的强分类器有较强的泛化能力。其核心思想是重视预测误差大的样本和性能较好的弱分类器,即提高训练集中训练效果差的样本权重和学习能力强的弱分类器权重,而训练效果好的样本权重和学习能力弱的弱分类器权重将被降低。初始状态时,每个样本的权重都是相同的,在此样本分布下训练一个基本分类器。根据该分类器对训练集的预测误差来确定来确定该分类器的权重和训练集中各样本的权重,对于预测误差较大的样本,则增加其对应的样本权重;而对于预测误差较小的样本,则降低其权重。在新的样本分布下,再次对得到基本分类器以及其对应的权重。依次经过次循环,可得到个基本分类器和对应的权重向量。最后根据权重向量将个基本分类器组合起来得到强分类器。

2.2.2对Ada-BP个人信用评估模型的测试及评价

为了根据问题二

文档评论(0)

尹邦乐 + 关注
实名认证
内容提供者

尹邦乐

1亿VIP精品文档

相关文档