利用LogisticRegression建立贷款申请最大化利润模型.docxVIP

下载本文档

5
0
约5.44千字
约 6页
2022-09-13 发布于广东
举报
版权申诉

利用LogisticRegression建立贷款申请最大化利润模型.docx

1、本文档共6页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

利用LogisticRegression建立贷款申请最大化利润模型　　摘要：随着金融证券化的发展，银行已由卖方市场转到了买方市场。因此，争夺实力雄厚、信用度高、还款能力强的客户是商业银行主要的竞争。文章综述了利用人工智能方法在贷款申请预测方面的研究。将利用logisticregression算法建立贷款申请最大化利润模型，同时利用机器学习的基本理论，证明本模型的泛化性良好。　　关键词：人工智能;logisticregression;贷款申请;机器学习　　一、前言　　银行贷款，指的是银行根据国家政策以一定的利率将资金贷放给资金需要者，并约定期限归还的一种经济行为。一般要求房屋抵押、提供担保、收入证明、个人征信良好才可申请。　　近年来，随着政策的进一步开放与人民消费理念的进步，我国商业银行个人消费贷款发展迅速，个人消费贷款占银行贷款总额的比重逐年增长，并逐步成为银行主要的业务和效益来源之一。随着金融证券化的发展，银行在贷款这项金融活动中也面临诸多的风险，如利润风险、流动性风险、信用风险等。因此，如何提高信贷资产的安全性，如何对申请贷款的用户进行正确的信用评估，严格避开不良借贷的风险，成为了一家银行能否平稳运行的重中之重。　　早在1998年5月，中国人民银行便参照国际惯例，结合我国国情，制定了《贷款分类指导原则》，要求商业银行依据借款人的实际还款能力进行贷款质量的五级分类，即按风险程度将贷款划分为五类：正常、关注、次级、可疑、损失，后三种为不良贷款。不良的贷款首先对银行来说是一种极大的利益损害，当银行的不良贷款过多的时候，就会极大的影响银行的经营运转。对社会而言，不良贷款也起到负面的影响，并形成一系列的不良反应。所以银行想要的便是借款人能够履行合同，能正常还本付息，及时偿还全款的正常贷款。　　随着互联网金融的发展，传统的分析方法和手段已经不能满足金融贷款公司越来越高的成本利润分析要求，大数据技术的出现，满足了金融贷款公司的动态，灵活，实时的分析需求。经研究，影响个人贷款还款的主要因素有：借款人信用状况，借款人就业情况与从业时间，借款人的收入来源与消费倾向，借款人的年龄，学历，婚姻家庭状况等。本文将综合上述因素进行分析，利用传统机器学习，构建贷款模型，尽量降低银行的贷款风险。研究意义有以下方面：从理论上讨论了利用logisticregression建立贷款申请最大化利润模型的可行性，并运用机器学习的理论证明其合理性;运用现有少量数据集对所建立的模型进行验证;为银行今后制作相关的网络系统提供制作算法，制作理念和制作核心。　　二、探究基于传统机器学习的贷款模型　　（一）机器学习　　1.简介　　机器学习是人工智能的核心，是利用人工智能解决现实问题的理论基础。机器学习能够以数据为学习对象，从数据中挖掘数据内在的信息从而不断迭代训练，总结出仅靠人类无法发现的潜在规律和问题，机器学习的运用也在生活中变得越来越广泛，例如在数据挖掘、计算机视觉、自然语言处理、语音识别等都有相应的推广。　　2.监督学习与无监督学习　　机器学习中被最广泛采纳的两大机器学习方法是监督学习和无监督学习。大约70%的机器学习是监督学习，无监督学习大概占10%～20%，有时也会使用1半监督学习和强化学习。本文将使用的决策树，svm算法以及logisticregression就属于监督学习算法。　　监督学习就像已经知道所需输出的输入，运用已知的数据信息训练算法。首先学习算法会获得对应所求输出的数据标签，算法会将实际输出与所求输出进行对比练习，找到错误。然后对现有模型进行修改，通过分类、回归、梯度下降等方法，最终使算法可以通过新的数据来预测可能的结果。例如，本文就是为了预测什么样的贷款交易是有风险的。　　无监督学习，与监督学习恰恰相反，使用无历史标签的相反数据。系统不会被告知正确的输出，算法必须自己探索所求输出。无监督学习对事务性数据的处理效果很好。例如，它可以识别有一些具有相同属性的贷款客户群体，或者它可以找到主要属性将客户群体彼此区分开。　　（二）建立贷款模型　　前文已经简述了机器学习的相关内容，我们知道机器学习是能够基于数据建模学习的一种方法，对大数据条件下的问题可以通过机器学习算法模型挖掘数据中大量的潜在价值和信息，从而指导人类分析和解决问题。我们回到本文的贷款申请最大化利润问题，我们需要評判的是用户是否具备还款的能力，从而决定是否给出该用户的借贷资格，这是个很典型的分类问题，希望通过用户的个人信息，建立模型给出一个评估结果（同意贷款或不同意贷款）。尝试通过算法模型分析出一名用户具备还款能力的可能性，以此辅