互联网信用信息数据源分布及可信等级划分-2019年文档.pdf

下载文档

23
0
约5.18千字
约 6页
2021-11-26 发布于上海
举报
版权申诉
保障服务

互联网信用信息数据源分布及可信等级划分-2019年文档.pdf

1、本文档共6页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

互联网信用信息数据源分布及可信等级划分一、引言信用信息是评价信息主体信用状况的重要基础，除了传统征信业务中广泛使用的信息主体基本信息、金融信息外，数据挖掘、云计算等技术的快速发展使得利用互联网信用信息来评价信息主体信用状况成为了可能 [1] 。但是由于互联网数据量庞大而且分布广泛等特点，如何从海量数据中区分出信用信息是本文主要解决的问题，文章将系统的对互联网信用信息分布情况进行调研、分类，并对不同类别的信息可信等级进行划分，即对评价信息主体信用状况的贡献程度，为今后利用互联网信用信息进行信息主体信用状况评价奠定基础。二、互联网信用信息可信等级划分信用评分业务对信息的质量有着很高的要求，质量差，准确性低的信用信息会导致评价模型准确率降低，从而可能引起被评价主体对于信息的来源或模型准确性的质疑，而如何定义信用信息的质量是一个难点问题。本研究中，所使用的信用信息全部来自互联网，而互联网数据质量参差不齐，任何人都可以自由发表言论，为了区分不同信用信息的质量，本文提出了一种信息可信等级划分机制，即不同类型或来源的信用信息对信息主体信用的影响程度也是不同的，如来自政府部门的信用信息，由于其权威性，因此在评价信息主体信用时具有很高的参考价值，我们认为它的可信等级是最高的。而对于社交媒体评价信息，由于其来源和真实性无法验证，因此我们认为它的可信等级是非常低的。通过对信用信息进行可信等级划分，能够清晰的把握每类信用信息对信息主体信用状况的影响程度，也为后续信用评分模型的构建提供了基础。 2.1 国内外研究现状通过对现有工作的调研发现， Robert Harris （1994）曾经从可信度、准确性、合理性和支持度四个维度来评价网络信息内容；弗兰内金与麦兹格于 2000 年在准确性、权威性、客观性、时效性以及信息的广度和深度等 5 个维度的基础上，将其分解为以下 9 个项目用以考察网站信息的可信度 [3] ：（1）网站的作者或责任者；（2 ）网站是否提供了作者或责任者的联系方式；（3 ）网站作者或责任者的资质或信誉；（ 4）网站作者或责任者的传播目的；（ 5）信息是否及时新鲜；（ 6 ）能否通过其他来源核实网站信息；（ 7）是否有其他权威信息来源推荐；（ 8 ）网站所载信息是观点还是事实；（ 9）信息是否完整、全面。 2.2 划分标准通过总结本文信用信息数据源自身的特点并根据以上学者的相关经验，本文将通过以下评价指标进行信用信息可信等级的划分 [4-5] ，具体如表 3-1 ：（1）域名域名中包含 g

您可能关注的文档

文档评论（0）

tianya189 + 关注: 官方认证

内容提供者

该用户很懒，什么也没介绍

咨询Ta 进入空间

认证主体阳新县融易互联网技术工作室

IP属地上海

统一社会信用代码/组织机构代码: 92420222MA4ELHM75D

1亿VIP精品文档

更多 >

互联网信用信息数据源分布及可信等级划分-2019年文档.pdf