互联网信用信息数据源分布及可信等级划分-2019年文档.pdf

互联网信用信息数据源分布及可信等级划分-2019年文档.pdf

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
互联网信用信息数据源分布及可信等级划分 一、引言 信用信息是评价信息主体信用状况的重要基础, 除了传统征 信业务中广泛使用的信息主体基本信息、 金融信息外, 数据挖掘、 云计算等技术的快速发展使得利用互联网信用信息来评价信息 主体信用状况成为了可能 [1] 。但是由于互联网数据量庞大而且 分布广泛等特点, 如何从海量数据中区分出信用信息是本文主要 解决的问题,文章将系统的对互联网信用信息分布情况进行调 研、分类,并对不同类别的信息可信等级进行划分,即对评价信 息主体信用状况的贡献程度, 为今后利用互联网信用信息进行信 息主体信用状况评价奠定基础。 二、互联网信用信息可信等级划分 信用评分业务对信息的质量有着很高的要求, 质量差, 准确 性低的信用信息会导致评价模型准确率降低, 从而可能引起被评 价主体对于信息的来源或模型准确性的质疑, 而如何定义信用信 息的质量是一个难点问题。 本研究中, 所使用的信用信息全部来 自互联网,而互联网数据质量参差不齐, 任何人都可以自由发表 言论,为了区分不同信用信息的质量, 本文提出了一种信息可信 等级划分机制, 即不同类型或来源的信用信息对信息主体信用的 影响程度也是不同的, 如来自政府部门的信用信息, 由于其权威 性,因此在评价信息主体信用时具有很高的参考价值, 我们认为 它的可信等级是最高的。 而对于社交媒体评价信息, 由于其来源 和真实性无法验证, 因此我们认为它的可信等级是非常低的。 通 过对信用信息进行可信等级划分, 能够清晰的把握每类信用信息 对信息主体信用状况的影响程度, 也为后续信用评分模型的构建 提供了基础。 2.1 国内外研究现状 通过对现有工作的调研发现, Robert Harris (1994)曾经 从可信度、 准确性、 合理性和支持度四个维度来评价网络信息内 容;弗兰内金与麦兹格于 2000 年在准确性、权威性、客观性、 时效性以及信息的广度和深度等 5 个维度的基础上, 将其分解为 以下 9 个项目用以考察网站信息的可信度 [3] : (1)网站的作者 或责任者; (2 )网站是否提供了作者或责任者的联系方式; (3 ) 网站作者或责任者的资质或信誉;( 4)网站作者或责任者的传 播目的;( 5)信息是否及时新鲜;( 6 )能否通过其他来源核实 网站信息;( 7)是否有其他权威信息来源推荐;( 8 )网站所载 信息是观点还是事实;( 9)信息是否完整、全面。 2.2 划分标准 通过总结本文信用信息数据源自身的特点并根据以上学者 的相关经验, 本文将通过以下评价指标进行信用信息可信等级的 划分 [4-5] ,具体如表 3-1 : (1)域名 域名中包含 g

文档评论(0)

tianya189 + 关注
官方认证
内容提供者

该用户很懒,什么也没介绍

认证主体阳新县融易互联网技术工作室
IP属地上海
统一社会信用代码/组织机构代码
92420222MA4ELHM75D

1亿VIP精品文档

相关文档