大数据审计分析 课件 第三章 大数据审计数据分析基础.pdf

大数据审计分析 课件 第三章 大数据审计数据分析基础.pdf

  1. 1、本文档共24页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

第三章大数据审计分析数据基础概述

目录第一节大数据审计分析数据基础概述

CONTEN

T第二节审计数据采集

第三节审计数据预处理

第一节

大数据审计分析数据基础概述

3.1大数据审计分析数据基础概述

数据作为一种重要的信息资源,是大数据审计分析的“原

料”,接下来将从大数据审计分析的数据特征、数据来源、

数据类型、数据处理流程四个方面来阐述大数据审计分析

的数据基础知识。

3.1.1大数据审计分析的数据特征

(1)来源广泛

大数据审计分析的数据来源既包括互联网中的媒体咨询、搜索引擎、社交网络数据等交互

性数据,也包括被审计单位信息系统的财务业务数据等货币性数据以及经营战略、管理经

验、组织结构、社会关系等非货币性数据,还包括来源于其他渠道的一些数据,比如物联

网、传感器数据等。

(2)数据量大

传统审计数据以MB和GB的单位进行储存,而审计大数据储存单位可以直接达到TB甚至PB级。

(3)关联性强

大数据背景下,急剧增加的数据量将推动被审计单位内部数据与被审计单位业务往来单位数

据(如政府数据、企业数据、行业标准数据等)无限关联,从而提升审计大数据的关联性,增

加挖掘潜在审计价值的可能性。

(4)结构多元

审计大数据既包括结构化数据,又包括文档、音频、视频、图像等半结构化和非结构化数据。

3.1.2大数据审计分析的数据来源

(1)被审计单位

财务数据。包括但不限于来源于被审计单位财务系统、税务系统、ERP系统的财务账套数据、原

始凭证等。

业务数据。包括但不限于来源于被审计单位ERP系统、CRM系统、WMS系统、HR系统、OA系

统、生产管理系统、物联网系统、内部控制系统、预算系统、业务运行系统的业务数据表、业务

单据等。

IT数据。包括但不限于被审计单位信息系统操作用户信息、信息系统用户操作日志等。

文本数据。包括但不限于被审计单位的内控文档、制度文件、生产记录、会议记录、内刊咨询、

过往审计报告等。

视频与图像数据。包括但不限于被审计单位的访谈照片、访谈视频、生产经营场所的视频信息、

存货存储场所视频信息、生物资产活动场所的视频、图片信息等。

音频数据。包括但不限于被审计单位的会议录音、访谈录音、客服录音等。

其他信息。包括但不限于被审计单位经营场所的客户、员工、运输工具、生物资产等的地理信

息系统(GIS)和全球定位系统(GPS)数据。

3.1.2大数据审计分析的数据来源

(2)社交媒体

被审计单位与被审计单位相关的广义利益相关者会通过社交媒体主动或被动的产生与被审计

单位有关的数据,包括但不限于被审计单位的企业微信,广义利益相关者的QQ、微信、微博、

朋友圈、邮件,论坛讨论贴等。

(3)外部网络

被审计单位所处外部环境的其他社会关系参与者也会产生与被审计单位有关的数据,包括但不限

于主流媒体新闻报道,宏观层面的政策文件,中观行业信息,监管部门问询函,被审计单位及其

关联公司、上下游公司的财务报告等。

(4)专有数据库

一些专有数据库也会保存与被审计单位相关的数据,包括但不限于国泰安CSMAR数据库,

Wind数据库,上交所XBRL数据,深交所数据,国家统计局数据,不动产登记数据,工商注册数

据,车辆管理数据,税务数据,银行数据。

3.1.3大数据审计分析的数据类型

结构化数据:是指能够用统一的设计结构予以存储的数据,如数值符号等。任何以固定格式

储存、访问和处理的数据都称为结构化数据。也称为行数据,一般存储在数据库中,可以用

二维表来逻辑表达实现。

半结构化数据:介于结构化数据和非结构化数据之间的数据。半结构化数据具有一定的结构

性,如HTML文档、XML文档。

非结构化数据:是指字段长度可变,每个字段的记录又可以由可重复或不可重复的子字段构

成的数据,如文本、图像、声音、网页、视频等。非结构化数据不方便用数据库二维逻辑表

来实现。

3.1.4大数据审计分析的数据处理流程

大数据审计分析的数据处理流程包括审计数据采集、审计数据储存、审计数据清洗、审计数据

分析、审计数据可视化。

(1)审计数据采集:审计人员为了完成既定审计目标,在进行大数据审计分析时,按照审计需求从被审计单位数

据库或其他来源获取审计数据的过程。

(2)审计数据储

您可能关注的文档

文档评论(0)

xiaobao + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档