CONA数据治理平台产品使用手册V3.3.2.docx

CONA数据治理平台产品使用手册V3.3.2.docx

  1. 1、本文档共36页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

PAGE21

CONA数据治理平台

产品使用手册V3.3.2

2020年02月17日

CONA规则配置及管理

使用手册

文档编号:V2.1

2020年02月17日

目录

TOC\o1-5\h\u1 产品概述 5

2 功能模块操作 6

2.1 规则配置 6

2.1.1 原始表通用规则配置 7

2.1.1.1 选择原始表 7

2.1.1.2 原始表页面布局说明 9

2.1.1.3 添加原始表规则 10

2.1.1.3.1 方式一:通过“+”按钮添加规则 10

2.1.1.3.2 方式二:通过“上面插入”添加规则 13

2.1.1.3.3 方式三:通过“下面插入”添加规则 14

2.1.1.4 编辑原始表规则 14

2.1.1.5 删除原始表规则 15

2.1.2 目标表通用规则配置 17

2.1.2.1 选择目标表 17

2.1.2.2 目标表页面布局说明 18

2.1.2.3 添加目标表规则 20

2.1.2.4 编辑目标表规则 20

2.1.2.5 删除目标表规则 20

2.1.2.6 目标表规则配置-一键添加key、type规则(cona3.2.6新功能) 21

2.1.3 映射级规则配置 21

2.1.3.1 CONA映射指什么 21

2.1.3.2 选择表映射 23

2.1.3.3 页面布局说明 25

2.1.3.4 原始表与目标表映射 26

2.1.3.5 规则列表初始化 27

2.1.3.6 原始表规则列表 28

2.1.3.7 目标表规则列表 29

2.1.3.8 规则所见即所得(cona3.2.0新增功能) 30

2.2 CONA规则管理 32

2.2.1 按序号展示 32

2.2.2 分类展示 33

2.2.3 第三方规则插件化部署(上传规则)(cona3.2.0新增功能) 34

2.3 新增第三方规则12条(cona3.2.8新功能) 34

规则的使用背景

目前cona的使用所涉及的领域以公安和金融的项目较多,而在使用数据治理的过程中,原始的数据可能会有各种各样的问题,例如原始的数据可能会有歧义,对一个特定字段来说,如果同样的字段,它的字段名可能叫名字,也可能叫姓名,但他们代表的含义是相同的,这样数据就出现了歧义,而把这字段统一成唯一的命名,就叫做数据消歧;简单来说就是对数据的标准化,明确一个数据的格式,把原始数据转换成指定的数据格式,这时候就需要规则。

产品概述

在数据治理过程中,规则起到清洗、校正或转换数据的作用。数据从原始表到目标表,要经历一系列的规则转换。

规则由规则定义和规则配置两部分构成。

规则定义包含内置的规则定义以及第三方实现的规则定义。

规则在4个区中配置,原始表区、目标表区、映射原始表区以及映射目标表区。规则配置绑定在目标表或者原始表或者映射上,以一个规则队列来描述规则的顺序。规则配置可以用一个公式表示:OUTPUT=FUNC(INPUT,INPUT,...),其中OUTPUT有且只有一个,INPUT可以有0~n个,每个区的规则队列中的规则都有一个从1开始按顺序+1递增的ORDER。

名词解释

CONA,即CONnectAllthedata,就是关联所有数据的意思,该软件能够大规模自动化的采集、清洗、归类、关联所有数据,形成统一数据视图给后续系统服务。“关联”是他核心的定义,在我们进行大数据挖掘之前,往往需要把关系型数据的Schema关联起来;

attr:字段名;

index:后缀;

maxIndex:最大后缀;

目标表中间结果字段:就是把原始表字段通过目标表中间结果字段映射到目标表字段的一种媒介,目标表中间结果字段的命名规则是:m_{目标表英文字段}。例如从原始表的字段经转化得到的一次中间数据结果,该数据还需再次经过转化才到目标表,这中间的数据结果的字段即为目标表中间结果字段。

功能模块操作

规则配置

Cona规则配置分为3个tab页,“原始表通用规则配置”、“目标表通用规则配置”以及“映射级规则配置”页面,点击标签可以任意切换。

2-1-1-规则配置主界面

原始表通用规则配置

原始表的通用规则配置的主要目的是为了方便快速配置,一个原始表可以对应多张目标表,对其进行通用规则配置,在映射规则页面进行初始化后,可以实现快速配置

选择原始表

1、切换到“原始表通用规则配置”页面,点击“选择原始表”按钮,从数据源列表中选择一个数据源,点击“下一步”;

2-1-2-选择数据源

2、选择原始表

2.1、选择原始表页面有分页功能(cona3.2

您可能关注的文档

文档评论(0)

152****8691 + 关注
实名认证
内容提供者

Sun认证程序员持证人

该用户很懒,什么也没介绍

领域认证该用户于2024年07月07日上传了Sun认证程序员

1亿VIP精品文档

相关文档