- 1、本文档共36页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
PAGE21
CONA数据治理平台
产品使用手册V3.3.2
2020年02月17日
CONA规则配置及管理
使用手册
文档编号:V2.1
2020年02月17日
目录
TOC\o1-5\h\u1 产品概述 5
2 功能模块操作 6
2.1 规则配置 6
2.1.1 原始表通用规则配置 7
2.1.1.1 选择原始表 7
2.1.1.2 原始表页面布局说明 9
2.1.1.3 添加原始表规则 10
2.1.1.3.1 方式一:通过“+”按钮添加规则 10
2.1.1.3.2 方式二:通过“上面插入”添加规则 13
2.1.1.3.3 方式三:通过“下面插入”添加规则 14
2.1.1.4 编辑原始表规则 14
2.1.1.5 删除原始表规则 15
2.1.2 目标表通用规则配置 17
2.1.2.1 选择目标表 17
2.1.2.2 目标表页面布局说明 18
2.1.2.3 添加目标表规则 20
2.1.2.4 编辑目标表规则 20
2.1.2.5 删除目标表规则 20
2.1.2.6 目标表规则配置-一键添加key、type规则(cona3.2.6新功能) 21
2.1.3 映射级规则配置 21
2.1.3.1 CONA映射指什么 21
2.1.3.2 选择表映射 23
2.1.3.3 页面布局说明 25
2.1.3.4 原始表与目标表映射 26
2.1.3.5 规则列表初始化 27
2.1.3.6 原始表规则列表 28
2.1.3.7 目标表规则列表 29
2.1.3.8 规则所见即所得(cona3.2.0新增功能) 30
2.2 CONA规则管理 32
2.2.1 按序号展示 32
2.2.2 分类展示 33
2.2.3 第三方规则插件化部署(上传规则)(cona3.2.0新增功能) 34
2.3 新增第三方规则12条(cona3.2.8新功能) 34
规则的使用背景
目前cona的使用所涉及的领域以公安和金融的项目较多,而在使用数据治理的过程中,原始的数据可能会有各种各样的问题,例如原始的数据可能会有歧义,对一个特定字段来说,如果同样的字段,它的字段名可能叫名字,也可能叫姓名,但他们代表的含义是相同的,这样数据就出现了歧义,而把这字段统一成唯一的命名,就叫做数据消歧;简单来说就是对数据的标准化,明确一个数据的格式,把原始数据转换成指定的数据格式,这时候就需要规则。
产品概述
在数据治理过程中,规则起到清洗、校正或转换数据的作用。数据从原始表到目标表,要经历一系列的规则转换。
规则由规则定义和规则配置两部分构成。
规则定义包含内置的规则定义以及第三方实现的规则定义。
规则在4个区中配置,原始表区、目标表区、映射原始表区以及映射目标表区。规则配置绑定在目标表或者原始表或者映射上,以一个规则队列来描述规则的顺序。规则配置可以用一个公式表示:OUTPUT=FUNC(INPUT,INPUT,...),其中OUTPUT有且只有一个,INPUT可以有0~n个,每个区的规则队列中的规则都有一个从1开始按顺序+1递增的ORDER。
名词解释
CONA,即CONnectAllthedata,就是关联所有数据的意思,该软件能够大规模自动化的采集、清洗、归类、关联所有数据,形成统一数据视图给后续系统服务。“关联”是他核心的定义,在我们进行大数据挖掘之前,往往需要把关系型数据的Schema关联起来;
attr:字段名;
index:后缀;
maxIndex:最大后缀;
目标表中间结果字段:就是把原始表字段通过目标表中间结果字段映射到目标表字段的一种媒介,目标表中间结果字段的命名规则是:m_{目标表英文字段}。例如从原始表的字段经转化得到的一次中间数据结果,该数据还需再次经过转化才到目标表,这中间的数据结果的字段即为目标表中间结果字段。
功能模块操作
规则配置
Cona规则配置分为3个tab页,“原始表通用规则配置”、“目标表通用规则配置”以及“映射级规则配置”页面,点击标签可以任意切换。
2-1-1-规则配置主界面
原始表通用规则配置
原始表的通用规则配置的主要目的是为了方便快速配置,一个原始表可以对应多张目标表,对其进行通用规则配置,在映射规则页面进行初始化后,可以实现快速配置
选择原始表
1、切换到“原始表通用规则配置”页面,点击“选择原始表”按钮,从数据源列表中选择一个数据源,点击“下一步”;
2-1-2-选择数据源
2、选择原始表
2.1、选择原始表页面有分页功能(cona3.2
您可能关注的文档
- 149_安全生产责任制汇编.docx
- 149-阿里云双碳解决方案2021.pdf
- 149-防汛抗旱一张图暨态势分析系统操作手册v1.5.pdf
- 149-福建省“十四五”消防救援事业发展专项规划.pdf
- 149工业互联网智慧工厂大数据安全管理平台 V1.3.pdf
- 149-工业互联网总体发展情况--李海花.pdf
- CONA数据治理平台安装手册V3.3.2.docx
- CONA数据治理平台计算引擎使用手册V3.3.2.docx
- CONA数据治理平台流式中心使用手册v3.3.2.docx
- CONA数据治理平台模板使用手册V3.3.2.docx
- 2025届福建省长汀一中等六校高三第二次月考试卷含解析.doc
- 2025届广东省东莞市六校高三第二学期期终教学质量监控测试语文试题含解析.doc
- 2025届广东省佛山市南海区石门中学高考模拟最后十套:语文试题(五)考前提分仿真卷含解析.doc
- 2025届福建闽侯第四中学高三下学期学习能力诊断(一模)语文试题含解析.doc
- 2025届北京三中高三下学期4月月考试题含解析.doc
- 2025届广东第二师范学院番禺附中高三下学期升级统测语文试题含解析.doc
- 2025届广东省北京师范大学东莞石竹附属学校高三(下)第2次月考语文试题含解析.doc
- 2025届安徽省铜陵市枞阳县枞阳县浮山中学高三语文试题二模冲刺试题(九)含解析.doc
- 2025届甘肃肃兰州市第五十一中学高三下学期高考仿真模拟语文试题试卷含解析.doc
- 2025届甘肃省临洮县二中高三下期第二次模拟考试语文试题理试题含解析.doc
文档评论(0)