- 1、本文档共32页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
页PAGE\*Arabic21
CONA数据治理平台
产品使用手册V3.3.2
2020年2月17日
CONA知识图谱使用手册
文档编号:V2.1
2020年2月17日
目录
TOC\o1-3\h\z\u1. 产品概述 5
1.1. 背景 5
1.2. 作用 5
1.3. 名词解释 5
1.4. 基本操作 7
1.5. 知识图谱页面布局 7
1.5.1. 知识图谱页面如下 8
1.5.2. 左上方按钮区1区 8
1.5.3. 左下方图示区2区 8
1.5.4. 中间画布区3区 9
1.5.5. 右下方导航区4区 9
2. 功能模块操作 9
2.1. 实体的添加、编辑和删除 9
2.1.1. 添加实体 9
2.1.2. 编辑实体 11
2.1.3. 删除实体 13
2.1.4. 跳转到目标表 14
2.2. 事件的添加、编辑和删除 16
2.2.1. 添加事件 16
2.2.2. 编辑事件 17
2.2.3. 删除事件 19
2.2.4. 自关联事件 20
2.2.5. 跳转目标表 22
2.3. 关系的添加、编辑和删除 22
2.3.1. 添加关系 22
2.3.2. 编辑关系 23
2.3.3. 删除关系 25
2.3.4. 自关联关系 26
2.3.5. 跳转目标表 27
2.4. 纳入计算和配置计算 28
2.4.1. 纳入计算 28
2.4.2. 取消纳入计算 29
2.4.3. 配置计算 31
2.5. 验证 31
产品概述
背景
在CONA数据治理的过程中,会创建出实体、事件、关系三种目标表,也是数据治理的最终结果表现形式。在CONA中是在【目标表】模块,以表的形式展现的,其中我们很难看出实体、事件和关系之间的关联关系,所以我们引入了知识图谱的概念。
实际上,知识图谱的展示就是目标表的图形化展示。
作用
该页签的主要作用是将目标表的实体、事件、关系以图形化的形式展现给用户,方便用户很好的去理解实体、事件、关系他们之间的关系。更加形象的给用户一种目标表之前关系的清晰的图形化展现。
名词解释
CONA三要素:实体、事件和关系;
实体:实体是指在现实中不做进一步分割的一类对象;
实体的提取规则:
实体提取的主要是在系统中会被主要分析的对象种类,如人,车,户籍等;
实体在后端存入到图数据库Titan;
实体提取最重要的是表示唯一实体的key字段,该字段一定不能为空,否则无法提取出该实体的数据;
举例:
实体是在系统中会被主要分析的对象种类,如人、车、户籍等;
事件:事件是在特定时空维度(如网吧、车站等)刻画主题和客体间关系的一类对象,主体必须是实体,客体可以是实体,也可以不是(如虚实体)。
事件的提取规则:
事件的提取规则为实体在一个时间点(段),在一个客体(物理空间车站或虚拟对象QQ)发生的一次记录,如一个人的乘车记录;
有扩展属性的事件存储在事件数据库HBase;
事件提取最主要的是主体的key、客体和时间,且保证主体所代表的实体已经可以提取并存储到SCOPA-DB;
举例:
事件可以为实体在一个时间点(段),在一个客体(物理空间车站或虚拟对象QQ)发生的一次记录,如一个人的乘车记录。
关系:关系是刻画实体间各种关联的一类对象。
关系的提取规则:
关系分为实体之间的联系,如人之间的多次同行,人和身份证的从属关系;
关系分为静态关系和动态(隐性)关系:
静态关系是指能够直接从源数据中提取到的关系,需要由CONA工具提取生成;
动态关系是指需要通过算法根据参数计算而出的关系,需要由战法团队按照逻辑计算生成;
静态关系和动态关系都进后端存储;
关系在后端存储时会同时存入图数据库Titan和事件数据库HBase(一些特殊属性);
关系在前端操作中支持展示等操作;
关系提取最重要的是关系两边的两个实体的key要确定,且保证两个实体已经可以提取并存储到SCOPA-DB;
举例:
关系描述的是实体之间的联系,如人之间的多次同行,人和身份证的从属关系;
纳入计算:实体、事件或者关系所对应的目标表是否被纳入后续的CONA的计算流程(CONA的计算流程包括datasource2hive,hive2hdfs,merge三个阶段)。
初始化:实体、事件或者关系所对应的目标表是否完成了必要的字段配置。
必要的字段配置:后缀主键(key)和类型(type)。
基本操作
知识图谱页面主要以图的方式展示CONA三要素实体、事件和关系。同时提供了三要素的创建、删除、编辑、配置计算操作,以及验证操作。
知识图谱页面布局
知
您可能关注的文档
最近下载
- “双减”政策下初中数学分层作业设计的实践与探究 .pdf
- 《My family photo》(教学设计)-2024-2025学年冀教版(2024)初中英语七年级上册.docx VIP
- 国开电大《创业教育(创业教育专)》形考1-3及综合答案.pdf VIP
- ISO 10009-2024 质量管理——质量工具及其应用指南(中文版-雷泽佳译2024-07).docx VIP
- 人教版初中英语八年级上册 Unit 7 大单元作业设计案例 .pdf
- 美国国父——华盛顿课件.ppt
- 渔父文化内涵.doc VIP
- 2025年合肥市轨道交通集团有限公司校园招聘934人笔试备考题库及答案解析.docx
- 腰椎穿刺术教师赛教案.docx
- 产后大出血的抢救.pptx VIP
文档评论(0)