CONA数据治理平台知识图谱使用手册V3.3.2.docx

CONA数据治理平台知识图谱使用手册V3.3.2.docx

  1. 1、本文档共32页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
标题ConA数据治理平台知识图谱使用手册V332摘要在CONA数据治理过程中,会创建出实体事件关系三种目标表,实现数据治理的目的文档介绍了产品的基本操作知识图谱页面布局知识图谱页面的层次结构功能模块的操作事件的添加编辑和删除以及关系的添加编辑和删除等重要知识点在技术层面,ConA数据治理采用数据可视化的方式,构建了知识图谱知识图谱利用图形化的手段,将实体事件关系等实体进行了直观的呈现,使得操作者可以在第一时间获取所需的信息,提高了工作效率总

页PAGE\*Arabic21

CONA数据治理平台

产品使用手册V3.3.2

2020年2月17日

CONA知识图谱使用手册

文档编号:V2.1

2020年2月17日

目录

TOC\o1-3\h\z\u1. 产品概述 5

1.1. 背景 5

1.2. 作用 5

1.3. 名词解释 5

1.4. 基本操作 7

1.5. 知识图谱页面布局 7

1.5.1. 知识图谱页面如下 8

1.5.2. 左上方按钮区1区 8

1.5.3. 左下方图示区2区 8

1.5.4. 中间画布区3区 9

1.5.5. 右下方导航区4区 9

2. 功能模块操作 9

2.1. 实体的添加、编辑和删除 9

2.1.1. 添加实体 9

2.1.2. 编辑实体 11

2.1.3. 删除实体 13

2.1.4. 跳转到目标表 14

2.2. 事件的添加、编辑和删除 16

2.2.1. 添加事件 16

2.2.2. 编辑事件 17

2.2.3. 删除事件 19

2.2.4. 自关联事件 20

2.2.5. 跳转目标表 22

2.3. 关系的添加、编辑和删除 22

2.3.1. 添加关系 22

2.3.2. 编辑关系 23

2.3.3. 删除关系 25

2.3.4. 自关联关系 26

2.3.5. 跳转目标表 27

2.4. 纳入计算和配置计算 28

2.4.1. 纳入计算 28

2.4.2. 取消纳入计算 29

2.4.3. 配置计算 31

2.5. 验证 31

产品概述

背景

在CONA数据治理的过程中,会创建出实体、事件、关系三种目标表,也是数据治理的最终结果表现形式。在CONA中是在【目标表】模块,以表的形式展现的,其中我们很难看出实体、事件和关系之间的关联关系,所以我们引入了知识图谱的概念。

实际上,知识图谱的展示就是目标表的图形化展示。

作用

该页签的主要作用是将目标表的实体、事件、关系以图形化的形式展现给用户,方便用户很好的去理解实体、事件、关系他们之间的关系。更加形象的给用户一种目标表之前关系的清晰的图形化展现。

名词解释

CONA三要素:实体、事件和关系;

实体:实体是指在现实中不做进一步分割的一类对象;

实体的提取规则:

实体提取的主要是在系统中会被主要分析的对象种类,如人,车,户籍等;

实体在后端存入到图数据库Titan;

实体提取最重要的是表示唯一实体的key字段,该字段一定不能为空,否则无法提取出该实体的数据;

举例:

实体是在系统中会被主要分析的对象种类,如人、车、户籍等;

事件:事件是在特定时空维度(如网吧、车站等)刻画主题和客体间关系的一类对象,主体必须是实体,客体可以是实体,也可以不是(如虚实体)。

事件的提取规则:

事件的提取规则为实体在一个时间点(段),在一个客体(物理空间车站或虚拟对象QQ)发生的一次记录,如一个人的乘车记录;

有扩展属性的事件存储在事件数据库HBase;

事件提取最主要的是主体的key、客体和时间,且保证主体所代表的实体已经可以提取并存储到SCOPA-DB;

举例:

事件可以为实体在一个时间点(段),在一个客体(物理空间车站或虚拟对象QQ)发生的一次记录,如一个人的乘车记录。

关系:关系是刻画实体间各种关联的一类对象。

关系的提取规则:

关系分为实体之间的联系,如人之间的多次同行,人和身份证的从属关系;

关系分为静态关系和动态(隐性)关系:

静态关系是指能够直接从源数据中提取到的关系,需要由CONA工具提取生成;

动态关系是指需要通过算法根据参数计算而出的关系,需要由战法团队按照逻辑计算生成;

静态关系和动态关系都进后端存储;

关系在后端存储时会同时存入图数据库Titan和事件数据库HBase(一些特殊属性);

关系在前端操作中支持展示等操作;

关系提取最重要的是关系两边的两个实体的key要确定,且保证两个实体已经可以提取并存储到SCOPA-DB;

举例:

关系描述的是实体之间的联系,如人之间的多次同行,人和身份证的从属关系;

纳入计算:实体、事件或者关系所对应的目标表是否被纳入后续的CONA的计算流程(CONA的计算流程包括datasource2hive,hive2hdfs,merge三个阶段)。

初始化:实体、事件或者关系所对应的目标表是否完成了必要的字段配置。

必要的字段配置:后缀主键(key)和类型(type)。

基本操作

知识图谱页面主要以图的方式展示CONA三要素实体、事件和关系。同时提供了三要素的创建、删除、编辑、配置计算操作,以及验证操作。

知识图谱页面布局

文档评论(0)

152****8691 + 关注
实名认证
内容提供者

Sun认证程序员持证人

该用户很懒,什么也没介绍

领域认证该用户于2024年07月07日上传了Sun认证程序员

1亿VIP精品文档

相关文档