- 1、本文档共210页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Informatica 技术解决方案
Informatica技术解决方案
提交人: 闫东
联系电话: 010提交日期: 2007-09-23
版本号: 1.0
目 录
序言 1
1.1 Informatica公司介绍 1
1.2 Informatica公司针对各行业的解决方案及特点 3
2 设计理念 9
2.1 设计理念的先进性 9
2.2 设计理念的符合性 12
3 基本功能 14
3.1 字段级的操作,主要包括:字段映射,映射的自动匹配,字段的拆分,多字段的混合运算,自动完成时间类型的转换 14
3.2 记录级的操作,主要包括:去重复记录,记录间合并或计算,记录拆分等 15
3.3 表级的操作,主要包括:代理键的生成,行列变换,排序,统计,制造样品数据 16
3.4 数据库级的操作,主要包括:对各种码表的支持包括GBK(必需)、Unicode(必需)、ASCII(必需) 17
4 技术特点 21
4.1 跨异构数据库的关联、支持关联条件的复杂程度、自定义函数的实现、过滤条件的复杂程度 21
4.2 支持的数据类型,包括Binaray、Date/Time、Decimal、Double、Integer、String、Text、Real、Small Integer等 21
4.3 抽取断点,支持参数抽取的灵活程度,如何抽取远程数据,抽取数据的事务处理支持,抽取的字段是否可以动态修改,对抽取的环境变量配置情况,环境变量是否可以动态修改 23
4.4 是否支持脏读,数据的提交方式,支持各种数据库的批量装载功能包括Oracle(必需)、informix、DB2、SQL Server,针对不同数据库是否具有批量加载能力包括Oracle(必需),informix,DB2,Sybase,teradata 27
4.5 在转换过程中是否支持数据比较的功能,在设计调试时能否对每个转换环节进行数据预览,在设计调试时能否对每个转换环节进行性能监控,在转换过程中是否支持按行按列的分组聚合,能否提供直观的视图、灵活的配置以及能否自定义功能,是否提供丰富的转换函数,是否支持诸如validate、 translate、 Hierarchy Flattern,Map,Merge 等转换功能,ETL过程中数据转换的可追溯能力 29
4.6 不同类型运算所耗的系统资源状况,包括常见的Join、lookup、mapping、aggreagation、sort、pivot、filter等 40
4.7 是否内置提供数据预览和数据质量评估的功能 41
4.8 是否内置提供具有强大的元数据管理功能 45
4.9 对于实时ETL及按需ETL的支持 51
5 整体架构 53
5.1 对平台的支持,支持主流的操作系统平台包括Sun Solaris,HP-UX(必需), IBM AIX(必需), Linux, Windows(必需)等。 53
5.2 对数据源的支持,支持常见的数据源,包括Oracle(必需),DB2(必需),Informix(必需),Sybase,SQL server,Teradata,SAS,Text(必需),Excel,SAP R/3,PeopleSpft,Sieble,IMS,VSAM,QSAM on 390,用户自定义文件,FTP(必需),XML(必需),Message Queue,Email,Weblog,OleDB,其它 54
5.3 支持数据库的种类、连接方式、配置方式及是否随产品打包,包括Oracle(必需),DB2(必需),Informix(必需),Sybase,SQL server 56
5.4 产品自身并行处理能力,对并行数据库的支持情况如Oracle RAC/OPS,系统的线性可扩展性 56
5.5 是否支持远端的数据抽取和加载功能 59
5.6 对错误恢复逻辑的支持,对异常情况的处理是否得当,对于出现差错的流程是否支持异常控制、错误告警以及错误流程恢复的加载 60
5.7 对中间存储的支持 65
5.8 产品可编程的灵活性如何,模块化的设计能力 65
5.9 能否根据日志监测源数据的变化,是否支持增量抽取,增量抽取的处理方式,增量加载的处理方式,是否提供数据更新的时间点或周期,以便可以灵活处理 67
5.10 对元数据的管理,主要包括:元数据存储的提取方式、元数据存储的开放性、元数据存储的可移植性、是否提供多种方式访问元数据、元数据的版本控制程度、是否支持开放的元数据标准如CWM、是否支持XML进行元数据交换、是否支持分布式的元数据访问和管理、是否生成元数据报表、是否支持ETL过程的冲突分析、是否支持基于元数据的查询功能、是否支持ETL过程的流程分析等。 68
5.11 可以实现对所有主流关系型数据库的快速访问和,对本地数据
文档评论(0)