Informatica 技术解决方案.doc

  1. 1、本文档共210页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Informatica 技术解决方案

Informatica技术解决方案 提交人: 闫东 联系电话: 010提交日期: 2007-09-23 版本号: 1.0 目 录 序言 1 1.1 Informatica公司介绍 1 1.2 Informatica公司针对各行业的解决方案及特点 3 2 设计理念 9 2.1 设计理念的先进性 9 2.2 设计理念的符合性 12 3 基本功能 14 3.1 字段级的操作,主要包括:字段映射,映射的自动匹配,字段的拆分,多字段的混合运算,自动完成时间类型的转换 14 3.2 记录级的操作,主要包括:去重复记录,记录间合并或计算,记录拆分等 15 3.3 表级的操作,主要包括:代理键的生成,行列变换,排序,统计,制造样品数据 16 3.4 数据库级的操作,主要包括:对各种码表的支持包括GBK(必需)、Unicode(必需)、ASCII(必需) 17 4 技术特点 21 4.1 跨异构数据库的关联、支持关联条件的复杂程度、自定义函数的实现、过滤条件的复杂程度 21 4.2 支持的数据类型,包括Binaray、Date/Time、Decimal、Double、Integer、String、Text、Real、Small Integer等 21 4.3 抽取断点,支持参数抽取的灵活程度,如何抽取远程数据,抽取数据的事务处理支持,抽取的字段是否可以动态修改,对抽取的环境变量配置情况,环境变量是否可以动态修改 23 4.4 是否支持脏读,数据的提交方式,支持各种数据库的批量装载功能包括Oracle(必需)、informix、DB2、SQL Server,针对不同数据库是否具有批量加载能力包括Oracle(必需),informix,DB2,Sybase,teradata 27 4.5 在转换过程中是否支持数据比较的功能,在设计调试时能否对每个转换环节进行数据预览,在设计调试时能否对每个转换环节进行性能监控,在转换过程中是否支持按行按列的分组聚合,能否提供直观的视图、灵活的配置以及能否自定义功能,是否提供丰富的转换函数,是否支持诸如validate、 translate、 Hierarchy Flattern,Map,Merge 等转换功能,ETL过程中数据转换的可追溯能力 29 4.6 不同类型运算所耗的系统资源状况,包括常见的Join、lookup、mapping、aggreagation、sort、pivot、filter等 40 4.7 是否内置提供数据预览和数据质量评估的功能 41 4.8 是否内置提供具有强大的元数据管理功能 45 4.9 对于实时ETL及按需ETL的支持 51 5 整体架构 53 5.1 对平台的支持,支持主流的操作系统平台包括Sun Solaris,HP-UX(必需), IBM AIX(必需), Linux, Windows(必需)等。 53 5.2 对数据源的支持,支持常见的数据源,包括Oracle(必需),DB2(必需),Informix(必需),Sybase,SQL server,Teradata,SAS,Text(必需),Excel,SAP R/3,PeopleSpft,Sieble,IMS,VSAM,QSAM on 390,用户自定义文件,FTP(必需),XML(必需),Message Queue,Email,Weblog,OleDB,其它 54 5.3 支持数据库的种类、连接方式、配置方式及是否随产品打包,包括Oracle(必需),DB2(必需),Informix(必需),Sybase,SQL server 56 5.4 产品自身并行处理能力,对并行数据库的支持情况如Oracle RAC/OPS,系统的线性可扩展性 56 5.5 是否支持远端的数据抽取和加载功能 59 5.6 对错误恢复逻辑的支持,对异常情况的处理是否得当,对于出现差错的流程是否支持异常控制、错误告警以及错误流程恢复的加载 60 5.7 对中间存储的支持 65 5.8 产品可编程的灵活性如何,模块化的设计能力 65 5.9 能否根据日志监测源数据的变化,是否支持增量抽取,增量抽取的处理方式,增量加载的处理方式,是否提供数据更新的时间点或周期,以便可以灵活处理 67 5.10 对元数据的管理,主要包括:元数据存储的提取方式、元数据存储的开放性、元数据存储的可移植性、是否提供多种方式访问元数据、元数据的版本控制程度、是否支持开放的元数据标准如CWM、是否支持XML进行元数据交换、是否支持分布式的元数据访问和管理、是否生成元数据报表、是否支持ETL过程的冲突分析、是否支持基于元数据的查询功能、是否支持ETL过程的流程分析等。 68 5.11 可以实现对所有主流关系型数据库的快速访问和,对本地数据

文档评论(0)

zhuwenmeijiale + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:7065136142000003

1亿VIP精品文档

相关文档