高通量数据处理流程.ppt

  1. 1、本文档共36页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
高通量数据处理流程

;图像分析及basecalling基本原理;图像分析及basecalling基本原理;图像分析;Crosstalk AC光谱间有交叠,GT光谱间有交叠,所以:    碱基A的图片中包含C发出的光    碱基C的图片中包含A发出的光    碱基T的图片中包含G发出的光 不利:不能直接比较光强度大小而得到碱基 有利:利用图片中共同的亮点,将所有图片对齐重叠,解决offset问题;图像分析流程;Template Generation 利用AC之间的crosstalk、GT之间的crosstalk,将前 2个cycle的图片,与第一个cycle的A的图片对齐重叠,确定所有cluster的位置坐标{(x,y)};图像分析结果;Basecalling;4种光强度归一化;;Basecalling结果:qseq文件;Basecalling结果:qseq文件;fastq文件; 质量值 @FC61FL8AAXX:1:17:1012:19200#GCCAAT/1 CCACTGTCATGTGAACATCACAGAGACATTTCTTGA + bbbbbbbbbbabbbbbbbbbbbbbbaaaaaaaaa_\ 表示方法 Illumina:字符的ASCII值 - 64 = 质量值 (Sanger:字符的ASCII值 - 33 = 质量值) 范?? GA Illumina1.3+(09年3月之后): [2,35] [B,c] GA Illumina1.0 (09年3月之前): [-5,40] [;,h] Hiseq: [2:38] [B,f] 质量值与错误率理论关系: Q =-10 log10(e) 质量值计算方法:根据光强信号信噪比、光强度衰减、GC含量等参数,计算质量值;fastq文件;fastq文件产量(GA);fastq文件产量(Hiseq vs GA);文库质控问题1:Pair-end关系;与参考序列比较 或者: 总之,Read1,Read2与参考序列比对结果:   一正(F)一反(R),且F的位点坐标小于R的位点坐标 ;总之,Read1,Read2于参考序列比对结果:   一正(F)一反(R),且F的位点坐标小于R的位点坐标 文库插入片段长度;2100检测报告 文库长度分布;正常insert-size分布;异常insert-size分布;2K及以上文库;与参考序列比较 或者: 总之,Read1,Read2于参考序列比对结果:   一正(F)一反(R),且F的位点坐标大于R的位点坐标;正常insert-size分布;异常insert-size分布;文库问题2:adapter污染;adapter空载较多 导致碱基含量波动;文库质控问题3:文库随机性;测序质控问题;测序质控问题;正常光强度、碱基含量、质量值、Error-rate;异常光强度、碱基含量、质量值、Error-rate;异常光强度与碱基含量

文档评论(0)

shuwkb + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档