- 1、本文档共49页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基因微阵列数据的双向聚类算法研究
基因微阵列数据的双向聚类算法研究 摘要
摘要
基因芯片是由大量DNA或寡核苷酸探针密集排列所形成的探针阵列。基因芯片 上探针与经荧光标记的目标样品进行生物反应,利用专用芯片检测系统并借助于一定 的软件即可得到基因表达数据。这个技术应用于不同发展阶段,不同人体组织,不同 临床条件以及不同生物体等条件下的基因表达水平的测量。基因芯片的出现正在给生 命科学研究’、疾病诊断、新药开发、食品卫生监督等领域带来二场革命。
本文的贡献主要体现在以下几个方面: 首先,对基因数据分析中的一种双向聚类方法—格子模型法进行了深入的分析,
并对其进行了改进。格子模型是一个混合有二进制变量和连续变量的模型。对于该模 型,传统的用于连续变量的优化算法不再适用。为此,本文提出了一种新颖的神经网 络方法来解决这种混合有二进制变量和连续变量的优化问题,并将该方法应用于酵母 数据分析,实验结果表明使用这种方法后双聚类的精度得到了很大的提高。
其次,本文还对基因数据分析的另一种方法非负矩阵分解方法进行了改进。传统 的非负矩阵分解算法有一定缺陷,其初始值是随机设定的,因此在迭代过程中会出现 微小的抖动。为此本文在迭代计算过程中加入了数据平滑处理,并将该方法用于一组 白血病微阵列数据分析。实验结果表明,改进过的非负矩阵分解算法提高了分类的准 确率,同时这个方法避免了NMF算法的“零值”问题。
第三,本文介绍了NNMF算法的基本原理,对其加入了一个平滑处理,增加了 数据元素之间的联系,同时这个方法由于抬高了数据,避免了NMF算法中的“零值” 问题。本文首次将NNMF算法应用于生物信息学中,用白血病微阵列数据进行了实 验。实验结果表明,该方法提高了分类的准确率及算法的收敛速度。
关键词:基因数据分析,双向聚类,格子模型.,神经网络,非负矩阵因子分解,
数据平滑处理
作 者: 张瑾 指导老师:王加俊
一Studies
一Studies—————————————————————————_—_——_———————————————————————————————一一一一一一垒;堕翌!!竺!
the Biclu壁!生竖垒堕2生些里!鱼!鱼!呈!坚垄翌竺型里竺苎
ABSTRACT
Gene chips are high density probe arrays composed of large amount of DNA or oligonucleotide probes.The probes on the chip hybridize with the fluorescently marked target samples.The gene expression data can be obtained by using the special chips detection systems and with the help of some software.The applications of such a technology are in measuring gene expression levels in different developmental stages, different body tissues,different clinical conditions and different organisms,etc.Gene chips are now bringing a great revolution in the fields of life science research,disease diagnosis,
new drug development and food hygiene supervision. The contributions of this thesis are as follows:
Firstly,a novel neural.network approach is proposed for the plaid model where both the binary and continuous variables are contained and the traditionally used optimization methods for problems with only continuous variables.cannot be e
您可能关注的文档
- 媒介融合背景下移动新闻客户端研究-传播学专业毕业论文.docx
- 活塞热冲击与随机传热过程的研究-动力机械及工程专业论文.docx
- 基于.NET技术的演艺人员档案信息管理系统设计与实现-软件工程专业论文.docx
- 机敏混凝土结构的电阻率层析成像研究-结构工程专业论文.docx
- 基因工程菌全细胞催化制备葡甘低聚糖-渔业专业论文.docx
- 混合励磁交直流多绕组同步发电机的研究-电机与电器专业论文.docx
- 活血化瘀方干预大鼠移植性肝癌MVD和VEGF的实验研究-中医内科学专业论文.docx
- 寄售库存的绩效研究-工商管理专业论文.docx
- 基于组合学的数据编码方法研究-计算机应用技术专业论文.docx
- 济南传统观演建筑艺术的探索与研究-设计艺术学专业论文.docx
文档评论(0)