- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于传递闭包的知识发现方法和swanson知识发现方法的比较研究.PDF
第57卷 第1期 2013年1月
基于传递闭包的知识发现方法和 Swanson知识发现
方法的比较研究
———以癌药物靶点为例
■ 杨渊 李扬 孙晓北 高柳滨 池慧
[摘 要]以探寻癌药物靶点间的潜在关联为例,对基于传递闭包的知识发现方法和Swanson的一阶知识
发现方法进行了比较,结果得到,运用传递闭包的方法获得知识假设,可能发现更多有意义的新关联,且得到较
高查全率的同时,并没有牺牲过多的查准率。
[关键词]传递闭包 知识发现 Warshall算法 向量空间模型 药物靶点
[分类号]G353
科学研究的大量知识成果都被以文献的形式储存 结构,通过概念间的同属关系建立了知识发现的同属
[10]
下来进行,表面上看似没有任何联系的文献,可能存在 关系模型 ;M.YetisgenYildiz和W.Pratt开发了知识
?
[11]
隐含的未被发现的有科学价值的关联。美国芝加哥大 发现系统Litlinker ,并提出了一种新的关联挖掘算
学的D.R.Swanson教授通过对非相关文献的分析,发 法ZScore,D.Hristovski等开发了基于关联规则的知
[12]
现鱼油和雷诺病间存在关联,首次提出了基于非相关 识发现系统BITOLA等 。但是,这些后续方法均是
[1]
文献的知识发现方法 。该方法旨在从非相关文献中 通过一个中间词的传递得到发现结果,对知识发现的
挖掘出隐含的知识关联,为科研人员的研究假设提供 准确度进行了改进,但知识发现的广度和深度有限。
参考。该方法一经提出即引起了科学界的广泛关注,
1 研究背景
继D.R.Swanson教授之后,又有不同学科领域的研究
者开始投入到对该方法的研究和探索中。当前国内外 D.R.Swanson非相关文献知识发现的基本原理
在此领域的研究主要集中于三个方面: 对 D.R. 是:如果有文献分别讨论了A和B的关系、B和C的
①
Swanson提出的知识发现过程中涉及到的关联建立、中 关系,但A和C尚未在任何文献中同时出现过,则通
间词/目标词的排序、中间词/目标词过滤方法进行改 过AB和BC间的已有关联,推测AC之间也可能存
进和发展; 探讨新的知识发现方法; 开发不同的知 在关联,如图1所示:
② ③
识发现系统。如M.D.Gordon相继提出了相对词频统
计法和潜在语义索引来分析共现词间的关联度[2-3],
J.D.Wren提出了共同信息测量关联挖掘算法、平均最
[4]
小权重(AMW)排序法 ,张云秋、冷伏海等提出了基 图1 非相关文献知识发现的基本原理
[5]
于文献内聚度的知识发现排序方法 、基于MeSH加
在离散数学中,一个关系R的闭包是指加上最小
[6]
权的知识发现排序方法 、基于双向词频统计的排序
数目的有序对使得构成的新关系R 具有自反、对称
[7]
方法 、基于副主题词的知识发现过滤方法、基于共现
[8]
文档评论(0)