一个医疗科研大数据平台的设计与实现.docx

一个医疗科研大数据平台的设计与实现.docx

  1. 1、本文档共11页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

一个医疗科研大数据平台的设计与实现

作者:王锐孙小梅李鹏飞

来源:《电脑知识与技术》2021年第33期

????????摘要:为了挖掘和利用医院信息系统中积累的医疗大数据中的有用信息,用以临床辅助决策和基础临床科学研究,该文设计了医疗大数据研究平台。通过对医院现有信息系统的分析,结合临床医学和科研的具体需求,利用数据挖掘技术、深度学习技术、大数据可视化技术、自然语言处理技术等模型算法,对医疗大数据进行集成和整合,构建统一的大数据模型和标准,实现医疗大数据的智能应用。在构建的医疗大数据应用平台中,具体实现了病历搜索、患者全景视图、科研项目管理、疾病关系图谱和特征分布等具体的应用功能。该平台的应用,让医疗大数据蕴含的价值得以实现,不仅拉近了临床医疗实践与临床基础研究之间的距离,而且提高了医院整体运行的效率。

????????关键词:医疗大数据;数据挖掘;医院信息系统;深度学习;临床辅助

????????中图分类号:R42;TP311文献标识码:A

????????文章编号:1009-3044(2021)33-0055-03

????????开放科学(资源服务)标识码(OSID):

????????1研究背景及意义

????????随着医院信息化的不断发展,在医院业务数据库中,积累了大量的患者医疗数据。这些数据中包含着各种各样的有用信息,对这些数据加工处理,利用数据挖掘、深度学习等技术,可以实现对这些临床积累医疗数据的挖掘和利用。构建一个综合前沿的医疗大数据应用平台,对医院积累的医疗数据,以病人为中心进行数据整合,建立统一的医疗大数据的数据标准,将不同厂商间的数据集成到一个统一的数据环境中。通过这种方式,不仅可以解决各个信息系统数据标准不统一的问题,消除信息孤岛,还可以通过大数据平台为医院临床辅助决策及医学科研发展提供有力支持。

????????2医疗大数据系统架构

????????该平台实现了医疗大数据的数据采集、数据集成和数据治理。在此基础上,构建适用于医疗大数据的数学模型,从而为医院管理、教学、科研提供各种个性化的应用。医疗大数据平台的系统架构如图1所示。

????????在医疗大数据平台架构的底层,将医院内各个信息系统中的历史数据及每天产生的增量数据进行集成接入。对各个信息系统中集成接入的数据进行整合,整合的基础是建立统一的数学模型。在数据集成[1]和数据整合[2]过程中,由于医疗大数据的敏感性,一定要注意保护好病人的个人隐私,对医疗大数据进行脱敏处理。

????????医疗大数据主要包含患者的基本信息、电子病历、医嘱信息、护理记录、检查检验结果以及治疗过程等。这些医疗数据信息,主要是用自然语言的方式进行记录,信息结构非常复杂,如何让计算机识别和理解这些医疗数据中包含的信息,从而高效地对这些信息进行存储、分类、检索、统计、分析和挖掘,是该医疗大数据平台建设的重点。在本文构建的医疗大数据平台中,通过自然语言处理技术[3],结合医疗专业术语名词,将自然语言表达的语义,转换成结构化的键值对。

????????集成后的数据,还不能实现真正的具体应用,医疗大数据还需要通过一些先进的算法模型来具体实现。具体包括利用数据预处理、文本分析類、机器学习类、模型评估等算法模型实现医疗大数据的可视化展示[4]。利用统计分析、关联规则、文本聚类、语义分析等技术构造疾病关系图谱、疾病演变等。利用贝叶斯算法、深度学等[5]技术构建疾病诊断,治疗等风险评估模型[6]。

????????3医疗大数据平台技术架构

????????对系统开发中多种技术架构进行对比评估,Hadoop是一个能对大量数据进行分布式处理的系统。主要由HDFS(HadoopDistributedFileSystem),MapReduce,Spark和Hbase等组件组成。现在Hadoop技术架构设计[7]已经成为大数据平台做非结构化数据处理的标准配置,为半结构化和非结构化的医疗大数据提供分布式数据存储[8]资源。同时,也为自然语言处理,各种模型算法提供分布式计算资源。医疗大数据平台的技术架构如图2所示。

????????Hadoop技术架构设计,可以解决传统信息化架构中存储,计算,运维等多方面的效率和稳定性问题。Hadoop技术架构中,可以在不了解分布式底层细节的情况下,开发分布式程序,从而实现利用集群优势进行高效运算和存储。其中HDFS为海量的数据提供了存储,MapReduce则为海量的数据提供了计算。

????????4医疗大数据平台应用场景

????????在医疗大数据平台中,主要实现了病历搜索、患者全景视图、科研项目管理、疾病关系图谱和特征分布、知识库等主要几个应用模块,为医疗大数据的应用提供了有力支撑。

????????4.1病例搜索

????????病

文档评论(0)

辉辉 + 关注
实名认证
内容提供者

好文件 大家都可以分享

1亿VIP精品文档

相关文档