在医疗云平台上如何去应用医疗数据?这是目前医院信息主管们普遍关心的话题。在2017年3月18日由中国研究型医院学会医疗信息化分会医疗和临床科研大数据专业委员会主办、HIT专家网承办的“医疗大数据应用与实践研讨会”上,北京大学人民医院信息中心副主任王力华阐述了北大人民医院医疗云平台建设概况,并分享了该院基于医疗云平台在数据应用方面的实践经验。
搭建云端基础设施
“其实,医院信息化建设过程中,经常感到最不够用的资源就是存储。”王力华说。偌大的北大人民医院,院内机房就非常小,仅为110平米。云存储的兴起,让这种尴尬有了新选择。
王力华表示,向云平台迁移,主要基于几个方面的考虑:一是院内存储空间资源及机房空间资源有限;二是医院业务发展迅速,但相关项目建设规划和实施周期较长;三是医院为单机房,无法异地容灾和异地备份,如遇异常则无法保障数据;四是医院核心业务的连续性要求;五是医院信息部门的运维工程师较少,如北大人民医院仅有三个人的小组管理整个医院的基础设施的运维。
2015年,北大人民医院开始了云平台的尝试。通过千兆光纤专线的安全通道,将该院的私有云与金山云的公有云进行连接,从而实现混合云平台下的环境部署,迄今依次完成搭建基础设施云平台的三个目标:
- 首先,完成业务系统的异地备份与容灾。医院筛选出23个最重要的数据库服务器并将其备份到云端。再将13个应用系统、文件和影像的服务器共17TB文件备份至云端。每周进行一次全量备份,每天进行一次增量备份。目前,在云端的数据量已将近100TB。对于异地容灾,该院在云端和本地数据库实时同步了HRP和EBS(财务系统)灾备数据库。“不管是备份也好,还是容灾也好,我们都会定期做恢复性测试,但实际没有真正用过,我们也希望以后不会有用到的时候。”王力华说。
- 其次,主要针对超声、放射、核医学等对存储开销非常大的科室,实现云存储。比如,将超声系统的历史影像数据都存在云端,日常在线使用时还是应用本地存储;而核医学系统,全部的影像数据都在云端存储和调用。
- 第三,测试和比较云端应用系统与院内应用系统之间的性能和可用性。
测试云端应用
王力华介绍,为了检验云端应用的效果,该院进行了三个测试:
一是CDR在三个环境中的并发访问压力测试。即分别在院内虚拟机环境、金山云云内环境、金山云院内客户端环境。结果显示,在院内虚拟机环境所用的时间最多,服务器在金山云、客户端在院内的金山云院内环境次之,客户端和服务器都放到云端的金山云云内环境用时最短。
二是针对科研查询的测试。在CDR刚建成之时,北大人民医院对将近2TB的数据的Orcle数据库做了科研查询测试。由于科研查询的条件非常复杂,所以耗时很长,当时是在每天下班前在后台运行查询指令,第二天才能看到结果。所以当时就想尝试放到云端运行看看情况会有什么不同。尽管没有找到相同的环境,本地和云端的服务器的配置稍有差异,但是测试发现,云端运行的性能非常好。
三是对HIS应用的测试。“实际上,我心里一直存在一个疑惑,就是传统架构的CS系统,是否可直接部署到云端运行?”王力华表示。最近,他们专门安排了测试计划:将HIS系统三层架构中的客户端和数据库服务器放在本地,中间层服务器则直接部署在云端。“但是非常遗憾的是,目前还是没有调试成功,原因就是云端的操作系统版本较新,而HIS应用所能支持的操作系统版本较低。虽然对云端操作系统做了降级处理,但仍然没有调试成功。所以系统软件之间的差异影响很大。”王力华坦言。
探索云平台数据应用
在科研数据应用方面,北大人民医院把医院的50多个系统数据集成在CDR中,并基于CDR搭建了一个科研查询数据平台。“目前我院的科研数据查询平台包含2000多个数据项,虽然很受医生们欢迎,但实际应用起来仍然不能满足医生们需求。”王力华说。
而如果在医生们每天的日常临床业务的场景下,再要求他们去补充科研数据,也不实际。一方面工作量太大,另一方面有些数据的采集人并不是医生,增加了业务流程造成操作者的复杂性。如果操作者不能及时或专业的填写内容,造成数据错误或者不真实的,这对于科研没有任何帮助。
王力华表示,有必要做专科数据库。因为有一些特定的专科数据无法采集,或者目前还未能能收到电子病历系统的数据,依然需要补充到专科数据库。对于随访系统来说,及时补充科研数据非常重要。这需要从两个方面入手:一方面要补充病人的转归数据,如果没有转归数据就很难做成一个科研的项目;另一方面,补充现有信息系统中没有的数据,而且一般要和病人取得联系后再填写,这就需要随访系统平台来做支撑。目前,北大人民医院已经建立了随访平台,若干科室也都针对不同的项目定制了不同的随访方案。
此外,多中心的专科平台对于医院补充一些其他医院的数据也很重要。“实际上,多中心平台不是新事物,许多医院的临床科室主任都会有自己的小平台,在这个平台上去收集其他医院的数据。”王力华说。但是,整合散落在各个医院相关科室的数据,协调的工作量非常大,特别是不能把控录入数据的质量。
王力华说:“如果不同医院的数据大部分能做到自动提取的话,那么临床科室会非常愿意合作。有的科室主任跟我说,你们如果能实现哪家医院自动抽取数据,我就可以找哪家合作开展科研项目。”
她认为,搭建院内统一的科研平台非常重要。因为CDR和科研数据查询平台都是来源于医院各个业务系统,所以两者是基于全院平台的应用,但是专科数据库、多中心平台和随访系统等应用,则一般在各临床科室。在大数据科研趋势下,搭建全院平台级应用,有利于日后对科研数据的挖掘处理和有效利用。
王力华还谈到了云环境下的医院数据利用的安全保障,要兼顾考虑云机房安全、网络链路安全、应用运维和使用安全。“我们从技术上都是可以保证安全的,但实际上很多环节涉及到的人员和管理的安全。所以,不仅是技术,还要有相应的管理制度。更为重要的是管理落地,而且要落实到每一个相关责任人。”王力华说。
关于医院“上云”的几点心得
王力华认为,适合云端的应用主要体现在四个方面:
- 首先是异地的备份和容灾。如果医院都有异地的机房,可以直接去做异地备份。如果没有的话,云端是比较好的选择。
- 其次是一些对外的应用。如远程会诊、区域医疗、App及微信应用等。这些应用本来就需要内、外网环境来运行,所以直接部署到云端效果会更好。
- 第三是开发和测试的环境。实际上医院内部有大量的开发和测试环境,如CDR、集成平台等占用了很多服务器资源,将这些平台部署到云端较为合适。
- 第四是一些大数据的应用。如科研查询平台和影像存储系统等。
王力华特别强调了云端和院内基础设施的差异:一是院内应用系统对网络服务器和存储的硬件要求不高,所以硬件影响还不太大。但是,包括院内用的操作系统、虚拟化软件、负载均衡软件、备份软件等系统软件,如果与云端不相同,就需要花较多时间,去调试和磨合,这也是HIS部署云端测试不成功的主要原因。二是云端和院内的应用运维模式不同。如果部署到云端,医院运维的工作量就会减少许多,但云厂商必须要保证管理和运维的稳定性。三是云环境的安全问题。北大人民医院要求其云供应商必须通过三级等保,并且从技术到管理层面都要有安全的保证。“放在云端的机房到底安全不安全,可能见仁见智。”王力华说。