共计 4378 个字符,预计需要花费 11 分钟才能阅读完成。
近几年来,医疗机构的数字化过程显著放慢,机构内的信息系统越来越多、电子病历一直遍及、各方面业务的数字化根本实现……与之相随同而来的,是海量待开掘利用的数据。
艾瑞征询公布的《2022 年中国医疗信息化行业钻研报告》指出,现阶段我国整体医疗数据利用程度较低。三级医院具备根底的数据资源整合和利用能力,但对于数据进一步的剖析解决能力还有待增强;而三级以下医院超过半数未发展对于医疗数据的利用业务,且整体利用能力较之三级医院有较大差距。医疗数据利用难,成为了横隔在医疗机构数字化过程中的一道难题。
01、为何医疗数据利用难?
1. 医疗大数据自身简单
医疗衰弱大数据次要可分为四大类:
①诊疗辅助类:包含亚健康及患病人群通过医疗机构、第三方测验机构或网络平台参加病情的征询、预约、诊断、医治等过程所产生的医疗数据。
②衰弱监测类:指基于挪动物联网对集体身材体征及日常行为进行监测的生命体征类数据,常被利用于慢性病患者的自我管理。
③公共卫生类:次要指区域性的医疗服务平台、公共卫生信息系统等产生的医疗数据。
④定向生物医学类:次要是对于新药品研发、生物标本和基因测序的信息,多利用于共性诊疗、精准医疗、临床药物试验等医学钻研。
因为这 4 类数据起源以及作用成果简单,而且局部医疗数据带有主观性质,医疗信息存在显著的阶段性特色;再加之疾病的产生和倒退过程及医学影像、病理等信息有很强的工夫维度属性,床旁监护等仪器产生的数据也具备很强的时效性;信息孤岛、信息烟囱及疾病的多发性常导致医疗数据存在大量垃圾数据,如常见病病情形容、慢性病患者的重复性查看等,造成了医疗数据的冗余……这些医疗大数据的典型个性也为其治理利用加大了难度。
2. 医疗数据孤岛化重大且不足规范体系
衰弱界研究院公布的《中国智慧医疗 2021 十大发展趋势预测》报告中指出,以后智慧医疗倒退中,亟待须要破解院内及院间的互联互通实现难、数据品质低两个要害技术难题。
因为信息系统技术规范、根底信息数据规范的不对立和缺失,间接导致了医疗数据品质低的问题,如数据不残缺,医疗记录有断点;信息用自然语言形容,自动化剖析解决艰难等,都导致这些数据无奈最大化利用。
且医院外部系统集成受制于医院零碎多元异构,医疗数据广泛不能互通互认,这也加剧了医疗行业的“数据孤岛”景象,数据跨平台不能齐全集成、互联互通及共享,数据价值难以失去较大水平施展。
然而,作为医疗机构高质量倒退的要害因素,无论是智慧医院建设,还是信息化规范建设,都离不开对大数据的利用。而要破解医疗机构数据利用难题,就须要从源头解决问题,通过数据治理,让数据从不可控、不可用、不好用到可控、不便易用且能赋能业务。
02、医疗机构如何做好数据治理?
医疗机构进行数据治理的过程,就是对其数据资产进行治理和管制,撑持并保障数据被平安高效地替换与利用的过程。下图是可参考的医疗机构数据治理体系。咱们接下来次要从 6 个外围环节来详解医疗机构如何做好数据治理。
1. 环节一:设立数据治理组织构造
设计健全的数据治理组织构造,是全面发展数据治理工作的根底。
医疗机构须要成立专门的数据治理或数据管理部门,实现流程和标准制订、数据质量保证和品质管制、流程审批等工作,并对数据应用方和 IT 设施建设方进行治理。目前,诸多医院曾经专门成立了大数据部门承当这项工作,也有医院将这项工作放在信息科或病案管理室。
2. 环节二:制订数据相干流程标准
制订清晰的数据相干流程标准,有助于帮忙实现以下指标:数据有明确和精确的定义;数据有明确的责任方;数据有清晰的存储形式与正当的工夫期限;数据加工办法清晰;数据拜访形式与管制明确;数据内容符合标准要求与品质要求。
医疗机构的数据标准,次要从上面这三个方面来制订。
(1)信息标准
信息标准蕴含隐衷、数据权限管控标准和品质评估标准等。医疗机构需重点关注这一部分标准的建设,保障医疗数据合规。
(2)数据标准
数据标准包含不同业务零碎,如电子病历数据标准、医院信息系统数据标准。对于数据整合过程和整合后的零碎来说,须要主数据和元数据标准以及相干的数据品质标准。
(3)流程治理标准
流程治理标准规定了何人在何种利用场景下,通过何人的审批能够操作何种类型的数据。相比数据采集、加工与存储的流程,数据应用流程的制度治理更为重要,比方何种职责的科室和医生在什么情景下能够导出数据、数据是否离院、应由哪一级来审批决定,这些都须要具体规定。除治理标准外,不同角色的人员如何合作互动实现既定的工作,也可通过制订流程撑持标准实现。
3. 环节三:搭建数据规范体系
要保障医疗机构各业务部门、零碎间的数据的规范性、流通性和共享性,就要搭建对立的数据规范体系。数据治理相干规范分为基础性和应用性规范,包含数据定义与分类(元数据)、主数据、参考数据(数据字典)、数据模型、治理与技术类、品质评估类等内容。数据治理工作组成员以及业务组人员可参考已有规范,并与现有医疗系统、业务流程相结合,发展医疗衰弱大数据规范体系的建设、施行、批改等工作。
目前,我国针对医疗大数据的相干技术标准正在逐渐建设,国家卫生衰弱委员会相继出台了多项管理制度,如 2018 年颁布的《对于印发大数据规范、平安和服务治理方法(试行)的告诉》国卫布局发[2018]23 号,《对于印发全国医院信息化建设规范与标准(试行)的告诉》国卫办布局发〔2018〕4 号,《国家卫生衰弱委办公厅对于印发全国医院数据上报治理计划(试行)的告诉》国卫办布局函〔2019〕380 号等文件,在医疗大数据采集、加工、存储共享等方面进行了标准,充分发挥了标准化在医疗数据治理、利用和倒退过程中的引领作用。
4. 环节四:元数据管理
针对医院信息系统中存在的数据模式形容文档不全、零碎之间数据关联不清晰、零碎值域规范不对立等问题,进行元数据管理,是获取业务零碎中数据的含意,辅助数据了解,减少剖析的麻利的重要伎俩。
与其余畛域相比,医疗畛域的元数据标准绝对比拟成熟。
如原卫生部颁布的《国家卫生计生委办公厅对于印发住院病案首页数据填写品质标准(暂行)和住院病案首页数据品质治理与管制指标(2016 版)的告诉》(国卫办医发〔2016〕24 号)、《病历书写标准》(卫医政发〔2010〕11 号)、《电子病历根本标准》(卫医政发〔2010〕24 号)、《卫生信息根本数据集编制标准》(WS 370-2012)、《卫生治理根本数据集》(WS374-2012)与《电子病历根本架构与数据规范》(卫办发〔2009〕130 号)等。
在数据值编码标准方面,国内上有疾病分类编码 ICD-10、手术操作编码 ICD- 9 以及 SNOMED 术语库,国内有国家标准《卫生机构(组织)分类与代码表》(WS2182002)、《社会保险药品分类与代码》(LD/T90-2012)和《西医病证分类与代码》(GB/T15657-1995)。
然而,在应用过程中,这些规范会依据利用进行不同水平的删减和裁减,甚至呈现谬误的应用。因而,基于规范建设一个元数据管理系统,可不便地在规范上裁减,并能够关联不同的利用。
元数据管理系统次要由采集层、规范层、剖析层和利用接口层组成。采集层从各种医疗信息系统内获取元数据,查看元数据的变动和更新。规范层保留了元数据的标识信息、内容信息与模式信息等。因为医院信息系统各异,规范层实现了将元数据映射到规范汇合以及将不同的元数据进行互操作的性能。剖析层次要提供了对元数据的治理、剖析与查问。元数据库与数据源存在对应关系,当用户通过对立入口提交查问服务时,能够依据元数据库提供的特色找到对应的信息资源,重组之后出现给用户。因而,利用接口层除了提供元数据拜访的限度和爱护外,同时还服务于各个应用程序。
5. 环节五:主数据管理
在构建主数据管理库时,首先须要从多个异构的业务子系统中以 ETL 的形式抽取要害数据,而后,利用元数据库对其中的编码、形容进行标准化。接着,因为多个业务零碎的数据可能不统一,还须要通过匹配算法实现对数据的谬误打消和信息交融。对于匹配不到的孤立信息,要加以监控跟踪,进行人工解决。同时,以增量学习的形式不断改进匹配算法。最初,将归整好的主数据信息存入主数据库。
医疗数据的主数据次要有病人信息和医生信息两类。以病人信息为例,病人的出生年月、性别等信息在各零碎中都有,但因为医院信息系统是从身份证读取的信息,因此相比其余零碎采纳人工录入的形式来说更精确。然而,病人的血型信息通常在实验室信息管理系统中是更精确的,甚至可能在门诊 / 急诊工作站中也没有这些信息。通过主数据管理系统,能够从各零碎中别离获取信息,依据可靠性、统一率等进行信息校验交融,最初造成该病人的齐备信息,而后再将齐备信息下发到各业务零碎。
此外,在多家医院之间实现主数据独特治理之后,还能够买通医院之间的信息壁垒。若患者在 A 医院诊断出患有某慢性病,当他下次去 B 医院就诊时,医生也能疾速得悉该患者的这个信息,从而使就诊更高效、更精确。
6. 环节六:数据品质治理
医疗数据品质问题次要来源于 3 个方面。
①原始信息采集有误差。在医疗系统内数据采集次要通过手工形式录入,在医生或护士输出信息的过程中,可能会无意或无心地将数据谬误引入零碎。
②数据交融过程产生问题。在对不同起源的数据进行交融时,数据格式和语义可能会有误差或不统一,导致交融后果有错。
③与数据的利用场景不匹配。例如,如果要进行病例统计,现有临床电子病历数据就能满足统计场景的需要。但如果要做大肠癌疗效剖析,现有临床电子病历数据就难以满足剖析场景的要求,还需补充病理数据。
所以,对数据品质的管控,次要从三个方面来进行:数据品质实时监控、数据品质评估以及数据主动修改。
(1)数据品质实时监控
次要针对从业务零碎抽取的或是从内部传送的接口数据,通常从及时性、有效性和完整性等几个指标监测接口内容自身的数据品质问题,还须要对采集程序进行监控,如接口采集程序是否失常启动、是否失常完结等。
(2)数据品质评估
是指对交融后的数据进行品质评估。首先从确定评估对象和范畴着手,而后选取数据品质维度及评估规范,确定品质测度及评估办法,之后依照配置的评估指标执行评估,产生权重化的评估后果,最初生成品质后果和报告。
(3)数据主动修改
是指对于有谬误或不统一的数据,局部数据能够进行自动化的探测和更正。例如,工夫的表白能够是 DD/MM/YY,也能够是 YY/MM/DD,能够通过智能算法探测原始零碎的表达方式,制订映射规定,实现日期格局的一致性。
03、小结
通过 30 多年医疗信息化建设,医疗机构的数据量及其复杂性连年攀升,医疗行业的关注焦点曾经从信息系统建设延长到了数据资源管理和利用。
而要实现数据资源的无效利用,数据治理是关键环节。只有做好数据治理,让数据利用无效撑持医院倒退,能力进一步提高医院管理水平,实现数据对医疗业务倒退的价值赋能。