引用本文: 胡海, 胥伶杰, 曹钰. 展望急诊医学的大数据时代. 华西医学, 2015, 30(6): 1001-1002. doi: 10.7507/1002-0179.20150288 复制
在过去的20年中,各行业、各领域的数据,包括医疗保健、用户生成数据、互联网、金融公司和供应链系统等,都出现大规模增长[1]。随着以智能手机和可穿戴设备为代表的各种随身电子仪器的出现,人们的日常活动、生理变化随时都可能成为可被记录和分析的海量数据,一个大规模产生、挖掘和分析应用大数据的时代正在到来[2]。
1 大数据的概念
“大数据”的概念产生在全球数据呈现“爆炸式”增长的背景下,指超乎单台计算机处置能力的巨大数据集合。与传统的数据集合相比,大数据不仅仅包括结构化数据,即可通过数据库或数据表录入而形成行列表的数据,还包括大量的非结构化数据,如微博、音频、视频等无法成为行列表的海量数据[3]。这些非结构数据所含信息量巨大,和结构数据在一起可以对我们认知的整个世界进行更符合现实的数据描述。此外,我们还可能从大数据中挖掘出更多未知的价值。因此,如何有效识别、组织管理、分析利用这些数据也给我们带来新的挑战[2]。
“大数据”目前并无统一的定义,呈现模糊状态。目前将“大数据”定义为一个容量和数据类别均巨大的数据集合,而且此数据集合无法用传统数据库工具对其内容进行抓取、管理和处理。其特点有4“V”,即:①数据多(volumes),一般在10 TB大小,但在实际应用中,许多企业用户已经建立了PB级(1 PB=1 024 TB)的数据量;②数据类别多(variety),数据来自多种数据源,数据种类和格式日趋增多,不仅包括结构化数据,还包括非结构化数据;③数据处理速度快(velocity),即使如此庞大的数据,也能够做到数据的实时处理,得出实时结论;④数据真实性高(veracity),随着新数据源的兴起,传统数据源的局限被打破,数据源之间相互印证,得到准确性高的数据[2]。
2 大数据的常用分析方法
传统数据分析是指用各种统计方法对各种结构化数据资料进行分析,将看似杂乱无章的数据中的信息提炼出来,找出研究对象的内在规律,开发数据资料的功能,体现数据的价值。虽然一些传统数据分析方法也可用于大数据分析[1],如聚类分析、因子分析、主成分分析、相关分析、回归分析[4-5]等,但上述分析方法难于同时完成非结构化数据与结构化数据的快速分析,因此许多新型分析方法脱颖而出。
目前一些大数据具体处理方法主要有:Bloom Filter法、Hash法、Trie树、并行计算法等[1]。传统数据分析方法大多数都是通过对原始数据集进行抽样,然后对收集到的数据样本进行统计分析,通过复杂的算法从有限的样本空间中获取尽可能多的信息,从而推断总体。随着互联网、云计算技术的开展,数据计算能力和存储能力已经大幅度提升,可以支持整体数据运算而非样本运算。因此大数据分析方法与传统分析方法的最大区别在于分析的对象是尽可能得到的整体数据,而非数据样本,因此大数据分析在于不追求算法的复杂性和精确性,而是追求可以高效地对所能得到的全体数据集的分析。总之,传统数据方法从有限的样本数据集合中获取信息以推断总体情况,其更加追求准确性;大数据分析方法则是通过高效的算法、模式,对整体数据进行分析。
3 急诊医学发展需要大数据分析和应用
急诊医学是一门研究如何更迅速、更有效、更协调地救治急性病和危重病的学科。目前在国内,常将急诊医学分为院前急救、紧急医学救援、危重病、心肺复苏、创伤、中毒、小儿急诊等亚专业[6],在国外还会包含“胸痛中心”、“国际急诊医学”、“观察医学”等内容,而延伸出来的“分检”、“转运”、“预防决策”以及“急诊医学教学和管理”等方面也是急诊同行常常关注的问题。此时,各亚专业的发展就需要预测其专业组的危急重症的死亡风险[7],需要通过尽量多地了解患者的数据信息,制定周密的诊疗方案,给予生命支持措施,进一步明确诊断,这些过程都需要进行快速、动态、充分的评估,明确下一步使用某种方式的效益与风险,再有的放矢。
急诊科病种的多样性和病情的复杂性为急诊医学实践的时效性、准确性增加了更大的难度。本期专题就有应用传统数据分析对心肺复苏、地震伤员、蜂螫伤、休克指数、胸痛患者进行评估的文献。在传统的急诊医学的研究过程中,尤其是临床资料的分析处理,我们会使用数据样本收集、数据描述和统计推断等方法对临床数据进行分析,得到研究结果。这种研究方法无法实时对正在处理的患者进行临床指导。然而,试想如果我们能够通过音频、视频等收集基于患者的面色、形态、声音、行动的非结构数据,再结合监测报告和检查结果,使用计算机完成高效快速分析,我们将会得到关于此例患者的更精确而快速的计算机建议,提高我们医学判断的精准性。
急诊病种的多样性、病情的复杂性使得急诊医护人员必须拥有丰富的医学知识和准确的判断能力,这对于急诊医学专业人员来说,意味着需要丰富的临床经验和长时间不间断的技术训练,本期专题中就有一篇应用医学模拟联合病案教学对急诊医生进行培训的文献。而在大数据背景下,只要收集到足够多的数据,建立相关计算方法,医学人员就可以在大数据的帮助下,借助计算机得到在人类相当认知水平条件下较为精确的判断,就可以直接指导临床实践,实现急诊医学的人工智能。
急诊管理也是急诊医学学科发展的重要组成部分,本期专题中有文献分析医疗纠纷产生的原因及防范,但如果能够依托大数据平台,得到资源与资源配置等的实时数据,以及基于大数据挖掘分析得出的结果,直接指导资源调配、风险管理等,使管理更加精细,急诊程序更加优化,减少安全风险事件的发生。
4 急诊医学大数据时代的阻力
4.1 各医院的信息孤岛形成信息壁垒
大数据收集是整体数据收集,非既往的样本收集,因此大数据挖掘的前提是尽量收集到整体的数据,美国的医疗已经实现数据共享,因此可以使用海量数据指导实践。但我国在当前的医疗体制下,各个医院的各种信息常常为“孤岛”信息,无法达到信息共享,这也成为大数据收集的阻力之一。本期文献中,有蜂螫伤的文献和地震一线医院的文献的资料为多家医院共享的资料,收集数据量明显较单家医院资料多,更具有指导意义。只有突破医院间的壁垒,真正做到信息共享,急诊医学的大数据时代才会真正来临[8]。
4.2 急诊医学大数据挖掘和分析方法尚有待进一步研究
目前各个行业均在应用大数据进行数据分析、决策制定、风险管理等。但医学与人的生命相关,要求更高的精确性。目前能够广泛用于医学决策的大数据挖掘和分析方法尚不成熟,需要在实践中进一步完善[9]。
5 展望
大数据由于其数据的整体性、快速性、准确性和多样性,在当前的各行各业的实践中已经开始带来新的一轮信息革命。虽然目前在我国的急诊医学实践和研究中尚不能很好地进行大数据收集和分析,但随着大数据挖掘和分析技术的发展和我国医疗体制的改革,以大数据分析指导急诊医学的研究与临床实践的推进必将在不远的未来带给我们急诊医学临床模式的重大变革[10]。
在过去的20年中,各行业、各领域的数据,包括医疗保健、用户生成数据、互联网、金融公司和供应链系统等,都出现大规模增长[1]。随着以智能手机和可穿戴设备为代表的各种随身电子仪器的出现,人们的日常活动、生理变化随时都可能成为可被记录和分析的海量数据,一个大规模产生、挖掘和分析应用大数据的时代正在到来[2]。
1 大数据的概念
“大数据”的概念产生在全球数据呈现“爆炸式”增长的背景下,指超乎单台计算机处置能力的巨大数据集合。与传统的数据集合相比,大数据不仅仅包括结构化数据,即可通过数据库或数据表录入而形成行列表的数据,还包括大量的非结构化数据,如微博、音频、视频等无法成为行列表的海量数据[3]。这些非结构数据所含信息量巨大,和结构数据在一起可以对我们认知的整个世界进行更符合现实的数据描述。此外,我们还可能从大数据中挖掘出更多未知的价值。因此,如何有效识别、组织管理、分析利用这些数据也给我们带来新的挑战[2]。
“大数据”目前并无统一的定义,呈现模糊状态。目前将“大数据”定义为一个容量和数据类别均巨大的数据集合,而且此数据集合无法用传统数据库工具对其内容进行抓取、管理和处理。其特点有4“V”,即:①数据多(volumes),一般在10 TB大小,但在实际应用中,许多企业用户已经建立了PB级(1 PB=1 024 TB)的数据量;②数据类别多(variety),数据来自多种数据源,数据种类和格式日趋增多,不仅包括结构化数据,还包括非结构化数据;③数据处理速度快(velocity),即使如此庞大的数据,也能够做到数据的实时处理,得出实时结论;④数据真实性高(veracity),随着新数据源的兴起,传统数据源的局限被打破,数据源之间相互印证,得到准确性高的数据[2]。
2 大数据的常用分析方法
传统数据分析是指用各种统计方法对各种结构化数据资料进行分析,将看似杂乱无章的数据中的信息提炼出来,找出研究对象的内在规律,开发数据资料的功能,体现数据的价值。虽然一些传统数据分析方法也可用于大数据分析[1],如聚类分析、因子分析、主成分分析、相关分析、回归分析[4-5]等,但上述分析方法难于同时完成非结构化数据与结构化数据的快速分析,因此许多新型分析方法脱颖而出。
目前一些大数据具体处理方法主要有:Bloom Filter法、Hash法、Trie树、并行计算法等[1]。传统数据分析方法大多数都是通过对原始数据集进行抽样,然后对收集到的数据样本进行统计分析,通过复杂的算法从有限的样本空间中获取尽可能多的信息,从而推断总体。随着互联网、云计算技术的开展,数据计算能力和存储能力已经大幅度提升,可以支持整体数据运算而非样本运算。因此大数据分析方法与传统分析方法的最大区别在于分析的对象是尽可能得到的整体数据,而非数据样本,因此大数据分析在于不追求算法的复杂性和精确性,而是追求可以高效地对所能得到的全体数据集的分析。总之,传统数据方法从有限的样本数据集合中获取信息以推断总体情况,其更加追求准确性;大数据分析方法则是通过高效的算法、模式,对整体数据进行分析。
3 急诊医学发展需要大数据分析和应用
急诊医学是一门研究如何更迅速、更有效、更协调地救治急性病和危重病的学科。目前在国内,常将急诊医学分为院前急救、紧急医学救援、危重病、心肺复苏、创伤、中毒、小儿急诊等亚专业[6],在国外还会包含“胸痛中心”、“国际急诊医学”、“观察医学”等内容,而延伸出来的“分检”、“转运”、“预防决策”以及“急诊医学教学和管理”等方面也是急诊同行常常关注的问题。此时,各亚专业的发展就需要预测其专业组的危急重症的死亡风险[7],需要通过尽量多地了解患者的数据信息,制定周密的诊疗方案,给予生命支持措施,进一步明确诊断,这些过程都需要进行快速、动态、充分的评估,明确下一步使用某种方式的效益与风险,再有的放矢。
急诊科病种的多样性和病情的复杂性为急诊医学实践的时效性、准确性增加了更大的难度。本期专题就有应用传统数据分析对心肺复苏、地震伤员、蜂螫伤、休克指数、胸痛患者进行评估的文献。在传统的急诊医学的研究过程中,尤其是临床资料的分析处理,我们会使用数据样本收集、数据描述和统计推断等方法对临床数据进行分析,得到研究结果。这种研究方法无法实时对正在处理的患者进行临床指导。然而,试想如果我们能够通过音频、视频等收集基于患者的面色、形态、声音、行动的非结构数据,再结合监测报告和检查结果,使用计算机完成高效快速分析,我们将会得到关于此例患者的更精确而快速的计算机建议,提高我们医学判断的精准性。
急诊病种的多样性、病情的复杂性使得急诊医护人员必须拥有丰富的医学知识和准确的判断能力,这对于急诊医学专业人员来说,意味着需要丰富的临床经验和长时间不间断的技术训练,本期专题中就有一篇应用医学模拟联合病案教学对急诊医生进行培训的文献。而在大数据背景下,只要收集到足够多的数据,建立相关计算方法,医学人员就可以在大数据的帮助下,借助计算机得到在人类相当认知水平条件下较为精确的判断,就可以直接指导临床实践,实现急诊医学的人工智能。
急诊管理也是急诊医学学科发展的重要组成部分,本期专题中有文献分析医疗纠纷产生的原因及防范,但如果能够依托大数据平台,得到资源与资源配置等的实时数据,以及基于大数据挖掘分析得出的结果,直接指导资源调配、风险管理等,使管理更加精细,急诊程序更加优化,减少安全风险事件的发生。
4 急诊医学大数据时代的阻力
4.1 各医院的信息孤岛形成信息壁垒
大数据收集是整体数据收集,非既往的样本收集,因此大数据挖掘的前提是尽量收集到整体的数据,美国的医疗已经实现数据共享,因此可以使用海量数据指导实践。但我国在当前的医疗体制下,各个医院的各种信息常常为“孤岛”信息,无法达到信息共享,这也成为大数据收集的阻力之一。本期文献中,有蜂螫伤的文献和地震一线医院的文献的资料为多家医院共享的资料,收集数据量明显较单家医院资料多,更具有指导意义。只有突破医院间的壁垒,真正做到信息共享,急诊医学的大数据时代才会真正来临[8]。
4.2 急诊医学大数据挖掘和分析方法尚有待进一步研究
目前各个行业均在应用大数据进行数据分析、决策制定、风险管理等。但医学与人的生命相关,要求更高的精确性。目前能够广泛用于医学决策的大数据挖掘和分析方法尚不成熟,需要在实践中进一步完善[9]。
5 展望
大数据由于其数据的整体性、快速性、准确性和多样性,在当前的各行各业的实践中已经开始带来新的一轮信息革命。虽然目前在我国的急诊医学实践和研究中尚不能很好地进行大数据收集和分析,但随着大数据挖掘和分析技术的发展和我国医疗体制的改革,以大数据分析指导急诊医学的研究与临床实践的推进必将在不远的未来带给我们急诊医学临床模式的重大变革[10]。