引用本文: 陈俊任, 曾瑜, 张超, 沈建通, 杨晓妍. 人工智能医学应用的文献传播的可视化研究. 中国循证医学杂志, 2021, 21(8): 973-979. doi: 10.7507/1672-2531.202102036 复制
近年来,随着医学数据类别与规模以前所未有的速度增长及人工智能技术的快速发展,人工智能医学领域应用的研究呈爆发式增长[1-7]。人工智能的医学应用与交叉学科人才培养越来越受重视:2020 年,四川大学计算机学院(软件学院)牵头自主设置人工智能交叉学科,本文通信作者负责组织医学人工智能方向,获批后,作为学校开设人工智能二级学科的学院之一,华西临床医学院在临床医学一级学科下增设人工智能二级学科,并将于 2021 年秋开始招收硕士和博士研究生,开展临床医学与计算机科学等交叉学科研究生培养;当前,国家新设置了第 14 个学科门类即“交叉学科”门类,四川大学、浙江大学、武汉大学、华中科技大学等高校正积极推进“人工智能”一级学科建设。另一方面,可视化技术日益成为研究医学领域主题发展的热点技术[8-12]。在这样的背景下,本研究利用文献可视化技术分析人工智能方法在医学领域应用的发文时间趋势、期刊分布、重点期刊高频医学主题词共词结构等,系统梳理总结人工智能医学领域应用研究成果的发表情况,以期为学科交叉研究、人才培养与职称评定提供参考。
1 资料和方法
1.1 纳入和排除标准
1.1.1 纳入标准
公开发表的医学中应用人工智能方法的研究。
1.1.2 排除标准
① 重复发表文献;② 二次研究文献、综述及评述类文献;③ 关键信息缺失导致无法判断是否符合纳入标准的文献。
1.2 文献检索策略
计算机检索 PubMed、EMbase 数据库,搜集人工智能方法在医学领域应用的相关文献。通过预检索结果分析和专家咨询,将常用人工智能方法整理归类为关键检索词(表 1),根据关键词逐一检索文献库,最后将检索结果合并。以 PubMed 文献数据库为例,具体检索策略见框 1。


*所检索的数据库及检出文献数具体如下:PubMed(
1.3 文献筛选与资料提取
由 2 名研究人员独立筛选文献与提取资料。如遇分歧讨论解决,仍不能达成一致时咨询第三方。资料提取的内容包括:文章标题、作者、发表日期、数据分析方法、文章类型、关键词、医学主题词和杂志名称等。
1.4 数据整理
为便于进行可视化和共词分析,对获取的文献进行清洗,处理缺失值和无效值,同时保证数据一致性。以文献名为主索引,利用 Pandas、Numpy 合并同名文献,通过去除空格、特殊字符、大小写统一等方法合并同名文献,然后在 Excel 中人工筛查诸如“Neoplasm”、“Neoplasms”等实际同名单词。同时合并发文时间、作者、机构、关键词、医学主题词等相关字段,合并时如信息不一致则进行人工筛查;合并后,通过文献搜索接口爬取对应发刊地区,如无检索信息则进行人工搜索。
1.5 统计分析
采用 Python 编程语言结合 Matplotlib、Seaborn 和 Pyecharts 等开源软件包进行可视化分析。对纳入研究的发表时间、发表地区进行描述性分析,并用图形进行分析结果的可视化展现。统计纳入文献的医学主题词,在排除性别、人群、国家和主题不清晰的英文医学主题词(如 methods、algorithms、networks、software 等)之后,选择词频排名前 200 的高频医学主题词并依据 Pathfinder Networks(PFNETs)算法[13, 14]对主题词进行共词分析。PFNETs 算法能够以图的形式表达各个数据之间存在的某种关系并建立有效的连接路径。本文采用 PFNETs 算法将文献的医学主题词作为独立节点,以医学主题词间的共现关系作为图中的连接线,其共现词频数作为节点间的连接权重值。此外,为了能够度量与优化 PFNETs 算法对文献的医学主题词划分的性能,本文使用了 Blondel 等[15]提出的方法。该方法基于 Modularity 算法[16]中的模块度,其核心公式如下:
其中,表示节点
和节点
之间的边的权值;
是连接节点
的所有边的权值之和;
表示为节点
被划分所在的团体;函数
在
时,其值为 1,否则其取值为 0;此外,
。在本文 PFNETs 算法形成的图谱中产生的关键节点表达了人工智能方法在医学领域的走向,其余节点以关键节点为核心,形成不同的研究范式,进而构成基于人工智能方法的医学研究全景,呈现医学领域中人工智能方法应用主题的热点方向和相互的联系与发展情况。
2 结果
1 文献筛选流程及结果
初检共获得 126 360 篇文献,经逐层筛选后纳入 73 999 篇文献。文献筛选流程及结果见图 1。
2.2 论文发表时间趋势分析
1990~2004 年,每年发文量较稳定;2005 年开始,每年发文量呈现出高速增长的趋势;2012 年后呈爆发式增长;2019 年发文量突破 1 万篇(图 2)。

2.3 文献的国别分布
美国发文量超 30 000 篇,英国次之,非洲大部分地区的文献发布量为 0。发文量前 20 位见表 2。

第一作者数量所在国家排名前三依次为美国、中国和英国。其中第一梯队的美国与中国数量较为接近,第二梯队的英国不足第一梯队国家的五分之一。此外,排名前 20 的国家地处欧洲的数量多于其他地区,且大部分为发达国家(图 3)。

医学领域基于人工智能方法的文献第一作者数量排名前 25 位的机构中,美国加利福尼亚大学处于全球领先地位;中国浙江大学和中国科学院紧随其后。排名前 25 位的机构中,中国和美国分别占 12 个和 11 个,明显多于其他国家(图 4)。

2.4 文献的期刊分布
在本文中,根据专家经验定义发文量在前 30 位的期刊中影响因子处于前 10 位的期刊为重点期刊,其重点期刊历年表现见图 5。1990~1994 年,发表的文献量均较少,1995 年开始有所增加,但直到 2004 年前,重点期刊每年累计均不超过 100 篇。1995~1998 年,医学领域中基于人工智能方法的文献主要发表在 Neural Networks;1999~2000 年主要发表在 Analytica Chimica Acta;2002 年主要发表在 Analytica Chimica Acta 和 Bioinformatics;2002~2010 年主要发表在 Bioinformatics。2012 年,IEEE Trans Neural Netw Learn Syst 文献发布量首次进入前 10 位,之后每年发文量都处于前 10 位,2018 和 2019 年,该期刊发文量排第 1 位,成为医学领域人工智能方向发文量最多的期刊。

2.5 重点期刊高频医学主题词共词分析
医学主题词共现分析法[17]思想源于文献计量学的引文耦合与共被引概念,在一定程度上代表本领域研究热点。本文根据 PFNETs 算法选择文献中医学主题词为独立节点,并以两个医学主题词之间的共现为连接,以医学主题词的共现频率为连接权重。如图 6 所示,每一个圆形节点代表一个医学主题词,圆形节点面积的大小代表该主题词的词频大小。相邻节点间连线的粗细表示两个医学主题词之间共现的频数,连线越粗则表明两个医学主题词之间共现频数越大。此外,经过算法划分,具有相同颜色的圆形节点可归纳为同一个类簇,具有最大面积的圆形节点为 PFNETs 算法所产生的关键节点。本研究结果表明,在医学领域人工智能方法中,机器学习算法主要面向医学图像分析、疾病/癌症分类、癌症诊断等方向。神经网络算法与人工神经网络算法具有很强关联度。自然语言处理方法是人工智能领域的一个分支,在医学领域中通常被应用于电子病历。核磁共振成像方向,主要使用图像分割算法来处理正电子发射断层扫描、计算机辅助断层扫描等。偏最小二乘回归算法这类统计学习方法也被广泛应用在定量分析、红外光谱等医学领域。值得注意的是,支持向量机算法应用广泛。此外,传统的机器学习方法模型如贝叶斯模型、马尔科夫链模型等也被应用于医学领域。

3 讨论
医学领域中基于人工智能方法的研究与应用起源于上世纪末,但文献数量较少。2000~2004 年发文量有所增多,2005~2012 年明显增多,其原因是该时期人工智能方法中的分支领域—机器学习得到了全面且高速的发展。2012 年之后,每年发文量呈爆发式增长,这得益于人工智能中深度学习方法的发展。尽管早在 2006 年,机器学习领域泰斗 Hinton 和 Salakhutdinov 就提出了深度学习模型[18],但当时计算机的运算资源不足以支撑深度学习所需的海量运算,并未广泛应用于医学领域。2012 年后,计算机硬件设备在计算能力上有了突破性成果,间接促进了深度学习方法的发展。2012 年,Hinton 研究团队采用深度卷积神经网络模型[19]将分类错误率从 26%减少到 15%,赢得了计算机视觉领域最具影响力的 ImageNet 比赛[20]冠军,这一惊人的改进使深度学习成为近年来人工智能方法的研究热点。由于深度学习能自动化提取数据中的复杂高维抽象特征,这种强大的特征提取能力使得研究人员在生物信息学、医学影像、临床病历和公共卫生等领域深入使用深度学习技术[21-25]。随着预测性、个性化、预防性和参与性医学概念的引入[26],计算机领域的人工智能方法已成为整合医学数据,实现精准医学的重要方法和工具。2019 年,医学领域中基于人工智能方法的研究与应用文献发表突破 1 万篇,表明该领域已成为研究热点。
当前美国在基于人工智能的医学领域研究处于全球领先地位。科技和经济发达国家(如美国、加拿大、日本等)或地区(如欧洲)以及科技和经济发展迅猛的发展中国家(如中国、印度等)发表文献较多,侧面反映出国家层面的科技和经济发展能够促进交叉领域的研究。第一作者来源的机构排名显示,在前 25 个机构中,第一作者来自大学的占主导地位,反映出高校具有丰富的人才及研究基金资源,是学科交叉研究高地。
重点期刊发文情况显示,IEEE Trans Neural Netw Learn Syst 2012 年首次进入前 10 位,之后每年都处于领先地位,成为该领域最热门期刊。该期刊属信息科学、机器学习、人工智能的交叉学科领域,主要刊发神经网络及其学习系统的最新研究成果,是 IEEE 计算智能学会核心刊物,也是神经网络和学习系统方面的国际顶级期刊。近两年重点期刊年发文量数据显示,基于人工智能方法的医学研究领域科研人员投稿目标多在交叉学科杂志,表明医工交叉研究与应用近两年呈现出上升趋势,并逐渐成为热门。
本文挖掘重点期刊排名靠前的高频医学主题词并展示共词网络图,发现神经网络算法主要应用在基因组研究方面,这是由于神经网络能够模拟人类神经元,具有强大的数据分析能力。为了提高识别准确率,人工神经网络的一些变体也被研究人员使用。自然语言处理方法通常被应用于电子病历,这是由于电子病历中含有大量文字表达数据。值得注意的是,传统的机器学习方法—支持向量机,通过 PFNETs 算法选择后作为单独的分支,在文献数据中占比大。这是由于支持向量机算法本质上是求解凸二次规划的最优化算法,具有严格的数学理论支持和很强的可解释性。在支持向量机算法中,其最终的决策函数只由少数的支持向量所确定,属于一种小样本学习的机器学习方法,因此,该算法非常适用于现实世界中不易大量获取临床医学数据的研究。另一方面,支持向量机算法能够通过引入核函数来处理非线性问题,这适用于现实世界获取的非线性临床医学数据处理,因此该算法被广泛应用于医学领域。传统统计学习方法如贝叶斯模型、马尔科夫链等也被广泛应用于医学领域。尽管深度神经网络正在医学影像等多种医学领域发挥重要作用,但仍存在一些局限性,如通常无法向用户解释这些模型的决策过程,这种不可解释性导致许多临床医生和病人放弃使用这类黑盒模型,最终选择可解释性强的传统统计学习方法。尽管传统统计学习方法的性能效果可能不如当前流行的神经网络模型,但由于其可解释性强,仍被广泛应用于医学领域。
综上所述,当前美国人工智能医学应用研究处于全球领先地位,中国研究实力亦处于世界前列。医学文献在交叉学科期刊的发文量逐渐增多,反映出人工智能与医学学科交叉成为近年研究的热点。
近年来,随着医学数据类别与规模以前所未有的速度增长及人工智能技术的快速发展,人工智能医学领域应用的研究呈爆发式增长[1-7]。人工智能的医学应用与交叉学科人才培养越来越受重视:2020 年,四川大学计算机学院(软件学院)牵头自主设置人工智能交叉学科,本文通信作者负责组织医学人工智能方向,获批后,作为学校开设人工智能二级学科的学院之一,华西临床医学院在临床医学一级学科下增设人工智能二级学科,并将于 2021 年秋开始招收硕士和博士研究生,开展临床医学与计算机科学等交叉学科研究生培养;当前,国家新设置了第 14 个学科门类即“交叉学科”门类,四川大学、浙江大学、武汉大学、华中科技大学等高校正积极推进“人工智能”一级学科建设。另一方面,可视化技术日益成为研究医学领域主题发展的热点技术[8-12]。在这样的背景下,本研究利用文献可视化技术分析人工智能方法在医学领域应用的发文时间趋势、期刊分布、重点期刊高频医学主题词共词结构等,系统梳理总结人工智能医学领域应用研究成果的发表情况,以期为学科交叉研究、人才培养与职称评定提供参考。
1 资料和方法
1.1 纳入和排除标准
1.1.1 纳入标准
公开发表的医学中应用人工智能方法的研究。
1.1.2 排除标准
① 重复发表文献;② 二次研究文献、综述及评述类文献;③ 关键信息缺失导致无法判断是否符合纳入标准的文献。
1.2 文献检索策略
计算机检索 PubMed、EMbase 数据库,搜集人工智能方法在医学领域应用的相关文献。通过预检索结果分析和专家咨询,将常用人工智能方法整理归类为关键检索词(表 1),根据关键词逐一检索文献库,最后将检索结果合并。以 PubMed 文献数据库为例,具体检索策略见框 1。


*所检索的数据库及检出文献数具体如下:PubMed(
1.3 文献筛选与资料提取
由 2 名研究人员独立筛选文献与提取资料。如遇分歧讨论解决,仍不能达成一致时咨询第三方。资料提取的内容包括:文章标题、作者、发表日期、数据分析方法、文章类型、关键词、医学主题词和杂志名称等。
1.4 数据整理
为便于进行可视化和共词分析,对获取的文献进行清洗,处理缺失值和无效值,同时保证数据一致性。以文献名为主索引,利用 Pandas、Numpy 合并同名文献,通过去除空格、特殊字符、大小写统一等方法合并同名文献,然后在 Excel 中人工筛查诸如“Neoplasm”、“Neoplasms”等实际同名单词。同时合并发文时间、作者、机构、关键词、医学主题词等相关字段,合并时如信息不一致则进行人工筛查;合并后,通过文献搜索接口爬取对应发刊地区,如无检索信息则进行人工搜索。
1.5 统计分析
采用 Python 编程语言结合 Matplotlib、Seaborn 和 Pyecharts 等开源软件包进行可视化分析。对纳入研究的发表时间、发表地区进行描述性分析,并用图形进行分析结果的可视化展现。统计纳入文献的医学主题词,在排除性别、人群、国家和主题不清晰的英文医学主题词(如 methods、algorithms、networks、software 等)之后,选择词频排名前 200 的高频医学主题词并依据 Pathfinder Networks(PFNETs)算法[13, 14]对主题词进行共词分析。PFNETs 算法能够以图的形式表达各个数据之间存在的某种关系并建立有效的连接路径。本文采用 PFNETs 算法将文献的医学主题词作为独立节点,以医学主题词间的共现关系作为图中的连接线,其共现词频数作为节点间的连接权重值。此外,为了能够度量与优化 PFNETs 算法对文献的医学主题词划分的性能,本文使用了 Blondel 等[15]提出的方法。该方法基于 Modularity 算法[16]中的模块度,其核心公式如下:
其中,表示节点
和节点
之间的边的权值;
是连接节点
的所有边的权值之和;
表示为节点
被划分所在的团体;函数
在
时,其值为 1,否则其取值为 0;此外,
。在本文 PFNETs 算法形成的图谱中产生的关键节点表达了人工智能方法在医学领域的走向,其余节点以关键节点为核心,形成不同的研究范式,进而构成基于人工智能方法的医学研究全景,呈现医学领域中人工智能方法应用主题的热点方向和相互的联系与发展情况。
2 结果
1 文献筛选流程及结果
初检共获得 126 360 篇文献,经逐层筛选后纳入 73 999 篇文献。文献筛选流程及结果见图 1。
2.2 论文发表时间趋势分析
1990~2004 年,每年发文量较稳定;2005 年开始,每年发文量呈现出高速增长的趋势;2012 年后呈爆发式增长;2019 年发文量突破 1 万篇(图 2)。

2.3 文献的国别分布
美国发文量超 30 000 篇,英国次之,非洲大部分地区的文献发布量为 0。发文量前 20 位见表 2。

第一作者数量所在国家排名前三依次为美国、中国和英国。其中第一梯队的美国与中国数量较为接近,第二梯队的英国不足第一梯队国家的五分之一。此外,排名前 20 的国家地处欧洲的数量多于其他地区,且大部分为发达国家(图 3)。

医学领域基于人工智能方法的文献第一作者数量排名前 25 位的机构中,美国加利福尼亚大学处于全球领先地位;中国浙江大学和中国科学院紧随其后。排名前 25 位的机构中,中国和美国分别占 12 个和 11 个,明显多于其他国家(图 4)。

2.4 文献的期刊分布
在本文中,根据专家经验定义发文量在前 30 位的期刊中影响因子处于前 10 位的期刊为重点期刊,其重点期刊历年表现见图 5。1990~1994 年,发表的文献量均较少,1995 年开始有所增加,但直到 2004 年前,重点期刊每年累计均不超过 100 篇。1995~1998 年,医学领域中基于人工智能方法的文献主要发表在 Neural Networks;1999~2000 年主要发表在 Analytica Chimica Acta;2002 年主要发表在 Analytica Chimica Acta 和 Bioinformatics;2002~2010 年主要发表在 Bioinformatics。2012 年,IEEE Trans Neural Netw Learn Syst 文献发布量首次进入前 10 位,之后每年发文量都处于前 10 位,2018 和 2019 年,该期刊发文量排第 1 位,成为医学领域人工智能方向发文量最多的期刊。

2.5 重点期刊高频医学主题词共词分析
医学主题词共现分析法[17]思想源于文献计量学的引文耦合与共被引概念,在一定程度上代表本领域研究热点。本文根据 PFNETs 算法选择文献中医学主题词为独立节点,并以两个医学主题词之间的共现为连接,以医学主题词的共现频率为连接权重。如图 6 所示,每一个圆形节点代表一个医学主题词,圆形节点面积的大小代表该主题词的词频大小。相邻节点间连线的粗细表示两个医学主题词之间共现的频数,连线越粗则表明两个医学主题词之间共现频数越大。此外,经过算法划分,具有相同颜色的圆形节点可归纳为同一个类簇,具有最大面积的圆形节点为 PFNETs 算法所产生的关键节点。本研究结果表明,在医学领域人工智能方法中,机器学习算法主要面向医学图像分析、疾病/癌症分类、癌症诊断等方向。神经网络算法与人工神经网络算法具有很强关联度。自然语言处理方法是人工智能领域的一个分支,在医学领域中通常被应用于电子病历。核磁共振成像方向,主要使用图像分割算法来处理正电子发射断层扫描、计算机辅助断层扫描等。偏最小二乘回归算法这类统计学习方法也被广泛应用在定量分析、红外光谱等医学领域。值得注意的是,支持向量机算法应用广泛。此外,传统的机器学习方法模型如贝叶斯模型、马尔科夫链模型等也被应用于医学领域。

3 讨论
医学领域中基于人工智能方法的研究与应用起源于上世纪末,但文献数量较少。2000~2004 年发文量有所增多,2005~2012 年明显增多,其原因是该时期人工智能方法中的分支领域—机器学习得到了全面且高速的发展。2012 年之后,每年发文量呈爆发式增长,这得益于人工智能中深度学习方法的发展。尽管早在 2006 年,机器学习领域泰斗 Hinton 和 Salakhutdinov 就提出了深度学习模型[18],但当时计算机的运算资源不足以支撑深度学习所需的海量运算,并未广泛应用于医学领域。2012 年后,计算机硬件设备在计算能力上有了突破性成果,间接促进了深度学习方法的发展。2012 年,Hinton 研究团队采用深度卷积神经网络模型[19]将分类错误率从 26%减少到 15%,赢得了计算机视觉领域最具影响力的 ImageNet 比赛[20]冠军,这一惊人的改进使深度学习成为近年来人工智能方法的研究热点。由于深度学习能自动化提取数据中的复杂高维抽象特征,这种强大的特征提取能力使得研究人员在生物信息学、医学影像、临床病历和公共卫生等领域深入使用深度学习技术[21-25]。随着预测性、个性化、预防性和参与性医学概念的引入[26],计算机领域的人工智能方法已成为整合医学数据,实现精准医学的重要方法和工具。2019 年,医学领域中基于人工智能方法的研究与应用文献发表突破 1 万篇,表明该领域已成为研究热点。
当前美国在基于人工智能的医学领域研究处于全球领先地位。科技和经济发达国家(如美国、加拿大、日本等)或地区(如欧洲)以及科技和经济发展迅猛的发展中国家(如中国、印度等)发表文献较多,侧面反映出国家层面的科技和经济发展能够促进交叉领域的研究。第一作者来源的机构排名显示,在前 25 个机构中,第一作者来自大学的占主导地位,反映出高校具有丰富的人才及研究基金资源,是学科交叉研究高地。
重点期刊发文情况显示,IEEE Trans Neural Netw Learn Syst 2012 年首次进入前 10 位,之后每年都处于领先地位,成为该领域最热门期刊。该期刊属信息科学、机器学习、人工智能的交叉学科领域,主要刊发神经网络及其学习系统的最新研究成果,是 IEEE 计算智能学会核心刊物,也是神经网络和学习系统方面的国际顶级期刊。近两年重点期刊年发文量数据显示,基于人工智能方法的医学研究领域科研人员投稿目标多在交叉学科杂志,表明医工交叉研究与应用近两年呈现出上升趋势,并逐渐成为热门。
本文挖掘重点期刊排名靠前的高频医学主题词并展示共词网络图,发现神经网络算法主要应用在基因组研究方面,这是由于神经网络能够模拟人类神经元,具有强大的数据分析能力。为了提高识别准确率,人工神经网络的一些变体也被研究人员使用。自然语言处理方法通常被应用于电子病历,这是由于电子病历中含有大量文字表达数据。值得注意的是,传统的机器学习方法—支持向量机,通过 PFNETs 算法选择后作为单独的分支,在文献数据中占比大。这是由于支持向量机算法本质上是求解凸二次规划的最优化算法,具有严格的数学理论支持和很强的可解释性。在支持向量机算法中,其最终的决策函数只由少数的支持向量所确定,属于一种小样本学习的机器学习方法,因此,该算法非常适用于现实世界中不易大量获取临床医学数据的研究。另一方面,支持向量机算法能够通过引入核函数来处理非线性问题,这适用于现实世界获取的非线性临床医学数据处理,因此该算法被广泛应用于医学领域。传统统计学习方法如贝叶斯模型、马尔科夫链等也被广泛应用于医学领域。尽管深度神经网络正在医学影像等多种医学领域发挥重要作用,但仍存在一些局限性,如通常无法向用户解释这些模型的决策过程,这种不可解释性导致许多临床医生和病人放弃使用这类黑盒模型,最终选择可解释性强的传统统计学习方法。尽管传统统计学习方法的性能效果可能不如当前流行的神经网络模型,但由于其可解释性强,仍被广泛应用于医学领域。
综上所述,当前美国人工智能医学应用研究处于全球领先地位,中国研究实力亦处于世界前列。医学文献在交叉学科期刊的发文量逐渐增多,反映出人工智能与医学学科交叉成为近年研究的热点。