• 1. 中国医学科学院/北京协和医学院医学信息研究所(北京 100020);
  • 2. 哈尔滨工程大学青岛创新发展基地(山东青岛 266000);
导出 下载 收藏 扫码 引用

目的 目前医学量表资源的加工与组织多集中在文档层面,不利于用户从条目层面进行检索与复用。本文旨在提出一种低资源场景下的医学量表条目多分类方法,支持细粒度医学量表资源组织与服务。方法 采用一种基于预训练语言模型BERT的提示学习分类方法来实现医学量表条目文本的多分类。首先收集肺癌临床评估量表,提取功能、领域分类标签,采用人工标注“功能-领域”组合标签形成肺癌临床评估条目小样本语料集;然后采用提示学习方法,通过将自定义构建的模板格式输入BERT模型,对模板空缺位置进行预测填充;最后将填充文本映射到标签,实现对医学量表中条目文本的多分类。结果 构建的语料包含肺癌临床评估条目347条,涉及“功能-领域”分类标签9个;在自制的语料集上,提出的多分类方法的平均准确率达到93%,比次优的GAN-BERT模型性能提高约6%。结论 基于预训练语言模型BERT的提示学习分类方法能够在减少医学量表条目语料构建成本的同时保持较优的性能,在医学量表条目分类研究与实践中具有推广价值。

引用本文: 郝洁, 彭庆龙, 丛山, 李姣, 孙海霞. 基于提示学习的医学量表问题文本多分类研究. 中国循证医学杂志, 2024, 24(1): 76-82. doi: 10.7507/1672-2531.202307139 复制

  • 上一篇

    基于PMC指数模型的我国体医融合政策量化评价研究
  • 下一篇

    贝叶斯分位数回归在临床医学数据分析的应用与R Studio实践