张毅 1,2,3 , 秦小林 1,2 , 林远 4 , 李勇明 4,5 , 王品 4 , 张祖伟 3 , 李小飞 3
  • 1. 中国科学院 成都计算机应用研究所(成都 610041);
  • 2. 中国科学院大学(北京 100049);
  • 3. 中电科技集团 重庆声光电有限公司(重庆 401332);
  • 4. 重庆大学 微电子与通信工程学院(重庆 400044);
  • 5. 重庆市精神卫生中心(重庆 400020);
导出 下载 收藏 扫码 引用

语音特征学习是精神病语音识别方法的核心和关键。深层特征学习可以自动提取语音特征,但受限于小样本问题;传统的特征提取(原始特征)避免小样本问题影响,但严重依赖经验且自适应不佳。为了解决这一问题,本文提出了一种深层内嵌混合稀疏堆栈自动编码器流形集成算法。首先,基于先验知识提取精神病语音特征,构造原始特征。其次,将原始特征内嵌入到稀疏堆栈自动编码器(深度网络)中,对隐藏层的输出进行滤波,增强深层特征与原始特征的互补性。再次,设计 L1 正则化特征选择机制,压缩由深层特征和原始特征组成的混合特征集的维度。最后,设计了加权局部保持投影算法和集成学习机制,构造了流形投影分类器集成模型,进一步提高了小样本下特征融合的分类稳定性。此外,本文首次设计了一个中大规模的精神病语音采集方案,收集并构建了一个大规模的中文精神病语音数据库,用于精神病语音识别算法的验证。实验结果表明,该算法主要创新部分有效;与其他有代表性的算法相比具有更好的分类准确率,最大改善了 3.3%。综上所述,本文提出了一种基于深层内嵌混合稀疏堆栈自动编码器和流形集成的精神病语音识别方法,有效提高了精神病语音识别准确率。

引用本文: 张毅, 秦小林, 林远, 李勇明, 王品, 张祖伟, 李小飞. 基于深层内嵌混合稀疏堆栈自动编码器和流形集成的精神病语音识别方法. 生物医学工程学杂志, 2021, 38(4): 655-662. doi: 10.7507/1001-5515.202010050 复制

  • 上一篇

    不同波长的光对鲤鱼机器人运动行为影响的研究
  • 下一篇

    基于递归定量分析方法的孤独症儿童脑电信号特征提取与分类研究