版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
作者机构:上海交通大学医学院附属瑞金医院计算机中心上海200025
出 版 物:《电子设计工程》 (Electronic Design Engineering)
年 卷 期:2021年第29卷第12期
页 面:84-88页
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:EMRs 卷积神经网路 命名实体识别 深度学习 语言处理
摘 要:当前电子病历(EMRs)命名实体识别(NER)的研究主要集中在验证传统文本中的命名实体识别方法是否对电子病历有效。到目前为止,仍未从多类分类的角度提出通过深度学习提高命名实体识别性能的模型。文中通过对一个真实的EMRs语料库进行标注并完成模型的训练与性能评估,然后提出一种基于深度学习卷积神经网络(CNN)的EMRs命名实体多类分类方法。该方法分为两个阶段:在第一阶段中对EMRs进行预处理,以嵌入单词来表示样本;在第二阶段,将训练数据分割成多个子集,并在每个子集上训练出CNN二元分类模型。通过数据测试实验,将此方法与其他传统方法进行详细的对比,验证了该多类分类方法的有效性。