咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >疾病文本智能分析系统若干关键技术研究 收藏
疾病文本智能分析系统若干关键技术研究

疾病文本智能分析系统若干关键技术研究

作     者:胡满满 

作者单位:中国科学院大学 

学位级别:硕士

导师姓名:孙毓忠

授予年度:2019年

学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

主      题:疾病文本 智能分析 诊断模型 动态采样 迁移学习 生成对抗网络 知识图谱加速 

摘      要:疾病文本智能分析系统,作为一种智能辅助决策支持系统,以疾病诊断模型为核心,采用深度学习、迁移学习和自然语言处理等技术,研究非平衡文本样本的处理技术和疾病诊断模型的构建技术,来提供智能而优质的医疗资源和高质量、高效率的医疗服务。然而目前疾病文本智能分析系统存在一些问题,主要是医疗文本病历等数据具有非均衡和小样本的特点,这严重影响了基于机器学习的疾病诊断模型的效果。 本文对目前疾病文本智能分析系统中存在的一些问题进行了研究,主要内容如下: (1)针对医学文本病历集的非均衡、小样本问题,本文提出了融合新型动态采样和迁移学习的疾病诊断模型,采用新型动态采样技术,根据样本采样概率采样以构造均衡数据集来训练模型,然后基于模型在样本上的诊断结果来动态更新样本采样概率,确保模型更多地关注错误分类样本和分类确定性不高的样本,从而达到提高诊断模型判别能力的目的;同时,本文采用迁移学习技术将在相似的大样本疾病诊断模型上学习到的知识迁移到小样本疾病的诊断模型中,进行特征和知识的迁移和补充。实验表明,文本提出的模型显著提升了疾病诊断模型的召回率和整体诊断效果,尤其是小样本疾病的诊断效果得到了显著的提升,本文模型的精确率最高提升13.82%,召回率提升12.78%到55.57%,F1值提升7.76%到29.56%。 (2)针对医学文本病历集的非均衡、小样本问题,提出了一种融合病历生成对抗网络的疾病诊断模型,该方法首先构建知识图谱增强的病历生成对抗网络,在采用增强学习技术构建文本病历生成对抗网络的基础上,提出增加知识图谱静态评估器来协同判别器指导生成器的训练,采用融合博弈对抗训练、真实样本指导训练和监督学习训练的交叉训练方法增强模型训练的稳定性,实现有效准确文本病历的智能生成,然后,基于智能生成病历补充和均衡疾病的非均衡样本集并构建疾病诊断模型。实验表明,该模型进一步提升了疾病诊断的效果,与融合新型动态采样和迁移学习的疾病诊断模型相比,F1值提升0.39%到7.69%。 (3)针对医学文本病历集的非均衡、小样本问题,提出一种知识图谱加速的对抗迁移学习混合诊断模型,首先,充分利用知识图谱增强的病历生成对抗网络模型对抗生成的有效准确文本病历,构建均衡训练集,然后,基于知识图谱的疾病相似度计算和疾病共现频次选择相关联的一组相似疾病,接下来,采用多任务迁移学习技术,进行多个疾病诊断子模型的同时训练和协同互助,采用信息熵计算控制各子模型的训练强度,进行子模型间特征和知识的补充和迁移,利用相关诊断模型的训练信息提高模型的泛化能力。实验表明,该模型更进一步提升了疾病诊断模型的效果,F1值比融合新型动态采样和迁移学习的疾病诊断模型提升最高达12.9%,F1值比融合病历生成对抗网络的疾病诊断模型提升最高达4.84%。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分