结合IMIA(International Medical Informatics Association)年鉴的定性数据和分别取自Web of Science和CNKI的国际、国内定量数据,用LDA主题模型识别研究的主题,在识别论文主题模型基础上采用3种聚类算法对研究进行聚类分析。研究发现,2...
详细信息
结合IMIA(International Medical Informatics Association)年鉴的定性数据和分别取自Web of Science和CNKI的国际、国内定量数据,用LDA主题模型识别研究的主题,在识别论文主题模型基础上采用3种聚类算法对研究进行聚类分析。研究发现,2000—2018年医学信息学分化出生物信息学和健康信息学两大分支,分别形成医学信息学的“硬”走向和“软”走向。在揭示两类走向分别标志医学信息学的技术性和应用性发展的同时,建议对医学信息学的健康信息学转向给予关注,并强化国家政策设计。
电子病历实体识别是医疗领域人工智能和医疗信息服务中非常关键的基础任务.为了更充分地挖掘电子病历中的实体语义知识以提升中文医疗实体识别效果,提出融入外部语义特征的中文电子病历实体识别模型.该模型首先利用语言模型word2vec将大规模的未标记文本生成具有语义特征的字符级向量,接着通过医疗语义资源的整合以及实体边界特征分析构建了医疗实体及特征库,将其与字符级向量相拼接以更好地挖掘序列信息,最后采用改进的Voting算法将深度学习结果与条件随机场(Conditional Random Fields,CRF)的结果加以整合来纠正标签偏置.实验表明,融入外部语义特征的改进模型的F值达到94.06%,较CRF高出1.55%.此外,还给出了模型最佳效果的各项参数.
暂无评论