目的针对某三级甲等医院电子病历中的非结构化部分(诊断和病情),建立多特征融合的条件随机场模型,自动化识别用自然语言描述的电子病历(electronic medical records,EMR)中的疾病和症状,从而实现电子病历信息的结构化存储,以利于电子病...
详细信息
目的针对某三级甲等医院电子病历中的非结构化部分(诊断和病情),建立多特征融合的条件随机场模型,自动化识别用自然语言描述的电子病历(electronic medical records,EMR)中的疾病和症状,从而实现电子病历信息的结构化存储,以利于电子病历的信息挖掘和统计分析。方法将手动标注的语料库分为训练集和测试集,借助NLPIR工具分割文本,选择CRF++工具进行实验。针对中文电子病历的数据特点,先选取基本特征和相应的特征模板,通过不同上下文窗口的对比实验确定其大小;再分别添加引导词特征和构词结构特征,对比两种高级特征对实验结果的影响。结果仅选取基本特征,上下文窗口为7时,识别效果最好;添加高级特征后,最终疾病实体F值为92.80%,症状实体F值为94.17%。结论条件随机场模型融合多种有效的特征,可以很好地识别出电子病历中的疾病和症状实体。本研究对电子病历的命名实体识别有重要的意义。
常用的地铁站冷水机组能效模型存在非线性因素干扰,导致模型预测精度、可靠性较低。针对此问题,本文提出一种基于误差修正的冷水机组能效预测模型。该模型从误差入手,通过支持向量回归机对预测误差的历史数据进行训练得到误差预测模型,然后对传统模型的预测结果进行修正得到最终能效预测值。通过北京某地铁实训平台空调机组运行数据对本文模型进行验证,结果表明在冷水机组能效比(Coefficient of Performance,COP)较高的情况下,本文模型较传统模型精度有明显提高。
暂无评论