针对中医事件抽取过程中存在事件论元边界模糊的问题,综合运用卷积神经网络、双向长短期记忆网络和注意力机制提出了一种局部与全局语义特征融合的事件抽取模型(event extraction model integrating local and global semantic feature,...
详细信息
针对中医事件抽取过程中存在事件论元边界模糊的问题,综合运用卷积神经网络、双向长短期记忆网络和注意力机制提出了一种局部与全局语义特征融合的事件抽取模型(event extraction model integrating local and global semantic feature,EE-LGSF),以提升中医事件抽取的效果。首先,通过结合不同滤波窗口大小的卷积神经网络提取文本的多维度局部特征信息,同时利用双向长短期记忆网络捕捉文本的全局特征信息;其次,通过门控机制实现局部与全局信息的动态交互,以增强对论元边界的识别能力;再次,引入模糊跨度注意力机制,动态调整注意力范围,从而优化论元跨度的决策过程;最后,以条件随机场进行标签预测。结果表明,所提模型比相关模型在中医医案数据集上的F1值提升了3.0~11.0个百分点,在解决中医事件抽取问题方面表现更为优异。所提模型能有效利用文本局部和全局语义信息,提高对文本跨度学习的灵活性来增强模型对论元边界的识别能力,从而获得更好的中医事件抽取效果,对中医知识传承和发展具有参考价值。
传统中医本草文献含有丰富的中医知识,是中医理论研究的重要载体.为了更好地挖掘中医本草知识,精准地实现中医本草文献命名实体识别任务,提出了一种基于特征增强的Bert-BiGRU-CRF中医本草命名实体识别模型,使用特征融合器拼接Bert生成的词向量与实体特征作为输入,以双向门控循环单元(bi-directional gated recurrent unit, BiGRU)为特征提取器,以条件随机场(conditional random fields, CRF)进行标签预测,通过特征增强的方法更好地识别中医本草的药名、药性、药味、归经等实体及其边界信息,完成中医本草命名实体任务.在中医本草数据集上的实验结果表明,融入特征的模型F1值达到了90.54%,证明了所提出的方法可以更好地提高中医本草命名实体识别精度.
暂无评论