文献详情 >基于ALBERT预训练模型的通用中文命名实体识别方法收藏

基于ALBERT预训练模型的通用中文命名实体识别方法

General Chinese Named Entity Recognition Based on ALBERT

作者：吕海峰冀肖榆陈伟业邸臻炜 Lu Haifeng;Ji Xiaoyu;ChenWeiye;Di Zhenwei

作者机构：梧州学院大数据与软件工程学院广西梧州543002 梧州学院广西机器视觉与智能控制重点实验室广西梧州543002 梧州学院广西高校图像处理与智能信息系统重点实验室广西梧州543002

出版物：《梧州学院学报》 (Journal of Wuzhou University)

年卷期：2022年第32卷第3期

页面：10-17页

学科分类：08[工学] 080203[工学-机械设计及理论] 0802[工学-机械工程]

基　　金：梧州学院教育教学改革工程项目(Wyjg2019A094)

主　　题：命名实体识别条件随机场 BERT模型 ALBERT模型准确率

摘要：HMM、CRF等机器学习算法在中文实体抽取任务上存在大量依靠特征提取及准确率低的缺陷,而基于BiLSTM-CRF、BERT等深度神经网络算法在中文实体识别准确率高,但BiLSTM模型依赖大规模标注数据,BERT存在参数量大、效率低等问题。该研究提出了基于ALBERT-Attention-CRF模型进行中文实体抽取的方法。首先将glove、Word2vec等静态词向量替换为ALBERT预训练模型字向量,可有效解决分词错误、数据稀疏、OOV、过拟合以及一词多义等问题;然后采用ALBERT作为编码层并对其输出利用Attention机制捕获上下文语义特征;最后结合CRF作为解码层输出实体正确标签,摒弃主流BiLSTM-CRF模型,最终在《人民日报》数据的测试集上取得了理想的效果。试验结果表明,该方法有助于提升通用中文实体识别的准确率和效率,其有效性也得到了较好的验证。

本地馆藏 | 借阅须知 | 我要预约

已订购，未入库

sda

目录详情 | 试阅读 |

读者评论与其他读者分享你的观点

学校读者

用户名:未登录

我的评分

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

看过本文的还看了

相关文献

该作者的其他文献

CADAL相关文献

基于ALBERT预训练模型的通用中文命名实体识别方法

读者评论与其他读者分享你的观点

请选择收藏分类：

建议与咨询 留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

看过本文的还看了

相关文献

该作者的其他文献

CADAL相关文献

基于ALBERT预训练模型的通用中文命名实体识别方法

读者评论 与其他读者分享你的观点

请选择收藏分类： 新增自定义分类 确定 取消

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

读者评论与其他读者分享你的观点

请选择收藏分类：