版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
作者机构:中国科学院新疆理化技术研究所多语种信息技术研究室 中国科学院大学计算机科学与技术学院 中国科学院新疆理化技术研究所新疆民族语音语言信息处理实验室
出 版 物:《计算机工程与设计》 (Computer Engineering and Design)
年 卷 期:2024年第9期
页 面:2749-2756页
学科分类:08[工学] 080203[工学-机械设计及理论] 0802[工学-机械工程]
基 金:国家自然科学基金项目(U2003303) 新疆天山创新团队基金项目(2020D14045) 中国科学院青年创新促进会基金项目(科发人函字26号) 新疆维吾尔自治区自然科学基金重点基金项目(2022D01D04) 新疆维吾尔自治区重点研发任务专项基金项目(2022B03010)
主 题:手写维文识别 手写风格 多尺度 特征金字塔网络 视觉自注意力模型 长短期记忆网络 特征融合
摘 要:基于字符形态与书写风格的强关联性,提出一种多尺度风格自适应的手写维文识别模型,模型从浅层笔划到深层序列建模多尺度风格特征,提高对手写风格的自适应能力。针对手写维文特点改进Transformer提取多尺度笔划特征;构建多尺度风格自适应模块提取序列特征;构建特征泛化融合模块对笔划特征和序列特征进行深度融合,提升识别效果。实验结果表明,该模型在真实手写维文测试集WER、CER分别下降3.75%、0.19%,在IAM数据集中验证了模型迁移性。