版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
作者机构:新疆财经大学信息管理学院乌鲁木齐830012 新疆财经大学丝路经济与管理研究院乌鲁木齐830012 北京联合大学北京市信息服务工程重点实验室北京100101
出 版 物:《计算机工程与应用》 (Computer Engineering and Applications)
年 卷 期:2021年第57卷第15期
页 面:42-61页
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金(61866035,61966033) 北京市自然科学基金面上项目(4202028)
主 题:维吾尔语 自然语言处理 形态分析 音变还原 词干提取 形态切分
摘 要:维吾尔语具有形态丰富性、黏着性和数据稀疏性等特点,处理技术和英汉等热门语言有着较大差距并且未能满足新疆地区发展需求。形态分析是自然语言处理的重要组成部分,研究维吾尔语形态分析对于推动维吾尔语信息处理技术发展有着重要意义。简述了维吾尔语语法,描述了维吾尔语自然语言处理、形态分析及其相关基本资源研究现状,将常见方法分为基于规则、基于词典、基于统计、基于深度学习和基于混合5大类并分析了各种方法的优劣,介绍了维吾尔语形态分析后续研究,借鉴了先进的词法分析方法,总结了维吾尔语形态分析面临的挑战和机遇,并对其未来发展趋势进行展望。