中文拼写纠错旨在检测和纠正中文文本的拼写错误,现有方法已尝试将字符相似性建模成图结构信息。但目前方法的图结构忽略汉字之间的深层音近关系,并缺少充分发挥字音和字形作用的多模态信息融合方法。因此,本文根据汉字的声母韵母信息和拼音的重要度得到拼音相似关系,结合汉字形近关系来构建汉字相似拼音-形近异构图。在该图上使用异构图卷积来互补使用汉字的音形信息,充分融合汉字的声韵和形状信息。该方法在SIGHAN15(Special Interest Group on Chinese Language Processing 15)基准上句子纠正级的F1值超过所有的对比方法,并在SIGHAN13基准上媲美最优的对比方法,验证了该方法的有效性。
暂无评论