最近混淆网络在融合多个机器翻译结果中展示很好的性能.然而为了克服在不同的翻译系统中不同的词序,假设对齐在混淆网络的构建上仍然是一个重要的问题.但以往的对齐方法都没有考虑到语义信息.本文为了更好地改进系统融合的性能,提出了用词义消歧(Word sense disambiguation,WSD)来指导混淆网络中的对齐.同时骨架翻译的选择也是通过计算句子间的相似度来获得的,句子的相似性计算使用了二分图的最大匹配算法.为了使得基于WordNet词义消歧方法融入到系统中,本文将翻译错误率(Translation error rate,TER)算法进行了改进,实验结果显示本方法的性能好于经典的TER算法的性能.
针对情感分类问题中长句和短句具有不同的建模特点,提出了一种基于联合深度学习模型的情感分类方法。该方法融合长短期记忆(long-short term memory,LSTM)模型与卷积神经网络(convolutional neural network,CNN)对影视评论数据进行情感...
详细信息
针对情感分类问题中长句和短句具有不同的建模特点,提出了一种基于联合深度学习模型的情感分类方法。该方法融合长短期记忆(long-short term memory,LSTM)模型与卷积神经网络(convolutional neural network,CNN)对影视评论数据进行情感极性判别;采用LSTM对上下文进行建模,通过逐词迭代得到上下文的特征向量;采用CNN模型从词向量序列中自动发现特征,抽取局部特征并整合成全局特征来提高分类效果。所提出的方法在COAE2016评测的任务2的情感极性分类任务中,取得最高的系统准确率。
本文提出了一种基于字的名实体统计机器翻译方法以及一种融合知识的构造策略。该方法的优势在于其避免了基于分词的翻译方法由于名实体中含有的大量未登录词导致的分词错误从而使翻译质量下降的缺点,并使得我们可以在训练数据有限的情况下获得更为丰富的翻译信息。本文应用当前主流的统计机器翻译工具 pharaoh 对机构名进行了几组对比翻译实验。结果表明基于字的名实体翻译方法以及融合知识的使用可以使翻译性能获得连续的提高。两种方法的机构名译文的 BLUE 评分分别提高了8.1%和20%。
暂无评论