基于注意力机制的序列到序列模型在生成式摘要方法中得到广泛应用,并取得较好的表现。但现有模型方法生成的摘要普遍存在语义无关、句内重复和未登录词等问题。为了解决这些问题,在典型基于注意力机制的序列到序列模型基础上,提出了结合双注意力和指针覆盖机制的生成式文本摘要方法DAPC(Dual Attention and Pointer-Coverage based model)模型。组合局部注意力和卷积神经网络,提取输入文本的更高层次的语言特征;引入指针-生成网络来解决未登录词问题;使用覆盖机制解决模型生成摘要句内重复的问题。实验结果表明,模型在CNN/Daily Mail数据集中有较好的表现。
随着互联网技术的不断发展,人工智能也成为了一个热门课题,而智能问答系统也是人工智能领域里的一个研究热点。网络技术的发展也带来了整个互联网信息量的爆炸式增长,问答系统可以帮助用户可以从繁杂的信息中找到自己所需要的;同时,在电商网络领域,智能问答系统的研究可以帮助提高智能客服的准确性,具有很好的实际应用价值。目前,对于传统的问答系统研究大都采用基于检索匹配等方式,该方法存在着对不同场景的适应性欠佳、对上文的语义信息无法捕获等缺点,没有可迁移性。因此,针对上述不足,本文提出了基于深度学习和注意力模型的智能问答系统。本文主要提出对于文本语句的语义特征采用Word2Vec进行处理,并利用双向长短时记忆网络(Bi-directional Long Short Term Memory,Bi-LSTM)获取语句的时序信息。同时,为了获得文本语句的主题信息,提出在模型训练时融合注意力模型。在对收集好的数据进行预处理后,建立对应的问答文档,采用序列到序列框架进行训练,以获得问句与答句之间的匹配关系,进而可以为用户输入的问题生成相匹配的答案。在实验中,本文采用了N-gram模型对得到的实验结果进行系统的评价,通过计算生成的答案里不同2-gram数目占整个数据集中2-gram的比例,确定生成答案的语义多样性。同时,设置对照实验,分别对基于双向长短时记忆网络、基于长短时记忆网络和注意力模型的问答系统的实验结果进行对比分析。最终的实验结果表明,本文提出的引入注意力模型和Bi-LSTM的模型可以有效地提升问答系统回答的准确性。
暂无评论