自然语言生成(Natural Language Generation,NLG)作为人工智能和计算机语言学的一个分支,是当前国内人工智能发展的一个重要的研究方向。其根据不同的输入数据类型划分为基于数据、文本和视觉信号的文本生成,从而自动生成高质量的人类...
详细信息
自然语言生成(Natural Language Generation,NLG)作为人工智能和计算机语言学的一个分支,是当前国内人工智能发展的一个重要的研究方向。其根据不同的输入数据类型划分为基于数据、文本和视觉信号的文本生成,从而自动生成高质量的人类可理解文档或报告等。随着大数据时代的快速发展,环保信息化已日益成为推动生产力发展的重要力量,我国对大量的环保信息数据进行搜集和分析,而如何充分使用这些数据则是当务之急。本文将NLG技术与数值型数据进行结合,利用国家声环境功能区监测数据和三江源生态环保数据,开发一款面向数值型数据的汉语文本自动生成系统,通过本系统可以提升数值型数据到文本生成方面的理论和技术支持,促进国内关于汉语文本生成方向的继续发展。本文首先分析了NLG的研究背景和国内外研究现状,总结了数值型数据在文本生成系统建设中的不足之处,将实际用户需求和系统的建设结合起来。系统在开发过程中遵循了标准的软件开发流程,并对开发的每个阶段进行了详细的介绍。在系统需求分析基础上进行了功能模块需求分析和文本语料库分析等。在系统实现方面采用了轻量级SSM框架,并使用MySQL关系型数据库进行数据存储,在数据到文本生成技术方面进行了文档规划、微观规划、文本实现等几个步骤的详细介绍和实现。最后对不同权限的用户进行了功能模块测试,并采用基于人的评价方法进行了文本评估测试。通过本次设计,系统在功能上基本满足用户需求,在生成文本的质量上能够符合用户对文本的质量要求。本系统的实现对国内NLG系统的研究有一定的理论意义和参考价值,且具有良好的使用和扩展前景。
针对卷积神经网络(Convolutional neural network,CNN)模型在对工业数值型数据分类方面存在特征使用不充分、模型分类性能不佳等问题,提出了一种基于自适应卷积核的改进CNN(Improved CNN based on adaptive convolution kernel, ACK-IC...
详细信息
针对卷积神经网络(Convolutional neural network,CNN)模型在对工业数值型数据分类方面存在特征使用不充分、模型分类性能不佳等问题,提出了一种基于自适应卷积核的改进CNN(Improved CNN based on adaptive convolution kernel, ACK-ICNN)算法。该算法为了增加特征的重复使用率,构建了一种多尺度卷积核的模型结构,通过融合处理卷积核提取的不同特征来实现,增强了模型的适应能力;为了进一步提升该算法的性能,利用网格搜索算法自适应选取CNN中最优的卷积核大小,使得模型能够提取出最优的特征。采用TE过程的故障数据对其进行测试,并与支持向量机、极限学习机、最近邻等典型的数据驱动方法进行对比,测试结果表明,该算法能有效提升各类故障的分类精度。
暂无评论