检索结果-内蒙古大学图书馆

计算机工程与设计 2016年第5期37卷 1239-1244页

作者：赵林李宁彭欣北京信息科技大学网络文化与数字传播北京市重点实验室北京100101 北京信息科技大学计算机学院北京100101

为解决以往流式文档中逻辑结构重构方法的不足,提出一种基于有向图的流式文档逻辑结构重构方法。从模板文档中提取逻辑结构,在此基础上,通过对待查文档中的逻辑标签进行筛选建立有向图,利用有向图的单源最短路径算法过滤多余的逻辑结构... 详细信息

为解决以往流式文档中逻辑结构重构方法的不足,提出一种基于有向图的流式文档逻辑结构重构方法。从模板文档中提取逻辑结构,在此基础上,通过对待查文档中的逻辑标签进行筛选建立有向图,利用有向图的单源最短路径算法过滤多余的逻辑结构,得到最佳的文档逻辑结构。实验结果表明,该算法能够有效改善逻辑结构识别的准确性,对于文档内容理解和自动化排版与格式检查等应用具有重要意义。

关键词：逻辑结构重构逻辑标签自动排版格式检查流式文档单源最短路径

来源：评论

学校读者我要写书评

暂无评论

BETES:一种中文长文档抽取式摘要方法

引用

小型微型计算机系统 2022年第1期43卷 42-49页

作者：王宗辉李宝安吕学强游新冬北京信息科技大学网络文化与数字传播北京市重点实验室北京100101 北京信息科技大学计算机学院北京100101

在自然语言处理领域是最重要的研究工作之一,并随着深度学习的兴起成为研究热点,而中文长文本的摘要抽取面临更大的挑战,存在长文本-摘要语料库不足、摘要抽取信息不准确、目标摘要冗余、摘要句缺失等问题.本文以中文长文本的摘要抽取... 详细信息

在自然语言处理领域是最重要的研究工作之一,并随着深度学习的兴起成为研究热点,而中文长文本的摘要抽取面临更大的挑战,存在长文本-摘要语料库不足、摘要抽取信息不准确、目标摘要冗余、摘要句缺失等问题.本文以中文长文本的摘要抽取为研究对象,提出一种BETES方法,基于规则和人工辅助筛选构建中文长文本-摘要语料库;利用Bert预处理模型进行文本向量化,更好地捕捉长文本上下文的语义,提升信息抽取的准确性;在识别中文长文本的基本篇章单元的基础上,以基本篇章单元为抽取对象,降低摘要抽取的冗余度;最后利用Transformer神经网络抽取模型,实现基本篇章单元的抽取,提升摘要句抽取的准确率.实验证明,提出的BETES方法在中文长文本的抽取式摘要过程中提高了准确性,降低了冗余度,并且ROUGE分数优于主流的摘要抽取方法.

关键词：文本摘要抽取式摘要 Bert 基本篇章单元 Transformer

来源：评论

学校读者我要写书评

暂无评论

面向招投标领域的远程监督实体关系抽取研究

引用

计算机工程与应用 2020年第17期56卷 243-250页

作者：陈雨婷刘旭红刘秀磊北京信息科技大学网络文化与数字传播北京市重点实验室北京100101 北京信息科技大学计算机学院北京100101

招投标网站资源中蕴含着丰富的情报信息。“远程监督”方法借助知识库自动标注数据,弥补了传统信息抽取方法在语料准备阶段对人工强依赖的缺陷,可有效提高信息抽取效率。该方法会引入噪声数据,导致信息抽取效果不够理想。因此,提出一种... 详细信息

招投标网站资源中蕴含着丰富的情报信息。“远程监督”方法借助知识库自动标注数据,弥补了传统信息抽取方法在语料准备阶段对人工强依赖的缺陷,可有效提高信息抽取效率。该方法会引入噪声数据,导致信息抽取效果不够理想。因此,提出一种基于因子图模型的远程监督实体关系抽取方法,并结合领域特征,采用知识融合技术提高实体抽取质量,进而针对远程监督的缺陷提出基于负例数据学习的降噪方法。实验结果表明,该方法能够有效减少“噪声”干扰,提高关系抽取性能。

关键词：实体关系抽取远程监督因子图模型知识融合

来源：评论

学校读者我要写书评

暂无评论

稀疏样本下长术语的抽取方法

引用

数据分析与知识发现 2024年第1期8卷 135-145页

作者：吕学强杨雨婷肖刚李育贤游新冬北京信息科技大学网络文化与数字传播北京市重点实验室北京100101 中国人民解放军军事科学院系统工程研究院复杂系统仿真总体重点实验室北京100101

【目的】为解决武器装备领域样本稀疏和长术语难以识别的问题,提出头尾指针和主动学习相结合的方法。【方法】首先,使用BERT预训练语言模型得到词向量表示,利用头尾指针网络对长术语进行抽取;然后提出新的主动学习采样策略,在未标注样... 详细信息

【目的】为解决武器装备领域样本稀疏和长术语难以识别的问题,提出头尾指针和主动学习相结合的方法。【方法】首先,使用BERT预训练语言模型得到词向量表示,利用头尾指针网络对长术语进行抽取;然后提出新的主动学习采样策略,在未标注样本上筛选高质量样本不断迭代训练模型,降低模型对数据规模的依赖。【结果】模型针对长术语的抽取效果在F1值上有0.50个百分点的提升,通过引入主动学习后采样,仅大约50%高质量数据即可达到训练100%训练数据相同的F1值。【局限】限于计算能力,本文数据集规模较小;在文本处理阶段新增主动学习采样策略,进行大规模数据计算的时间成本较高。【结论】利用头尾指针和主动学习方法能够有效抽取长术语,同时降低数据标注的成本。

关键词：术语抽取主动学习头尾指针网络 BERT 武器装备

来源：评论

学校读者我要写书评

暂无评论

结合文本自训练和对抗学习的领域自适应工业场景文本检测

引用

中国图象图形学报 2024年第10期29卷 3090-3103页

作者：吕学强权伟杰韩晶陈玉忠才藏太北京信息科技大学网络文化与数字传播北京市重点实验室北京100101 青海师范大学省部共建藏语智能信息处理及应用国家重点实验室西宁810008

目的快速检测工业场景中的文本,可以提高生产效率、降低成本,然而数据的标注耗时耗力,鲜有标注信息可用,针对目前方法在应用到工业数据时存在伪标签质量低和域差距较大等问题,本文提出了一种结合文本自训练和对抗学习的领域自适应工业... 详细信息

目的快速检测工业场景中的文本,可以提高生产效率、降低成本,然而数据的标注耗时耗力,鲜有标注信息可用,针对目前方法在应用到工业数据时存在伪标签质量低和域差距较大等问题,本文提出了一种结合文本自训练和对抗学习的领域自适应工业场景文本检测方法。方法首先,针对伪标签质量低的问题,采用教师学生框架进行文本自训练。教师和学生模型应用数据增强和相互学习缓解域偏移,提高伪标签的质量;其次,针对域差距,提出图像级和实例级对抗学习模块来对齐源域和目标域的特征分布,使网络学习域不变特征;最后,在两个对抗学习模块之间使用一致性正则化进一步缓解域差距,提高模型的域适应能力。结果实验证明,本文的方法在工业铭牌数据集的精确率、召回率和F1值分别达到96.2%、95.0%和95.6%,较基线模型分别提高了10%、15.3%和12.8%。同时在ICDAR15和MSRA-TD500数据集上也表现出良好性能,与当前先进的方法相比,F1值分别提高0.9%和3.1%。此外,本文的方法在应用到EAST(efficient and accurate scene text detector)文本检测模型后,铭牌数据集的各指标分别提升5%,11.8%和9.5%。结论本文提出的方法成功缓解了源域与目标域数据之间的差距,显著提高了模型的泛化能力,并且具有良好的通用性,同时模型推理阶段不会增加计算成本。

关键词：场景文本检测领域自适应文本自训练特征对抗学习一致性正则化

来源：评论

学校读者我要写书评

暂无评论

基于改进SEIR模型的网络舆情传播研究

引用

计算机仿真 2023年第5期40卷 333-340页

作者：梁冉徐雅斌北京信息科技大学网络文化与数字传播北京市重点实验室北京100101 北京信息科技大学计算机学院北京100101

为了探究网络舆情传播过程中的影响因素,准确的掌握社交网络中舆情传播的内在规律。在传染病模型SEIR的基础上提出了动态情感冲突理论,基于BA无标度网络探究了多层级用户之间的情感冲突、情感共鸣现象对于舆情交叉传播的影响,并考虑到... 详细信息

为了探究网络舆情传播过程中的影响因素,准确的掌握社交网络中舆情传播的内在规律。在传染病模型SEIR的基础上提出了动态情感冲突理论,基于BA无标度网络探究了多层级用户之间的情感冲突、情感共鸣现象对于舆情交叉传播的影响,并考虑到个体记忆效应以及遗忘效应的差异,将提出的干扰因子引入艾宾浩斯遗忘曲线,构建了情感因素与改进后遗忘机制共存的EF-SEIR舆情传播模型。仿真结果表明,提出的EF-SEIR模型充分考虑了舆情传播主体间情感的相互转化、交叉感染现象,引入改进后的艾宾浩斯遗忘机制可以有效描述遗忘与遗忘干扰因子双重刺激下舆情传播的适度波动。研究结果为更好地分析舆情的传播机理提供了新思路,对舆情管控具有重要意义和实用价值。

关键词：舆情传播传播动力学动态情绪感染遗忘机制

来源：评论

学校读者我要写书评

暂无评论

一种使用CPN的恶意软件行为可视化自动生成方法

引用

小型微型计算机系统 2019年第8期40卷 1695-1701页

作者：曹宏盛焦健陈昕刘其源北京信息科技大学网络文化与数字传播北京市重点实验室北京100101 北京信息科技大学计算机学院北京100101

目前针对恶意软件行为的研究主要集中在恶意软件识别上,缺乏对恶意软件的行为逻辑以及相关行为所引起的状态变化的可视化描述.本文提出了一种行为可视化自动生成的方法,该方法在目前已有的Android恶意软件行为研究的基础上,给出了Androi... 详细信息

目前针对恶意软件行为的研究主要集中在恶意软件识别上,缺乏对恶意软件的行为逻辑以及相关行为所引起的状态变化的可视化描述.本文提出了一种行为可视化自动生成的方法,该方法在目前已有的Android恶意软件行为研究的基础上,给出了Android恶意软件的行为模型,并利用颜色Petri网(CPN)理论生成相应的可视化文件.本文最后使用现有的恶意软件测试集合进行了实验,使用CPN Tools软件对恶意软件行为进行仿真,并将仿真实验结果与在线检测结果比较,验证了本文可视化自动生成方法的可行性.

关键词： Android 恶意软件有色petri网行为模型可视化

来源：评论

学校读者我要写书评

暂无评论

基于遗传算法的函数级别软件错误定位

引用

计算机工程与应用 2020年第22期56卷 66-73页

作者：黄晴雁牟永敏崔展齐张志华北京信息科技大学计算机学院北京100101 北京信息科技大学网络文化与数字传播北京市重点实验室北京100101

针对软件开发过程中的错误定位问题,提出一种以函数调用路径和遗传算法为基础的软件错误定位方法FGAFL。将软件测试中的错误定位问题转化为组合优化问题,结合函数调用路径对错误定位的影响构建适应度函数。通过遗传算法在候选种群中迭... 详细信息

针对软件开发过程中的错误定位问题,提出一种以函数调用路径和遗传算法为基础的软件错误定位方法FGAFL。将软件测试中的错误定位问题转化为组合优化问题,结合函数调用路径对错误定位的影响构建适应度函数。通过遗传算法在候选种群中迭代搜索具有较高可疑度的候选错误分布,得到最优解。根据最优解对程序中的函数按可疑度进行排序,依次检查函数并定位错误的具体位置。实验表明,FGAFL方法可以有效降低运算量并缩减代码审查的范围,提高错误定位的精度和效率。

关键词：错误定位函数调用路径遗传算法适应度函数

来源：评论

学校读者我要写书评

暂无评论

面向版权授权交易的区块链共识机制

引用

计算机工程与设计 2022年第7期43卷 1825-1831页

作者：李一帆徐雅斌刘欣然北京信息科技大学网络文化与数字传播北京市重点实验室北京100101 北京信息科技大学计算机学院北京100101

为实现安全高效的版权授权交易,使原创版权作品得到有效保护。针对区块链技术中的共识机制加以改进,提出一种适应可信版权登记与授权交易场景的DPOS共识机制改进方法。基于信用值和币龄进行设计,采用CES生产函数模型对节点可信程度进行... 详细信息

为实现安全高效的版权授权交易,使原创版权作品得到有效保护。针对区块链技术中的共识机制加以改进,提出一种适应可信版权登记与授权交易场景的DPOS共识机制改进方法。基于信用值和币龄进行设计,采用CES生产函数模型对节点可信程度进行衡量,减少作恶节点当选代表节点的概率;通过基于混合同余算法的随机出块策略和新型区块合法性验证策略,实现区块可信的产生与验证过程,增强共识算法安全性;增加基于出块时间的信用值奖惩机制,增大网络带宽与节点性能更好的节点成为出块节点的概率,提升系统效率。实验结果表明,改进方案可以全面提升区块链系统的安全性和效率,有效应用在版权交易领域,实现可信的版权授权交易。

关键词：区块链 DPOS机制共识机制奖惩机制版权授权交易

来源：评论

学校读者我要写书评

暂无评论

基于本体的文档互操作度量模型

引用

计算机工程与设计 2014年第10期35卷 3467-3471,3573页

作者：侯霞李宁梁琦北京信息科技大学计算机学院北京100101 北京信息科技大学网络文化与数字传播北京市重点实验室北京100101

为客观、自动化地评价各种文档在不同情况下实际达到的互操作能力,提出利用本体技术建立文档互操作性度量模型。在准确、形式化地描述文档概念及其关联的基础上,综合考虑各种影响互操作性的度量因素,通过度量函数对不同文档系统间的互... 详细信息

为客观、自动化地评价各种文档在不同情况下实际达到的互操作能力,提出利用本体技术建立文档互操作性度量模型。在准确、形式化地描述文档概念及其关联的基础上,综合考虑各种影响互操作性的度量因素,通过度量函数对不同文档系统间的互操作性进行计算,通过量化的结果为互操作性测评提供客观依据。基于本体的形式化描述,实现了一个面向办公文档领域的原型系统以自动化地进行文档互操作性度量,验证了度量模型构建方法的有效性和模型的实用性。

关键词：互操作性文档本体度量模型主题图

来源：评论

学校读者我要写书评

暂无评论

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

限定检索结果

文献类型

馆藏范围

日期分布

学科分类号

主题

机构

作者

语言

请选择保存的检索档案：

请选择收藏分类：

通借通还

建议与咨询 留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

限定检索结果

文献类型

馆藏范围

日期分布

学科分类号

主题

机构

作者

语言

请选择保存的检索档案： 新增检索档案 确定 取消

请选择收藏分类： 新增自定义分类 确定 取消

通借通还

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

请选择保存的检索档案：

请选择收藏分类：