检索结果-内蒙古大学图书馆

中文信息学报 2022年第3期36卷 109-119页

作者：向军毅胡慧君刘茂福毛瑞彬武汉科技大学计算机科学与技术学院湖北武汉430065 智能信息处理与实时工业系统湖北省重点实验室湖北武汉430065 武汉大学信息资源研究中心湖北武汉430072

目前的搜索引擎仍然存在“重形式,轻语义”的问题,无法做到对搜索关键词和文本的深层次语义理解,因此语义检索成为当前搜索引擎中亟需解决的问题。为了提高搜索引擎的语义理解能力,该文提出一种语义相关度的计算方法。首先,标注了金融... 详细信息

目前的搜索引擎仍然存在“重形式,轻语义”的问题,无法做到对搜索关键词和文本的深层次语义理解,因此语义检索成为当前搜索引擎中亟需解决的问题。为了提高搜索引擎的语义理解能力,该文提出一种语义相关度的计算方法。首先,标注了金融类新闻标题实体与新闻正文语义相关度语料1万条,然后建立新闻实体与正文语义相关度计算的BERTCA(Bidirectional Encoder Representation from Transformers Co-Attention)模型,通过使用BERT预训练模型,综合考虑细粒度的实体和粗粒度的正文的语义信息,然后经过协同注意力,实现实体与正文的语义匹配,不仅能计算出金融新闻实体与新闻正文之间的相关度,还能根据相关度阈值来判定相关度类别,实验表明该模型在1万条标注语料上准确率超过95%,优于目前主流模型,最后通过具体搜索示例展示了该模型的优秀性能。

关键词：语义相关度计算 BERT模型协同注意力机制

来源：评论

学校读者我要写书评

暂无评论

基于邻接表存储与哈希表的频繁项集挖掘算法

引用

计算机应用与软件 2023年第7期40卷 266-273页

作者：吴昊刘钊顾进广武汉科技大学计算机科学与技术学院湖北武汉430065 武汉科技大学大数据科学与工程研究院湖北武汉430065 湖北省智能信息处理与实时工业系统重点实验室湖北武汉430065

针对Apriori算法从数据中挖掘频繁项集的计算时间效率较低和空间内存占用较高的问题提出一种ATSAHT-Apriori(Adjacency Table Storage and Hash Table-Apriori)算法。该算法利用哈希表来存储数据,极大地提高了项集支持度频数的计算效率... 详细信息

针对Apriori算法从数据中挖掘频繁项集的计算时间效率较低和空间内存占用较高的问题提出一种ATSAHT-Apriori(Adjacency Table Storage and Hash Table-Apriori)算法。该算法利用哈希表来存储数据,极大地提高了项集支持度频数的计算效率,结合图存储的思想利用邻接表来存储候选项集,极大地优化了内存空间占用,同时将候选项集构建大根堆,通过堆排序的思想与动态剪枝算法思想优化了频繁项集的计算速度和候选项集存储的内存空间,有效地优化了传统Apriori算法的计算时间效率和内存空间占用方面的不足。一系列对比实验表明,ATSAHT-Apriori算法在时间效率和空间效率都有一定的提高。

关键词：时间复杂度空间复杂度动态剪枝哈希表存储邻接表存储

来源：评论

学校读者我要写书评

暂无评论

基于双向特征金字塔的密集视频描述生成方法

引用

中国科技论文 2024年第2期19卷 200-208页

作者：张煜杨刘茂福武汉科技大学计算机科学与技术学院武汉430065 智能信息处理与实时工业系统湖北省重点实验室(武汉科技大学) 武汉430081

针对当前方法普遍存在较为严重的细节结构信息丢失与事件间重叠的问题,提出一种基于双向特征金字塔的密集视频描述生成方法(dense video captioning with bilateral feature pyramid net,BFPVC)。BFPVC通过带有自底向上、自顶向下、横... 详细信息

针对当前方法普遍存在较为严重的细节结构信息丢失与事件间重叠的问题,提出一种基于双向特征金字塔的密集视频描述生成方法(dense video captioning with bilateral feature pyramid net,BFPVC)。BFPVC通过带有自底向上、自顶向下、横向链接3条分支的双向特征金字塔强化视频多尺度特征图,兼顾对时序信息、空间信息、语义信息的特征表示,解码器从强化后的视频特征中捕获更加全面的事件候选集,从而为对应的视频事件生成更加丰富、详尽的文本描述。在ActivityNet Captions数据集和YouCook2数据集上的实验结果表明,BFPVC与同类模型相比生成的文本描述更详细、丰富,验证了双向特征金字塔在密集视频描述领域的有效性。

关键词：密集视频描述视频描述视频理解特征金字塔自然语言处理

来源：评论

学校读者我要写书评

暂无评论

格式化约束的时间戳文字识别网络

引用

计算机工程与应用 2022年第24期58卷 189-195页

作者：刘洋陈黎武汉科技大学计算机科学与技术学院武汉430065 武汉科技大学智能信息处理与实时工业系统湖北省重点实验室武汉430065

文字识别是深度学习网络的重要应用领域,主流算法基于光学信息预测自然场景文字。然而在一些特定领域的文本对象上,额外的关键特征将会进一步提高文字识别算法的准确性。在安防监控领域,画面中的时间戳文本拥有格式规范、限定数值范围... 详细信息

文字识别是深度学习网络的重要应用领域,主流算法基于光学信息预测自然场景文字。然而在一些特定领域的文本对象上,额外的关键特征将会进一步提高文字识别算法的准确性。在安防监控领域,画面中的时间戳文本拥有格式规范、限定数值范围等特点,根据这一特点,对时间戳文本识别网络进行了研究,提出一种时间戳信息约束机制,融合文本语义约束信息和光学特征达到识别规范文本的效果,增强输出时间戳文本的格式规范性和数值合理性。在全匹配率、编辑距离等标准上全面超过基于光学特征的经典文字识别算法。

关键词：文字识别图像语义信息智能监控时间戳文本格式化文本识别

来源：评论

学校读者我要写书评

暂无评论

基于查询语义和NI-LPA的知识图谱划分研究

引用

计算机与数字工程 2024年第6期52卷 1727-1732,1738页

作者：徐航刘宇武汉科技大学计算机科学与技术学院武汉430065 武汉科技大学智能信息处理与实时工业系统湖北省重点实验室武汉430065

当前未考虑语义知识的图谱划分方法会导致知识图谱划分后查询通信量增大、查询执行效率降低。鉴于常用查询语句中的语义知识可用于聚合关联度高的子图结构,且NI-LPA(Node Importance-Label Propagation Algorithm)具有支持多标签、时间... 详细信息

当前未考虑语义知识的图谱划分方法会导致知识图谱划分后查询通信量增大、查询执行效率降低。鉴于常用查询语句中的语义知识可用于聚合关联度高的子图结构,且NI-LPA(Node Importance-Label Propagation Algorithm)具有支持多标签、时间复杂度低和划分质量高的特点,提出了基于查询语义和NI-LPA的知识图谱划分方法。该方法对常用SPARQL查询集进行语义分析,利用分析结果计算知识图谱中节点间的语义关联度,并将关联度与NI-LPA中代表结构特征的节点重要度相结合,从而得到节点间的传播力度,使重要节点与其语义相关度高的节点更易具有相同的标签。实验结果表明,相较于COPRA和NI-LPA算法,该方法不仅能减少边割率和通信量,而且能在保证冗余度较低的情况下有效地提升查询同区率。

关键词：知识图谱划分多标签传播算法语义通信量查询同区率

来源：评论

学校读者我要写书评

暂无评论

基于图结构特征采样数据摘要的联邦知识图谱查询

引用

计算机工程 2023年第1期49卷 73-81页

作者：高峰李秋顾进广武汉科技大学计算机科学与技术学院武汉430065 湖北省智能信息处理与实时工业系统重点实验室武汉430065 武汉科技大学大数据科学与工程研究院武汉430065 国家新闻出版署富媒体数字出版内容组织与知识服务重点实验室北京100083

联邦SPARQL查询是通过构建查询计划来指导查询执行,数据摘要索引文件捕获了RDF数据集的结构和语义信息,对查询计划生成过程中子查询基数评估至关重要。现有的数据摘要生成方法需要远程遍历每个数据源的完整数据,该过程成本消耗较高,且... 详细信息

联邦SPARQL查询是通过构建查询计划来指导查询执行,数据摘要索引文件捕获了RDF数据集的结构和语义信息,对查询计划生成过程中子查询基数评估至关重要。现有的数据摘要生成方法需要远程遍历每个数据源的完整数据,该过程成本消耗较高,且在大部分环境中联邦查询无法完成对大数据集的统计工作。为在减少数据摘要索引文件生成时间和内存开销的同时捕获尽可能真实的计数信息,考虑主语和谓语的分布偏差,提出利用样图生成原始图近似数据摘要的方法。使用对RDF图出度特征加权的采样方法获取原始图的典型样图,通过改进的映射函数将样图中的信息映射到原始图上,从而生成原始图的近似数据摘要。实验结果表明,该方法相比于基线方法至少节省了70%的数据摘要索引文件生成时间,并且仅采样0.5%的原始图生成的近似数据摘要即可在查询正确率上与基线方法保持高度一致。

关键词：数据摘要数据源索引 RDF图采样联邦查询查询性能

来源：评论

学校读者我要写书评

暂无评论

基于遗传规划和集成学习的恶意软件检测

引用

计算机应用研究 2023年第3期40卷 898-904页

作者：乔梦晴李琳王颉万振华武汉科技大学计算机科学与技术学院武汉430065 武汉科技大学智能信息处理与实时工业系统湖北省重点实验室武汉430065 深圳开源互联网安全技术有限公司广东深圳518000

近年来恶意软件不断地发展变化,导致单一检测模型的准确率较低,使用集成学习组合多种模型可以提高检测效果,但集成模型中基学习器的准确性和多样性难以平衡。为此,提出一种基于遗传规划的集成模型生成方法,遗传规划可以将特征处理和构... 详细信息

近年来恶意软件不断地发展变化,导致单一检测模型的准确率较低,使用集成学习组合多种模型可以提高检测效果,但集成模型中基学习器的准确性和多样性难以平衡。为此,提出一种基于遗传规划的集成模型生成方法,遗传规划可以将特征处理和构建集成模型两个阶段集成到单个程序树中,解决了传统恶意软件集成检测模型难以平衡个体准确率和多样性的问题。该方法以集成模型的恶意软件检出率作为种群进化依据,保证了基学习器的准确性;在构建集成模型时自动选择特征处理方法、分类算法和优化基学习器的超参数,通过输入属性扰动和算法参数扰动增加基学习器的多样性,根据优胜劣汰的思想进化生成具有高准确性和多样性的最优集成模型。在EMBER数据集上的结果表明,最优集成模型的检测准确率达到了98.88%;进一步的分析表明,该方法生成的模型具有较高的多样性和可解释性。

关键词：恶意软件遗传规划集成学习准确性多样性

来源：评论

学校读者我要写书评

暂无评论

基于多任务分支SSD的目标检测算法

引用

计算机工程与设计 2022年第3期43卷 677-684页

作者：洪哲昊陈东方王晓峰武汉科技大学计算机科学与技术学院湖北武汉430065 武汉科技大学智能信息处理与实时工业系统湖北省重点实验室湖北武汉430065

针对原始SSD算法各检测特征层没有关联导致特征融合较差,使得检测效果不佳,而现有改进算法DSSD以及RSSD等检测速度太慢的问题,提出一种基于多任务分支的SSD目标检测算法。对特征金字塔进行研究,构建语义与定位级联模块和融合分裂模块用... 详细信息

针对原始SSD算法各检测特征层没有关联导致特征融合较差,使得检测效果不佳,而现有改进算法DSSD以及RSSD等检测速度太慢的问题,提出一种基于多任务分支的SSD目标检测算法。对特征金字塔进行研究,构建语义与定位级联模块和融合分裂模块用于两个不同分支,在通过两个分支模块之后得到两组多尺度特征,构建多尺度通道聚合模块进行融合和加权,得到最终用于检测的特征金字塔。实验结果表明,在PASCAL VOC 2007数据集上达到79.6%的检测精度,与SSD、DSSD相比具有更好的准确率,检测速度优于DSSD,具有实时检测的能力。

关键词：目标检测特征金字塔多尺度通道聚合分裂融合实时检测

来源：评论

学校读者我要写书评

暂无评论

基于字典的压缩加密查询方案研究

引用

计算机技术与发展 2024年第2期34卷 120-126页

作者：田萍芳郭万涛武汉科技大学计算机科学与技术学院湖北武汉430065 武汉科技大学智能信息处理与实时工业系统湖北省重点实验室湖北武汉430065

RDF(资源描述框架,Resource Description Framework)压缩方案可以有效压缩庞大的RDF数据集,RDF加密方案可以有效提高数据的安全性。结合这两种方案,该文提出了一种基于字典的压缩加密查询方案。首先,通过原始的RDF数据集构建字典集,实... 详细信息

RDF(资源描述框架,Resource Description Framework)压缩方案可以有效压缩庞大的RDF数据集,RDF加密方案可以有效提高数据的安全性。结合这两种方案,该文提出了一种基于字典的压缩加密查询方案。首先,通过原始的RDF数据集构建字典集,实现数据的压缩;然后,通过字典集生成密文ID三元组,实现数据的加密。将字典集存放在可信区域,密文ID三元组存储在不可信区域。查询时,首先通过字典集将查询语句中的关键词转换成对应的密文关键词,然后在密文ID三元组上查询与密文关键词相关的数据,将得到的密文数据传送至可信区域,在可信区域进行解密和解压缩操作,得到最终的明文数据。该方案将查询操作与解密解压缩操作分开,查询只在不可信区域操作,解密解压缩则在可信区域操作,从而进一步提高数据的安全性。最后,在5个数据集上与其他RDF加密方案进行了对比实验,实验结果证明了该压缩加密查询方案在查询性能上有一定的提升,验证了该方案是可行的和有效的。

关键词： RDF压缩 RDF加密字典加密查询资源描述框架

来源：评论

学校读者我要写书评

暂无评论

MedKGGPT:基于知识图谱的医疗大型语言模型设计方法

引用

计算机技术与发展 2024年第6期34卷 178-184页

作者：顾鹏辉李涛高阳武汉科技大学计算机科学与技术学院湖北武汉430065 武汉科技大学智能信息处理与实时工业系统湖北省重点实验室湖北武汉430065

大型语言模型(Large Language Models,LLM)已经成为现今主流的研究热点,而垂直领域行业大模型则成为落地应用的关键点,以医疗为代表的大型语言模型有着可解释性、可靠性、高安全性等要求。针对这类问题,提出MedKGGPT模型,一个基于ChatGL... 详细信息

大型语言模型(Large Language Models,LLM)已经成为现今主流的研究热点,而垂直领域行业大模型则成为落地应用的关键点,以医疗为代表的大型语言模型有着可解释性、可靠性、高安全性等要求。针对这类问题,提出MedKGGPT模型,一个基于ChatGLM的模型,并提出一种面向医疗领域的知识图谱(Knowledge Graphs,KGs)和LLM相结合的框架。框架主要包含两个部分:首先,通过KG三元组中的实体和关系,提出了一种基于KG结构数据的提示工程方法,使得LLM更加具有医学领域的专用知识,提高LLM的可解释性;其次,提出一种利用KG来对齐LLM的方法,将LLM的输出与KG的相关知识进行比较,验证LLM输出结果的一致性和准确性,从而增强了LLM在医疗领域的安全性。实验结果表明,最终生成的MedKGGPT模型能够输出更加具有安全性的结果,说明KG能够有效增强LLM的可解释性,为LLM应用在医疗领域提供了帮助。

关键词：大型语言模型医疗知识图谱提示工程 ChatGLM

来源：评论

学校读者我要写书评

暂无评论

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

限定检索结果

文献类型

馆藏范围

日期分布

学科分类号

主题

机构

作者

语言

请选择保存的检索档案：

请选择收藏分类：

通借通还

建议与咨询 留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

限定检索结果

文献类型

馆藏范围

日期分布

学科分类号

主题

机构

作者

语言

请选择保存的检索档案： 新增检索档案 确定 取消

请选择收藏分类： 新增自定义分类 确定 取消

通借通还

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

请选择保存的检索档案：

请选择收藏分类：