检索结果-内蒙古大学图书馆

中国激光 2024年第21期51卷 19-34页

作者：吴曈胡浩基冯洋罗琼徐栋郑伟增金能杨琛姚劲草浙江大学伊利诺伊大学厄巴纳香槟校区联合学院浙江杭州314400 浙江大学信息与电子工程学院浙江杭州310027 上海时代天使医疗器械有限公司天使研究院上海200433 浙江大学医学院附属妇产科医院产科浙江杭州310006 浙江省肿瘤医院浙江杭州331022 中国科学院杭州医学研究所浙江杭州310000 浙江大学医学院附属妇产科放射科浙江杭州310006

医学图像分割是计算机辅助医疗流程中的关键步骤,精准的医学图像分割可以为诊断与治疗提供帮助。分割一切模型(SAM)利用提示驱动的基础大模型进行下游的分割任务,它的出现为医学图像分割提出了与神经网络不同的新方向。但是,SAM是以自... 详细信息

医学图像分割是计算机辅助医疗流程中的关键步骤,精准的医学图像分割可以为诊断与治疗提供帮助。分割一切模型(SAM)利用提示驱动的基础大模型进行下游的分割任务,它的出现为医学图像分割提出了与神经网络不同的新方向。但是,SAM是以自然图像为基础的模型,对医学图像的处理效果还有待提高。本文介绍了SAM在医学图像上直接应用的效果,并总结了将SAM应用到医学图像分割任务的研究工作。与此同时,介绍了本课题组在乳腺肿瘤数据集与孕妇骨盆数据集上进行的两个实验,验证了大模型经过大量数据微调后具有更好的泛化能力。半监督网络与SAM结合生成高质量的伪标签能够有效提高分割效果。虽然目前SAM在医学图像分割领域已取得较好效果,但进一步提升存在一定困难。本文最后分析了SAM面临的挑战并讨论了SAM在医学图像分割中的潜在发展方向,希望有助于医疗分割技术的进步。

关键词：分割一切模型医学图像分割基础模型深度学习

来源：评论

学校读者我要写书评

暂无评论

基于分割一切模型SAM的实景三维场景语义分割

引用

测绘通报 2024年第12期 101-105页

作者：李锋薛梅詹勇杨元重庆市测绘科学技术研究院重庆401120 自然资源部智能城市时空信息与装备工程技术创新中心重庆401120 重庆市勘测院智能城市空间技术创新中心重庆401120

基于深度学习和计算机视觉技术的场景语义分割是当前研究的热点。本文提出了包含“场景输入—预处理—模型推断—语义分割”的实景三维场景语义分割框架,通过将实景三维场景作为输入,按照正交投影的方式转为多视图二维图像,开展分割推理... 详细信息

基于深度学习和计算机视觉技术的场景语义分割是当前研究的热点。本文提出了包含“场景输入—预处理—模型推断—语义分割”的实景三维场景语义分割框架,通过将实景三维场景作为输入,按照正交投影的方式转为多视图二维图像,开展分割推理,获得分割掩码并进行处理,实现了实景三维对象拣选、单体化、语义化处理。试验结果表明,本文方法具有较好的语义分割效果和运行效率。

关键词：分割一切模型实景三维语义分割

来源：评论

学校读者我要写书评

暂无评论

聚焦式学习分割一切提示的无监督视频目标分割

引用

计算机工程与科学 2025年第2期47卷 298-307页

作者：沈勇辉卜东旭张胜裕宋慧慧南京信息工程大学自动化学院江苏南京210044 江苏省大数据分析技术重点实验室江苏南京210044 大气环境与装备技术协同创新中心江苏南京210044

无监督视频目标分割旨在测试阶段自动定位和分割视频帧中的主要目标。目前,大多数模型、方法依赖于从RGB图提取的外观线索和从光流图提取的运动线索来进行目标分割。然而,目标遮挡、快速运动或静止等问题会导致光流获取的信息缺失,仅依... 详细信息

无监督视频目标分割旨在测试阶段自动定位和分割视频帧中的主要目标。目前,大多数模型、方法依赖于从RGB图提取的外观线索和从光流图提取的运动线索来进行目标分割。然而,目标遮挡、快速运动或静止等问题会导致光流获取的信息缺失,仅依靠外观分支获取的有限信息难以实现良好的分割效果。为了解决这一问题,提出了一种聚焦式学习网络模型FPLNet,该模型引入额外的双分支结构以捕捉主要目标的位置信息和轮廓信息,从而弥补光流信息的缺失。首先,所提出的模型利用分割一切模型SAM的骨干网络提取外观和运动信息,从而提高模型的泛化性。然后,将额外引入的粗粒度和细粒度的2个分割分支共同作为聚焦式学习网络的提示部分。在解码部分,RGB外观信息、光流运动信息、粗粒度特征和细粒度特征逐步融合,以此模仿人类视觉系统,实现聚焦式学习目标特征的过程。在3个标准数据集上进行了大量的测试,实验结果表明,与现有的模型相比,所提出的模型拥有更优异的性能。

关键词：无监督视频目标分割聚焦式学习分割一切模型

来源：评论

学校读者我要写书评

暂无评论

文本语义引导的自动动态场景新视角渲染方法

引用

华中科技大学学报(自然科学版) 2025年第3期53卷 8-13页

作者：林玉萍李胜鹏田丰瑞西安交通大学外国语学院西安交通大学人工智能学院

提出一种基于文本先验引导的动态场景新视角渲染方法，以动态前景内容的文本信息作为语义先验引导分割模型自动生成高质量的前背景掩码，进而在无须人工标注情况下实现动态场景的新视角渲染．具体而言，模型首先利用Grounding DINO实现... 详细信息

提出一种基于文本先验引导的动态场景新视角渲染方法，以动态前景内容的文本信息作为语义先验引导分割模型自动生成高质量的前背景掩码，进而在无须人工标注情况下实现动态场景的新视角渲染．具体而言，模型首先利用Grounding DINO实现文本提示到边界框提示的转换，然后用基于原图和边界框提示的分割一切模型(SAM)实现动态前景掩码的自动生成，最后构建基于动态前景掩码的动态神经辐射场实现动态场景下新视角的自动渲染．在Nvidia Dynamic Scene数据集上验证了本文方法的有效性．在主观对比实验中，本文方法在新视角下相较其他方法而言利用语义引导的先验知识成功渲染出了更为清晰的动态前景与静态背景．在客观对比实验中，本文方法在峰值信噪比(PSNR)、结构相似性(SSIM)、学习感知图像块相似度(LPIPS)三种衡量图像生成质量的指标上均优于其他最先进的方法．

关键词：新视角渲染动态场景文本引导分割一切模型掩码自动生成

来源：评论

学校读者我要写书评

暂无评论

场景结构知识增强的协同显著性目标检测

引用

计算机工程 2025年第1期51卷 31-41页

作者：胡升龙陈彬张开华宋慧慧南京信息工程大学自动化学院江苏南京210044

现有的协同显著性目标检测(CoSOD)方法通过挖掘组内一致性与组间差异性来学习判别性表征,这种范式因缺乏语义标签的引导导致所学表征的判别性受限,难以应对复杂的非协同目标的干扰。为了解决这一问题,提出一种新的场景结构知识增强的Co... 详细信息

现有的协同显著性目标检测(CoSOD)方法通过挖掘组内一致性与组间差异性来学习判别性表征,这种范式因缺乏语义标签的引导导致所学表征的判别性受限,难以应对复杂的非协同目标的干扰。为了解决这一问题,提出一种新的场景结构知识增强的CoSOD模型SSKNet。SSKNet利用大模型mPlug构建目标间场景结构语义关系并通过分割一切模型(SAM)将这种结构语义关系转移到最终的协同显著性结果中。具体来说:首先,为了学习语义知识,引入图像场景理解大模型,对图像组中的图像进行理解,并得到表示结构语义的文本描述组,这些文本描述组以文本的形式描述图像的显著内容;接着,为了获取协同显著信息,设计协同提示提取(CoPE)模块,通过在一组描述文本中使用协同注意力机制获取协同显著文本;最后,为了将协同显著文本转化为协同显著掩码,引入SAM,将协同显著文本以文本提示的方式引导SAM分割协同显著目标,获取最终的协同显著检测掩码。在3个公开数据集CoSal2015、CoCA和CoSOD3k上的实验结果表明,SSKNet模型的综合评估指标Fβ的取值分别为0.910、0.750和0.887,达到了先进水平。

关键词：场景结构知识大模型分割一切模型协同显著性目标检测深度学习

来源：评论

学校读者我要写书评

暂无评论

基于语义分割数据增强与可变形卷积的输变电线路缺陷检测

引用

四川电力技术 2025年第1期48卷 32-40,84页

作者：王译萱向思屿梁晖辉邝俊威张菊玲刘松嘉国网四川省电力公司电力科学研究院四川成都610041 电力物联网四川省重点实验室四川成都610041 华北电力大学计算机系河北保定071003 国网四川省电力公司泸州供电公司四川泸州646000 国网四川省电力公司自贡供电公司四川自贡643000

为提高输变电线路在长期运行和自然环境影响下产生的各类缺陷的检测精度和效率,提出了基于YOLOv8和可变形卷积的改进算法。针对各类缺陷样本数量差距较大导致的长尾分布问题,提出使用分割一切模型对数据进行扩充以提高数据平衡性;在主... 详细信息

为提高输变电线路在长期运行和自然环境影响下产生的各类缺陷的检测精度和效率,提出了基于YOLOv8和可变形卷积的改进算法。针对各类缺陷样本数量差距较大导致的长尾分布问题,提出使用分割一切模型对数据进行扩充以提高数据平衡性;在主干网络中引入DCNv2结构,通过动态调整卷积核的形状适应各类样本包含的特征以提高泛化能力,并结合multi-CA注意力机制使网络注重各通道的融合信息;使用损失函数WIoU引导模型学习,以适应不同质量的锚框。将改进的算法与其他算法进行比较,结果表明改进算法增加了对输变电缺陷检测的精度。

关键词： DCNv2 YOLOv8 分割一切模型 WIoU multi-CA

来源：评论

学校读者我要写书评

暂无评论

基于MSC-LSAM的多尺度交叉超声医学图像分割方法

引用

数据采集与处理 2025年第2期40卷 469-484页

作者：王朝欣杨汶汶戎泽李铮昱王行马磊南通大学信息科学技术学院南通226019

脑卒中是全球范围内致死致残率最高的疾病之一,颈动脉狭窄和心脏病变是缺血性脑卒中的重要致病因素。超声(Ultrasound,US)是检查由颈动脉狭窄和心脏病变引起的缺血性脑卒中的常用影像学手段,但超声图像噪声多、边界模糊,具有较高的分割... 详细信息

脑卒中是全球范围内致死致残率最高的疾病之一,颈动脉狭窄和心脏病变是缺血性脑卒中的重要致病因素。超声(Ultrasound,US)是检查由颈动脉狭窄和心脏病变引起的缺血性脑卒中的常用影像学手段,但超声图像噪声多、边界模糊,具有较高的分割难度。本文提出MSC⁃LSAM算法,一种多尺度交叉的双编码器超声图像分割网络,旨在实现颈动脉腔体和心脏腔体的快速、准确分割,辅助医生完成疾病诊断。MSC⁃LSAM在编码器部分并行了分割一切模型(Segment anything model,SAM)的视觉编码器和UNet编码器,在解码器部分采用UNet解码器。本研究首先冻结了预训练的SAM视觉编码器,并在Transformer层中引入高效的适配器(Adapter)块,被称可学习的分割一切模型(Learnable SAM,LSAM)。LSAM在拥有较低参数量的同时,保留学习能力和高度泛化性。然后,在UNet全局网络引入多尺度交叉注意力(Multi⁃scale cross⁃axial attention,MCA),实现多尺度特征的交叉融合,有效提升边缘分割能力,抑制模型过拟合。最后,通过高效通道注意力(Efficient channel attention,ECA)实现双编码器多尺度特征的高效融合,减少模型误分割。结果表明,本研究提出的MSC⁃LSAM在心脏超声公开数据集CAMUS和颈动脉超声自建数据集CAUS上均取得了良好的效果。CAMUS的两心腔(2CH)和四心腔(4CH)数据集分割的平均Dice相似系数(Dice similarity coefficient,DSC)分别达到0.927和0.934;CAUS数据集的平均DSC达到0.917。MSC⁃LSAM在颈动脉腔体和心脏腔体超声图像分割任务上获得了良好的分割准确度,高于主流分割算法,具有良好的应用前景。

关键词：缺血性脑卒中超声图像分割分割一切模型多尺度交叉注意力高效通道注意力

来源：评论

学校读者我要写书评

暂无评论

融合局部多尺度特征编码器的SAM医学图像分割模型(英文)

引用

Journal of Measurement Science and Instrumentation 2024年

作者：邸敬朱云龙梁婵兰州交通大学电子与信息工程学院

尽管分割一切模型(SAM)在自然图像分割任务上表现出色，但它缺乏针对医学影像领域的特定专业知识，并且在编码阶段存在局部多尺度信息丢失的问题。本文提出了一种融合局部多尺度特征编码器的SAM医学图像分割模型LMSFE-SAM去处理上述问... 详细信息

尽管分割一切模型(SAM)在自然图像分割任务上表现出色，但它缺乏针对医学影像领域的特定专业知识，并且在编码阶段存在局部多尺度信息丢失的问题。本文提出了一种融合局部多尺度特征编码器的SAM医学图像分割模型LMSFE-SAM去处理上述问题。首先，在分割一切模型的基础上，引入了一种局部多尺度特征编码器，提升对局部感受野特征的表达能力，为SAM中的Vision Transformer分支提供图像的局部多尺度上下文信息。同时，以轻量级的方式，在局部多尺度特征编码器中加入了多轴Hadamard积模块(GMHP)，减少了平方复杂度问题和噪声干扰。接着，设计了一种跨分支平衡适配器，用于平衡局部多尺度特征编码器与SAM中Vision Transformer图像编码器的局部和全局信息。最后，为减少输入大小并避免重叠补丁嵌入，将输入图像的尺寸从1024×1024像素缩小到256×256像素，并构建了包含特征适配器、位置适配器和通道-空间适配器的多维度信息适配组件，将小尺寸医学图像信息融入SAM中，从而更有利于临床应用。通过与其他8种具有代表性的图像分割模型进行对比，本文所提出的模型在BUSI、DDTI和TN3K三个数据集上的6项客观评价指标上平均提升了3.872%至31.91%，显著优化了分割一切模型在医学图像中的表现，为临床医生提供了有力的辅助诊断工具。

关键词：分割一切模型医学图像分割编码器解码器多轴Hadamard积模块适配器

来源：评论

学校读者我要写书评

暂无评论

基于伪标签去噪和SAM优化的大规模无监督语义分割

引用

电子学报 2024年

作者：杨维静徐瑞顾浩文陈涛舒祥波姚亚洲南京理工大学计算机与工程学院

语义分割技术能够对复杂、多元的场景实现细粒度理解，是促进无人系统高效、智能工作的关键技术之一.大规模无监督语义分割旨在从大规模未标记图像中学习语义分割能力.然而，现有方法由于自学习伪标签存在类别混淆和形状表示欠佳的问题... 详细信息

语义分割技术能够对复杂、多元的场景实现细粒度理解，是促进无人系统高效、智能工作的关键技术之一.大规模无监督语义分割旨在从大规模未标记图像中学习语义分割能力.然而，现有方法由于自学习伪标签存在类别混淆和形状表示欠佳的问题，导致最终分割精度较低.为此，本文提出一种伪标签去噪和SAM优化（Pseudo-label Denoising and SAM Optimization,PDSO）方法以解决大规模无监督语义分割问题.本文设计了一种基于去噪的特征微调模块，在基于小损失准则从大规模数据集中筛选出具有干净图像级伪标签的潜在样本后，利用这些干净样本对预训练的主干网络进行微调，使网络获得更稳健的类别表示.为了进一步减少伪标签中的类别噪声，设计了一种基于聚类的样本去噪模块，根据类别占比和样本与聚类中心之间的距离来去除干扰聚类任务的噪声样本，从而提升聚类性能.本文还设计了一种SAM提示优化模块，根据聚类距离识别出图像中的活跃类别，以过滤噪声目标，并将点和框作为SAM的目标提示信息，生成预期的目标掩膜以细化伪标签中目标的边缘.实验结果表明，在大规模语义分割数据集ImageNet-S50、ImageNet-S300和ImageNet-S919的测试集上，本文方法在平均交并比指标上分别达到了45.0%、26.6%和14.5%，显著提高了分割目标的类别准确率和边缘精度.

关键词：大规模无监督语义分割图像级去噪分割一切模型伪标签聚类

来源：评论

学校读者我要写书评

暂无评论

密集粒子实例分割算法研究

密集粒子实例分割算法研究

引用

作者：方庭婧浙江大学

学位级别：硕士

粒子分析是指对粒子从形态、数量、种类等方面进行分析。通过粒子分析可以了解粒子的性质和特点,在材料科学、生物医学等领域都有广泛的应用。当前粒子分析主要手段是采集粒子图像进行分析,粒子图像的准确检测和分割是其分析流程的重要... 详细信息

粒子分析是指对粒子从形态、数量、种类等方面进行分析。通过粒子分析可以了解粒子的性质和特点,在材料科学、生物医学等领域都有广泛的应用。当前粒子分析主要手段是采集粒子图像进行分析,粒子图像的准确检测和分割是其分析流程的重要组成部分。但在粒子图像中,存在待分割目标形状不规则且高度密集分布的情况。同时,粒子的分割显著地受到相邻粒子影响,且尺寸大小不均的粒子进一步增加了粒子分割的难度。基于深度学习的算法具有高效学习图像特征的能力,在计算机视觉领域有着广泛应用。但现有的基于深度学习的粒子分割算法存在局限性,如图像特征信息利用不足、边缘信息没有得到有效增强、模型性能受限于数据集规模等。本文工作针对粒子图像分析任务的难点和现有方法的不足,围绕基于密集粒子实例分割算法展开。本文主要工作内容与创新点如下: 第一,针对粒子图像中目标高度密集分布且形状不规则以及相互粘连的问题,本文提出了基于归一化距离变换和小波变换的多尺度特征融合网络。本文方法以分水岭算法作为主分割框架,使用粒子内部注水点回归和外部轮廓预测来辅助完成分割算法。针对轮廓预测部分,在下采样阶段用基于小波变换的下采样模块代替最大池化,减少信息的损失。本算法还引入了融合结构的边缘检测网络,使用多层特征融合的方式来增强模型对边缘的学习效果。针对注水点预测部分,算法采用归一化距离变换回归。与现有算法相比,该算法能有效区别粘连粒子和分割不同形态粒子。最终算法在自建数据集UC5115上取得AJI指标0.7105的成绩,优于现有算法性能,性能提升在1%～13%;在Monuseg数据集上取得AJI指标0.6314成绩,与现有算法相当。第二,针对密集粒子数据集稀少、标注成本高的问题,本文提出了一种基于分割一切模型(Segment Anything Model,SAM)的少样本粒子分割算法。本算法同时使用视觉大模型图像编码器和提出的粒子分割网络编码器输出特征,经融合后用于模型解码,获得边缘轮廓预测和粒子距离变换回归,再经分水岭算法后完成分割。在图像预处理前,采用基于图像代表性的数据筛选方法,通过将图像输入特征提取网络获取特征向量,接着经过计算挑选出适合用于训练的样本。在模型结构方面将带预训练权重的大模型图像编码器与粒子分割网络的图像编码器提取特征进行融合,后输入解码器用于分支预测。在密集粒子图像数据集中进行的实验表明,该方法在数据量较少的情况下,性能损失最少,优于现有方法。算法最终在只使用一张图像训练的情况下在自建粒子数据集UC5115上达到了AJI指标0.6145的成绩,较其他最好方法性能提升6%。

关键词：粒子分析实例分割分水岭算法特征融合距离变换分割一切模型

来源：评论

学校读者我要写书评

暂无评论

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

限定检索结果

文献类型

馆藏范围

日期分布

学科分类号

主题

机构

作者

语言

请选择保存的检索档案：

请选择收藏分类：

通借通还

建议与咨询 留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

限定检索结果

文献类型

馆藏范围

日期分布

学科分类号

主题

机构

作者

语言

请选择保存的检索档案： 新增检索档案 确定 取消

请选择收藏分类： 新增自定义分类 确定 取消

通借通还

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

请选择保存的检索档案：

请选择收藏分类：