咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于YOLOv5的口吃类型检测研究 收藏

基于YOLOv5的口吃类型检测研究

Research on stuttering type detection based on YOLOv5

作     者:程振 贾嘉敏 蒋作 王欣 CHENG Zhen;JIA Jia-min;JIANG Zuo;WANG Xin

作者机构:云南民族大学电气信息工程学院云南昆明650500 云南民族大学数学与计算机科学学院云南昆明650500 

出 版 物:《云南民族大学学报(自然科学版)》 (Journal of Yunnan Minzu University:Natural Sciences Edition)

年 卷 期:2025年第34卷第1期

页      面:84-92页

学科分类:0711[理学-系统科学] 07[理学] 

基  金:国家自然科学基金(61866040) 

主  题:YOLOv5 口吃识别 语谱图 目标检测 

摘      要:语言交流效率得分是量化口吃严重程度的方法,该方法需要获得口吃发生的时间,但目前相关研究仅能判断语音段中是否存在口吃,无法精确定位口吃的发生位置,不利于对口吃严重程度的判别.针对目前深度学习检测口吃类型无法可视化定位目标的问题,首先使用短时傅里叶变换将语音转化为语谱图,然后对其进行口吃类型标记,最后使用YOLOv5对口吃类型进行检测.在YOLOv5的基础框架下尝试YOLOv5s、YOLOv5m、YOLOv5l、YOLOv5x 4种不同深度和宽度的模型,实现口吃类型的分类和定位,并选择在其性能最优的模型YOLOv5l中引入高效通道注意力机制和CIOU目标框损失函数对基础模型进行改进.实验结果表明,改进的YOLOv5l模型在训练损失值有明显降低,在准确率、召回率和mAP_0.5上分别提升了1.2、0.6和0.4个百分点,较原模型漏检情况有所改善.

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分