对话情绪识别(Emotion Recognition in Conversation,ERC)是对话系统研究中的一项关键任务,然而,现有的模型往往由于管道设计的复杂性,容易过拟合于特定数据集和对话模式,从而限制了其泛化能力。为了解决这一问题,本研究提出一个...
详细信息
对话情绪识别(Emotion Recognition in Conversation,ERC)是对话系统研究中的一项关键任务,然而,现有的模型往往由于管道设计的复杂性,容易过拟合于特定数据集和对话模式,从而限制了其泛化能力。为了解决这一问题,本研究提出一个基于大语言模型的多任务生成式重构对话情绪识别模型(Multi-task Generative Emotion Recognition in Conversation,M-GERC)。该模型引入两个基于预训练大语言模型的辅助任务:说话人识别和主题预测情绪。说话人识别任务旨在隐式建模对话中的对话角色关系,帮助模型更好地理解不同参与者之间的情绪交流。主题预测情绪任务则通过预测对话全局的主题,捕捉主题和情绪之间的潜在联系,从而结合上下文信息提高情绪识别的准确性。此外,M-GERC引入了知识检索模块,通过检索知识域知识并结合外部知识,进一步增强模型对上下文的理解。实验结果表明,M-GERC在DailyDialog、MELD和EmoryNLP数据集上相较于现有主流对话情绪识别模型,W-F1分别提高了3.1%、4.3%和3.7%,取得了显著提升。
针对遥感图像中小目标数量众多且背景复杂所导致的识别精度低的问题,提出了一种改进的遥感图像小目标检测方法。该方法基于改进的YOLOv7网络模型,将双级路由注意力机制加入至下采样阶段以构建针对小目标的特征提取模块MP-ATT(max pooling-attention),使得模型更加关注小目标的特征,提高小目标检测精度。为了加强对小目标的细节感知能力,使用DCNv3(deformable convolution network v3)替换骨干网络中的二维卷积,以此构建新的层聚合模块ELAN-D。为网络设计新的小目标检测层以获取更精细的特征信息,从而提升模型的鲁棒性。同时使用MPDIoU(minimum point distance based IoU)替换原模型中的CIoU来优化损失函数,以适应遥感图像的尺度变化。实验表明,所提出的方法在DOTA-v1.0数据集上取得了良好效果,准确率、召回率和平均准确率(mean average precision,mAP)相比原模型分别提升了0.4、4.0、2.3个百分点,证明了该方法能够有效提升遥感图像中小目标的检测效果。
暂无评论