完全个性化的新闻推荐工作通常只基于用户兴趣,可能会导致推荐结果与点击过的内容过于相似甚至重复.事实上即使一些热点新闻并不完全符合用户兴趣,用户也可能希望点击类似的新闻.目前基于热点的新闻推荐方法不能很好挖掘潜在新闻的热点特征、灵活平衡用户兴趣和热点特征.本文提出一种新颖的注意力增强的热点感知新闻推荐模型(Hotspot-aware Attention enhaNced model,HAN),充分利用注意力网络和自注意力网络等深度神经网络的优势,在个性化推荐中将个性化兴趣与新闻热点性进行更好平衡与利用.该模型包括新闻编码器、热点特征提取器、用户兴趣提取器和点击预测器四个组件.提出一个热点特征提取器,使用注意力网络动态聚合热点新闻学习热点表示以更好挖掘热点特征;提出一个新颖的点击预测器来灵活融合热点特征、用户兴趣和候选新闻,以提升候选新闻的点击预测准确率.真实数据集上的实验表明HAN模型在AUC(Area Under the Curve of ROC)和F1两项指标上分别提升了7.51%和8.63%,且能够有效缓解用户冷启动问题.
该研究对基于注意力机制的长短期记忆(Attention-Based Long Short Term Memory,AT-LSTM)模型对蒸散量(Evapotranspiration,ET)模拟的可行性和有效性进行验证,以提高环境数据缺失情况下的蒸散量模拟精度。基于盐池县2012—2017年的每30 ...
详细信息
该研究对基于注意力机制的长短期记忆(Attention-Based Long Short Term Memory,AT-LSTM)模型对蒸散量(Evapotranspiration,ET)模拟的可行性和有效性进行验证,以提高环境数据缺失情况下的蒸散量模拟精度。基于盐池县2012—2017年的每30 min环境数据,利用不同环境因子组合构建基于注意力机制的LSTM模型,并将其与极限学习机(Extreme Learning Machine,ELM)模型、支持向量机(Support Vector Machine,SVM)模型、长短期记忆(Long Short Term Memory,LSTM)模型在日尺度、月尺度和季节尺度上进行对比分析。结果表明:与其他3种模型相比,当输入环境因子变化时,AT-LSTM模型模拟精度变化很小,模拟效果均较好。当输入空气温度、净辐射、相对湿度、土壤温度、土壤含水率所有环境因子时,基于AT-LSTM模型的模拟效果最好,均方根误差(Root Mean Square Error,RMSE)为0.013 mm/30 min,平均绝对误差(Mean Absolute Error,MAE)为0.006 mm/30 min,相关系数(Correlation Coefficient,R)值为0.905。且无论是从小时尺度、日尺度和月尺度来看,AT-LSTM模型的模拟效果均优于其他3种模型。在环境因子缺失的情况下,净辐射对盐池县ET的模拟贡献程度最大,仅输入净辐射时,AT-LSTM模型模拟得到的RMSE和MAE分别为0.014、0.007 mm/30 min,R为0.892。AT-LSTM模型模拟精度高,模型稳定性强,对蒸散量模拟预测具有一定的适用性,仅输入净辐射的AT-LSTM模型可以作为环境数据缺失条件下的蒸散量预测模型。
【目的】针对红外相机拍摄的野生动物图像数据量大、无效图像占比多、图像背景复杂等问题,提出一种可对图像进行自动、高准确率识别的模型,为生物多样性研究和野生动物保护工作提供更高效的支持。【方法】收集整理近4年来北京园林绿化生态系统监测网络各站点红外相机拍摄的约5 TB图像数据,对其手工标注并进行数据增强后自建10类共4234张图像数据集。基于ConvNeXt卷积神经网络,结合北京地区野生动物图像数据集特点,设计BSGG-ConvNeXt模型,使用BlurPool、SENet、全局响应归一化层(GRN)、GCNet提升模型识别能力,并在自建数据集上探究训练策略对ConvNeXt网络识别准确率的影响,通过与其他经典模型比较,明确BSGG-ConvNeXt模型的优势。利用公开的红外野生动物Snapshot Serengeti(SS)数据集和Caltech Camera Traps(CCT)数据集,验证模型的泛化能力。【结果】以ConvNeXt的ConvNeXt-T网络尺寸模型为例,其在自建数据集中的准确率为74.13%,乘加累积操作数(MACs)为4.47×10^(9)。应用不同改进方案发现,使用BlurPool后准确率提升2.2%,MACs降至1.07×10^(9);使用SENet后准确率提升3.2%;使用GRN并删掉缩放层后准确率升至87.18%,参数数量增至27.88×10^(6);使用GCNet后在不增大计算量的情况下准确率升至75.44%,但参数数量增至28.25×10^(6)。将上述改进方案结合得到的BSGGConvNeXt应用于ConvNeXt-T模型获得BSGG-ConvNeXt-T模型,参数数量虽有少量增多,但MACs降为1.07×10^(9),模型准确率升至83.63%,高于原模型。使用预训练权重后的BSGG-ConvNeXt-T模型准确率可达94.07%,高于ResNet-50(76.39%)、ResNeXt-50(87.60%)、MobileViT(90.00%)、DenseNet(87.66%)、RegNet(69.90%)、ConvNeXtv2(91.93%)、SwinTransformer的(86.23%)和MobileOne(71.53%),将BSGG-ConvNeXt模型应用于4种不同网络尺寸的ConvNeXt模型后,在自建数据集中的表现均优于未改进模型。BSGG-ConvNeXt模型在SS数据集中的识别准确率达50.28%,在CCT数据集中的识别准确率达56.15%,均高于原模型的准确率。【结论】BSGG-ConvNeXt模型识别红外相机拍摄的野生动物图像准确率更高,在自建、公开的野生动物红外图像数据集上均有较好表现,且具有一定泛化能力。
目的基于卷积神经网络的单阶段目标检测网络具有高实时性与高检测精度,但其通常存在两个问题:1)模型中存在大量冗余的卷积计算;2)多尺度特征融合结构导致额外的计算开销。这导致单阶段检测器需要大量的计算资源,难以在计算资源不足的设备上应用。针对上述问题,本文在YOLOv5(you only look once version 5)的结构基础上,提出一种轻量化单阶段目标检测网络架构,称为E-YOLO(efficient-YOLO)。方法利用E-YOLO架构构建了E-YOLOm(efficient-YOLO medium)与E-YOLOs(efficient-YOLO small)两种不同大小的模型。首先,设计了多种更加高效的特征提取模块以减少冗余的卷积计算,对模型中开销较大的特征图通过下采样、特征提取、通道升降维与金字塔池化进行了轻量化设计。其次,为解决多尺度特征融合带来的冗余开销,提出了一种高效多尺度特征融合结构,使用多尺度特征加权融合方案减少通道降维开销,设计中层特征长跳连接缓解特征流失。结果实验表明,E-YOLOm、E-YOLOs与YOLOv5m、YOLOv5s相比,参数量分别下降了71.5%和61.6%,运算量下降了67.3%和49.7%。在VOC(visual object classes)数据集上的平均精度(average precision,AP),E-YOLOm比YOLOv5m仅下降了2.3%,E-YOLOs比YOLOv5s提升了3.4%。同时,E-YOLOm的参数量和运算量相比YOLOv5s分别低15.5%与1.7%,mAP@0.5和AP比其高3.9%和11.1%,具有更小的计算开销与更高的检测效率。结论本文提出的E-YOLO架构显著降低了单阶段目标检测网络中冗余的卷积计算与多尺度融合开销,且具有良好的鲁棒性,并优于对比网络轻量化方案,在低运算性能的环境中具有重要的实用意义。
暂无评论