针对多视图三维重建任务中点云完整性欠佳的问题,提出一种基于空间传播的多视图深度估计网络(SPMVSNet)。引入空间传播思想用于复杂条件下的稠密点云重建,并分别设计基于空间传播的混合深度假设策略和空间感知优化模块。混合深度假设策略采用由粗糙到精细的深度推理方式,将深度估计视为多标签分类任务,对正则化概率体执行交叉熵损失以约束代价体,从而避免回归方法过拟合和收敛速度过慢的问题。空间感知优化模块从包含高级语义特征表示的特征图中获得引导,在进行置信度检查后采用卷积空间传播网络,通过构建亲和矩阵来细化最终的深度图。同时,为解决大多数方法存在的对不满足多视图一致性的不可靠区域重建质量较低的问题,进一步结合注意力机制设计具有样本自适应能力的动态特征提取网络,用于增强模型的局部感知能力。实验结果表明,在DTU数据集上,SP-MVSNet的重建完整性相比于CVP-MVSNet提升32.8%,整体质量提升11.4%。在Tanks and Temples基准和Blended MVS数据集上,SP-MVSNet的表现也优于大多数已知方法,取得了良好的三维重建效果。
针对中医问诊领域数据规模大,以及医生在问诊中主观性强、数据对齐难的问题,提出了一种中医问答领域的大语言模型ChatTCM。利用大语言模型(large language model,LLM)在处理自然语言理解与文本生成方面的强大能力,通过对大语言模型进行...
详细信息
针对中医问诊领域数据规模大,以及医生在问诊中主观性强、数据对齐难的问题,提出了一种中医问答领域的大语言模型ChatTCM。利用大语言模型(large language model,LLM)在处理自然语言理解与文本生成方面的强大能力,通过对大语言模型进行微调,使LLM具有在中医问答领域的专业知识和能力,避免模型在生成时出现幻觉的现象。提取中医书籍中的三元组信息,构建中医知识图谱数据库,实现中医知识的数据对齐与系统化整合,并为大语言模型生成答案提供背景知识;结合思维链(chain-of-thought,COT)与知识图谱数据库的动态交互,生成客观的推理过程,确保诊疗建议具有科学依据;把思维链与知识图谱的推理结果作为新知识进行存储,从而不断扩展本地知识库。与中医领域的HuaTuoGPT模型对比实验表明,ChatTCM模型在MedChatZH数据集上BLEU-4和ROUGE-L的评测指标分别提高了10.6和10.5个百分点,并且在已开源的数据集上准确度达到了70%,比同类型的MedChatZH模型提升了10个百分点。
暂无评论