针对中医问诊领域数据规模大,以及医生在问诊中主观性强、数据对齐难的问题,提出了一种中医问答领域的大语言模型ChatTCM。利用大语言模型(large language model,LLM)在处理自然语言理解与文本生成方面的强大能力,通过对大语言模型进行...
详细信息
针对中医问诊领域数据规模大,以及医生在问诊中主观性强、数据对齐难的问题,提出了一种中医问答领域的大语言模型ChatTCM。利用大语言模型(large language model,LLM)在处理自然语言理解与文本生成方面的强大能力,通过对大语言模型进行微调,使LLM具有在中医问答领域的专业知识和能力,避免模型在生成时出现幻觉的现象。提取中医书籍中的三元组信息,构建中医知识图谱数据库,实现中医知识的数据对齐与系统化整合,并为大语言模型生成答案提供背景知识;结合思维链(chain-of-thought,COT)与知识图谱数据库的动态交互,生成客观的推理过程,确保诊疗建议具有科学依据;把思维链与知识图谱的推理结果作为新知识进行存储,从而不断扩展本地知识库。与中医领域的HuaTuoGPT模型对比实验表明,ChatTCM模型在MedChatZH数据集上BLEU-4和ROUGE-L的评测指标分别提高了10.6和10.5个百分点,并且在已开源的数据集上准确度达到了70%,比同类型的MedChatZH模型提升了10个百分点。
暂无评论