针对现有的类案检索方法缺乏对案情要素的有效利用容易被案例内容语义结构相似性所误导的问题,提出了融合时序行为链与事件类型的类案检索方法。首先,采取序列标注的方法识别出案情描述中的法律事件类型,并利用案例文本中的行为要素构建时序行为链,突出案情的关键要素,使模型聚焦于案例的核心内容,以解决现有方法易被案例的语义结构相似性所误导的问题。其次,利用分段编码构造时序行为链的相似性向量表征矩阵,增强案例间行为要素的语义交互。最后,经过聚合评分器,从时序行为链、法律事件类型、犯罪类型三个角度衡量案例的相关性,增加案例匹配得分的合理性。实验结果表明,与SAILER(Structure-Aware pre-traIned language model for LEgal case Retrieval)方法相比,该方法在LeCaRD(Legal Case Retrieval Dataset)数据集中,P@5值提升了4个百分点、P@10值提升了3个百分点、MAP值提升了4个百分点、NDCG@30值提升了0.8个百分点。该方法有效利用案情要素,避免了案例内容语义结构相似性的干扰,能为类案检索提供可靠的依据。
暂无评论