版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
专利申请号:CN201910433562.8
公 开 号:CN110147553A
代 理 人:吴无惧
代理机构:52100 贵阳中新专利商标事务所
专利类型:发明申请
申 请 日:20190820
公 开 日:20190523
专利主分类号:G06F17/27(20060101)
关 键 词:标注 案件 要素识别 文档数据 序列标注 法律 机器学习算法 结构化表示 数据预处理 单位处理 法律文本 描述信息 模型识别 神经网络 实践应用 信息检索 要素标注 应用研究 扁平化 文档 句子 审阅 抽取 分析 关联 便利 融合 支撑
摘 要:本发明公开了一种基于案件要素的法律文书分析方法,它包括如下步骤:一、利用机器学习算法从法律文书中抽取案情描述信息,并按照案件要素标注的优先级对案情描述进行标注;二、数据预处理:将步骤一中所标注的案件要素进行识别;三、基于深度神经网络的案件要素识别:将标注的文档数据作为标注模型的原始输入,实现端到端的案件要素识别。通过对法律文书进行扁平化关联案件要素的标注,将标注的文档数据以句子为单位处理为经典的“BIO序列标注格式,采用相关的序列标注模型识别文档中的案件要素。案件要素识别有利于法律文本的结构化表示,支撑法律文书的融合分析等应用研究,为法律文书的信息检索、自动审阅等实践应用白来巨大便利。