版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
作者机构:鲁东大学文学院山东省语言资源开发与应用重点实验室山东烟台264025 北京大学计算语言学研究所北京100871 乐山师范学院智能信息处理及应用实验室四川乐山614004
出 版 物:《中文信息学报》 (Journal of Chinese Information Processing)
年 卷 期:2015年第29卷第3期
页 面:9-15页
核心收录:
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家863计划主题项目(2012AA011101) 国家社科基金重大项目(12&ZD227) 国家自然科学基金青年项目(61103089) 山东省优秀中青年科学家科研奖励基金(BS2013DX020) 鲁东大学人文社会科学研究项目(WY2013003)
摘 要:树库是自然语言处理中一项重要的基础资源,现有树库基本上都是单视图树,支持短语结构语法或者依存语法。该文提出一套基于依存语法的多视图汉语树库标注体系,仅需标注中心语和语法角色两类信息,之后可以自动地推导出描述句法结构所需的短语结构功能和层次信息,从而可以在不增加标注工作量的前提下获得更多语法信息。基于该体系,构建了北京大学多视图汉语树库(PMT)1.0版,含有64 000句、140万词,支持短语结构语法和依存语法两个视图。