语料库为语言研究和自然语言处理提供基础数据服务.传统语料库数据缺乏规范的数据模型,导致无法科学的评价查询结果,大大降低了数据可用性.针对该问题,提出一种面向语料库的数据模型,并讨论了其上的查询问题.首先,给出语料库数据的形式化定义,其次,在关系模型的基础上提出一种面向文本语料库的数据模型,并证明了模型的完备性,在此基础上,扩展传统语料库以KWIC(Key Word In Context)输出为中心的查询语义,定义了语料库数据的查询问题KWIC-EXTENTION.最后,证明这些查询问题的数据复杂度,其中,正匹配查询、负匹配查询、析取匹配查询、n-临近匹配查询的数据复杂度是AC0的,临近正匹配查询的数据复杂度是PTIME(Polynomial Time)的,临近负匹配查询问题的数据复杂度是PSPACE(Polynomial Space)的.这些结论为语料库数据模型和查询方法的研究奠定了理论基础.
空间K-匿名技术主要用于隐私保护,防止个人信息泄露。目前的主要方法都基于用户-匿名器-基于位置的服务(location based services,LBS)模型。提出了一种基于位置敏感哈希分割的空间K-匿名共匿算法。这种算法在保距性和共匿性方面都可以...
详细信息
空间K-匿名技术主要用于隐私保护,防止个人信息泄露。目前的主要方法都基于用户-匿名器-基于位置的服务(location based services,LBS)模型。提出了一种基于位置敏感哈希分割的空间K-匿名共匿算法。这种算法在保距性和共匿性方面都可以满足要求,而且算法具有适度的计算复杂度。最后,针对有效性(最小化匿名空间区域)和效率(构建代价)做了实验,证明所提出的算法具有良好的性能。
暂无评论