作为人类通用的定位方式,地名是传统GIS(Geographic Information System,地理信息系统)通向社会化服务的关键桥梁,是行政经济历史文化和社会心理等多因素的综合产物。地名作为最常用的自然语言地理信息,是重要的基础信息资源,与国...
详细信息
作为人类通用的定位方式,地名是传统GIS(Geographic Information System,地理信息系统)通向社会化服务的关键桥梁,是行政经济历史文化和社会心理等多因素的综合产物。地名作为最常用的自然语言地理信息,是重要的基础信息资源,与国家行政管理、经济建设和国内外交往等方面息息相关,同时在网络电子地图、智能交通、移动位置服务、国防安全等领域中都有着广泛的应用。目前,地名库和地名词典作为地理信息检索领域中最常用的两种地理知识库,对于地名的消歧具有重要的作用。但由于地名数据库中信息不完备,空间位置信息缺失问题普遍存在,特别是缺乏对人们常用的边界模糊类地名的空间覆盖范围的支持。随着互联网技术的不断发展,互联网已成为除遥感影像、GPS(Global PositioningSystem,全球定位系统)等之外的一种获取地理信息的新型来源。因此,从海量网络信息中挖掘模糊区域知识,从而丰富地名词典并且提高基于地名的地理信息检索的质量,成为地理信息科学研究的重要内容。\n 本文在构建了朝鲜半岛地名本体的基础上,基于核密度估计模型和一类支持向量机模型的思想,探讨了地名模糊区域建模方法,并对地名模糊区域的细化方法进行了探索性研究,提出了新的思路和方法,为实现朝鲜半岛可进行精确匹配的地理信息检索系统提供了理论和方法基础。本文主要研究内容及取得的成果主要有以下几个方面:\n 1)基于地名词典的地名本体构建:以现有地名词典为基础,设计了地名本体的总体框架,进行了地名本体的网络本体语言OWL(Web Ontology Language,简称OWL)形式化描述,构建了地名本体的推理规则,实现了基于Protégé地名本体的形式化表达,为朝鲜半岛地理信息检索应用提供数据基础。\n 2)基于自适应核密度估计(kernel density estimation,KDE)的边界模糊类地名的空间近似范围自动构建:获取地名的地理标记图片数据并进行预处理,基于KDE构建地名模糊区域估算模型,引入定量评价因子准确率、召回率和F值,分别对精确地名的原始数据集和预处理后数据集进行定量化评价。通过参数寻优,得到精确地名模型的参数最优解,以其平均值作为边界模糊类地名模型的输入参数,对边界模糊类地名的空间近似范围进行估算。实验表明,预处理过程能够有效提高模型的估算结果,并且通过精确地名模型参数的先验选择,实现边界模糊类地名空间近似范围估算的自动化。\n 3)基于一类支持向量机(One Class Support Vector Machine,OCSVM)的边界模糊类地名地理近似范围自动构建:提出了基于OCSVM的地名模糊区域估算模型,并对模型中参数优化方法进行了探讨。通过对精确地名模糊区域估算的实验,得到OCSVM地名模糊区域估算模型的精确地名参数最优解,以其平均值作为边界模糊类地名模型的输入参数值,实现对边界模糊类地名的地理空间范围估算。实验表明,通过精确地名实验获得的模型输入参数值可以实现边界模糊类地名模型的自动化。同时,对基于KDE的地名模糊区域估算模型和基于OCSVM的地名模糊区域估算模型进行了对比,分别对比了精确地名和边界模糊类地名的估算结果。实验表明,两种方法各有优势,需根据数据集的不同进行方法的选择。\n 4)融合地理要素的地名模糊边界细化:提出了一种对基于KDE或者基于OCSVM模型估算得到的地名模糊区域边界进行细化的区域收缩方法。融合土地覆盖数据或者DEM数据,通过选取种子点和制定区域收缩规则,对基于OCSVM模型估算得到的地名模糊区域边界进行细化实验。实验结果表明,本章提出的细化方法有效可行,可以很好地改善由KDE或者OCSVM模型估算的地名模糊区域边界过估计现象。为进一步融合其他遥感数据进行地名模糊区域边界细化提供了参考依据。
暂无评论