一种基于社交媒体文本数据的空间基因识别提取方法-内蒙古大学图书馆

文献详情 >一种基于社交媒体文本数据的空间基因识别提取方法收藏

一种基于社交媒体文本数据的空间基因识别提取方法

专利申请号：CN202310396213.X

公开号：CN116414985A

发明人：段进李伊格郭楚怡

代理人：张恩慧

代理机构：北京同辉知识产权代理事务所(普通合伙)

专利类型：发明专利

申请日：20230711

公开日：20230414

专利主分类号：G06F16/35

关键词：数据集网络文本数据构建同义词预处理采集同义词替换层次聚类城市空间非介入式分析软件基因识别技术手段空间组合媒体平台媒体文本向量空间语义网络主题分类主题模型基因词矩阵样本量多源聚类合并引入统计研究

摘要：本发明公开了一种基于社交媒体文本数据的空间基因识别提取方法，包括以下步骤：采集关于城市的网络文本数据，然后对数据进行预处理，得到数据集D1；在分析软件中构建词典及向量空间，引入LDA主题模型，对得到的数据集D1进行主题分类；在各主题中合并同义词，并在数据集D1中进行同义词替换，得到数据集D2；在数据集D2中统计关键词两两共现次数，并构建共词矩阵M；利用层次聚类模型，对语义网络分析结果进行聚类，得到空间组合模式，即空间基因。本发明方法从多源社交媒体平台上采集关于某研究城市的网络文本数据，通过获取样本量丰富、非介入式的数据，为城市研究者识别城市空间基因提供了一种实用的技术手段。

本地馆藏 | 借阅须知 | 我要预约

已订购，未入库

sda

目录详情 | 试阅读 |

读者评论与其他读者分享你的观点

学校读者

用户名:未登录

我的评分

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

看过本文的还看了

相关文献

该作者的其他文献

CADAL相关文献

一种基于社交媒体文本数据的空间基因识别提取方法

读者评论与其他读者分享你的观点

请选择收藏分类：

建议与咨询 留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

看过本文的还看了

相关文献

该作者的其他文献

CADAL相关文献

一种基于社交媒体文本数据的空间基因识别提取方法

读者评论 与其他读者分享你的观点

请选择收藏分类： 新增自定义分类 确定 取消

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

读者评论与其他读者分享你的观点

请选择收藏分类：