咨询与建议

限定检索结果

文献类型

  • 29 篇 学位论文
  • 25 篇 会议
  • 16 篇 期刊文献
  • 1 册 图书

馆藏范围

  • 71 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 47 篇 工学
    • 40 篇 计算机科学与技术...
    • 12 篇 软件工程
    • 8 篇 电气工程
    • 5 篇 信息与通信工程
    • 4 篇 仪器科学与技术
    • 3 篇 控制科学与工程
    • 2 篇 测绘科学与技术
    • 2 篇 环境科学与工程(可...
    • 1 篇 机械工程
    • 1 篇 电子科学与技术(可...
    • 1 篇 水利工程
    • 1 篇 交通运输工程
    • 1 篇 公安技术
  • 33 篇 管理学
    • 32 篇 管理科学与工程(可...
    • 1 篇 图书情报与档案管...
  • 3 篇 理学
    • 2 篇 地理学
    • 1 篇 系统科学
  • 2 篇 经济学
    • 2 篇 应用经济学
  • 1 篇 医学

主题

  • 71 篇 spark sql
  • 16 篇 spark
  • 13 篇 big data
  • 11 篇 大数据
  • 8 篇 apache spark
  • 3 篇 hive
  • 3 篇 geomesa
  • 3 篇 查询优化
  • 3 篇 parquet
  • 3 篇 in-memory comput...
  • 3 篇 等值连接
  • 3 篇 数据倾斜
  • 2 篇 hash join
  • 2 篇 geospark
  • 2 篇 大数据分析
  • 2 篇 spark streaming
  • 2 篇 数据处理
  • 2 篇 data skipping
  • 2 篇 直方图
  • 2 篇 query optimizati...

机构

  • 6 篇 北京交通大学
  • 3 篇 中国科学院大学
  • 3 篇 东南大学
  • 3 篇 重庆邮电大学
  • 3 篇 上海交通大学
  • 2 篇 华北电力大学
  • 2 篇 北京邮电大学
  • 2 篇 southeast univ s...
  • 2 篇 laval univ ctr r...
  • 2 篇 福建船政交通职业...
  • 1 篇 univ portsmouth ...
  • 1 篇 univ sci & techn...
  • 1 篇 fudan univ sch c...
  • 1 篇 华中科技大学
  • 1 篇 korea univ dept ...
  • 1 篇 chinese acad sci...
  • 1 篇 杭州东方通信软件...
  • 1 篇 计算机体系结构国...
  • 1 篇 univ lyon lyon 2...
  • 1 篇 henan univ inst ...

作者

  • 2 篇 badard thierry
  • 2 篇 胡晶
  • 2 篇 陆会明
  • 2 篇 hu jing
  • 2 篇 engelinus jonath...
  • 2 篇 zhai mingyu
  • 2 篇 song aibo
  • 1 篇 tang jian-chao
  • 1 篇 zhang yufei
  • 1 篇 nasu yuya
  • 1 篇 魏可欣
  • 1 篇 li yang
  • 1 篇 wang jiahui
  • 1 篇 bentayeb fadila
  • 1 篇 li zhifang
  • 1 篇 张曼
  • 1 篇 xiong jin
  • 1 篇 tomasz drabas
  • 1 篇 田彬
  • 1 篇 丁凯泽

语言

  • 39 篇 中文
  • 32 篇 英文
检索条件"主题词=spark SQL"
71 条 记 录,以下是21-30 订阅
排序:
基于HDFS的4G行卡业务数据的spark sql查询优化
基于HDFS的4G行卡业务数据的Spark SQL查询优化
收藏 引用
作者: 陈旭东 重庆邮电大学
学位级别:硕士
随着spark sql和HDFS在大数据结构化查询领域的广泛应用,数据查询速度有了明显的提升,但同时也暴露出了一些问题,如HDFS默认数据块大小设置不合理影响spark sql的查询效率、spark sql读取海量小文件效率低等。这些问题在处理以4G行业应... 详细信息
来源: 评论
基于机器学习的spark sql连接查询优化研究
基于机器学习的Spark SQL连接查询优化研究
收藏 引用
作者: 付豪 东南大学
学位级别:硕士
随着信息时代的发展,大规模的数据与复杂数据分析方法对查询引擎的性能提出了更高的需求。连接查询能够从多个关联的数据表中抽取出有价值的信息,是当前主要的查询方式。spark并行计算引擎作为流行的大数据处理框架,使用spark sql组件... 详细信息
来源: 评论
基于spark sql的定制化查询引擎
基于Spark SQL的定制化查询引擎
收藏 引用
作者: 崔毅 上海交通大学
学位级别:硕士
spark sql使得开发者和数据分析师可以在spark应用程序中便捷地直接使用sql语句在结构化或非结构化的数据集上查询数据。它给开发者和数据分析员提供了极大的便利去利用关系型数据模型的优点,并且spark内部的RDD数据模型也提升了在大规... 详细信息
来源: 评论
基于运行时统计数据采集的spark sql查询优化研究
基于运行时统计数据采集的Spark SQL查询优化研究
收藏 引用
作者: 刘晨飞 电子科技大学
学位级别:硕士
大数据时代,各行各业与互联网的紧密结合产生了海量的业务数据,通过分析这些业务数据可以为公司制定更好的运营策略,从而提升公司的盈利能力。Hadoop MapReduce系统的出现简化了对海量数据的分析,其被大量公司和机构广泛应用于业务数据... 详细信息
来源: 评论
基于spark sql的海量数据实时分类查询算法的研究
收藏 引用
黄河科技学院学报 2021年 第5期23卷 35-38页
作者: 胡晶 福建船政交通职业学院 福建福州350007
spark是高速计算引擎,在计算能力上优于MapReduce。spark采用的是内存计算方式,而spark sql在基于Hive数仓数据的分布式计算上尤为广泛。重点研究spark sql在进行海量数据的分类查询时,对处理大数据计算的性能进行优化建议。大数据的分... 详细信息
来源: 评论
融合spark sql的系统误差性能评价技术指标研究
收藏 引用
电工技术 2022年 第6期 29-32,63页
作者: 朱国雄 田彬 陆会明 华北电力大学控制与计算机工程学院 北京102206 国能智深控制技术有限公司 北京102211
提出了一种融合spark sql技术的系统误差性能评价方案,解决了在工业控制系统存在大量数据时往往需要对数据进行分析、处理的问题,通过对数据的统计分析得到当前控制系统的性能指标,由性能指标决定是否对控制过程方案做出相应调整,从而... 详细信息
来源: 评论
基于spark sql结构化数据文件的推荐系统性能优化研究
收藏 引用
电脑与信息技术 2021年 第5期29卷 61-63页
作者: 胡晶 福建船政交通职业学院 福建福州350007
spark sqlspark技术的一个模块,在不使用Scala语言的前提下,可以对结构化数据进行处理和优化。本文重点研究spark sql的架构、DateFrame数据抽象、基于数据分类的改进交替最小二乘算法(ALS)等几个方面,研究在推荐系统中处理结构化数... 详细信息
来源: 评论
利用spark sql分析传统数据源的通用步骤
收藏 引用
电子制作 2020年 第16期28卷 66-68页
作者: 陆赟 闫歌 新疆农业职业技术学院 新疆昌吉831100 新疆维吾尔自治区特种设备检验研究院 新疆乌鲁木齐830000
在大数据时代,日益增长的行业数据给各个行业带来了全新挑战,传统的计算方式已经不能满足企业对数据统计分析的需要。如何从大规模的数据中提取出有价值的信息并通过分析计算生成有价值的统计报表,成为各个企业关心的问题。如今大数据... 详细信息
来源: 评论
基于spark sql技术的工业数据统计研究
收藏 引用
科学技术创新 2021年 第6期 58-61页
作者: 胡志宝 陆会明 华北电力大学控制与计算机工程学院 北京102206
对于获得的大量工业数据,然后对数据进行统计分析可以知道生产过程的运行情况,从而决定是否需要对过程或者方案进行调整。本文使用sparksql并行计算框架,利用spark sql在Java中集成的API,结合Java编程语言,对得到的工业数据进行常规统计... 详细信息
来源: 评论
基于sparksql连接优化研究与应用
基于Spark的SQL连接优化研究与应用
收藏 引用
作者: 邵帅 北京交通大学
学位级别:硕士
随着互联网的高速发展及IT技术的快速进步,各行各业的数据量都在高速增长,为了更好地分析和利用大数据,大数据平台应运而生。Hadoop平台能够完成一般的大数据分析和处理,但是随着信息量的爆发式增长及人们对实时性要求的提高,其性能已... 详细信息
来源: 评论