咨询与建议

限定检索结果

文献类型

  • 29 篇 学位论文
  • 25 篇 会议
  • 16 篇 期刊文献
  • 1 册 图书

馆藏范围

  • 71 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 47 篇 工学
    • 40 篇 计算机科学与技术...
    • 12 篇 软件工程
    • 8 篇 电气工程
    • 5 篇 信息与通信工程
    • 4 篇 仪器科学与技术
    • 3 篇 控制科学与工程
    • 2 篇 测绘科学与技术
    • 2 篇 环境科学与工程(可...
    • 1 篇 机械工程
    • 1 篇 电子科学与技术(可...
    • 1 篇 水利工程
    • 1 篇 交通运输工程
    • 1 篇 公安技术
  • 33 篇 管理学
    • 32 篇 管理科学与工程(可...
    • 1 篇 图书情报与档案管...
  • 3 篇 理学
    • 2 篇 地理学
    • 1 篇 系统科学
  • 2 篇 经济学
    • 2 篇 应用经济学
  • 1 篇 医学

主题

  • 71 篇 spark sql
  • 16 篇 spark
  • 13 篇 big data
  • 11 篇 大数据
  • 8 篇 apache spark
  • 3 篇 hive
  • 3 篇 geomesa
  • 3 篇 查询优化
  • 3 篇 parquet
  • 3 篇 in-memory comput...
  • 3 篇 等值连接
  • 3 篇 数据倾斜
  • 2 篇 hash join
  • 2 篇 geospark
  • 2 篇 大数据分析
  • 2 篇 spark streaming
  • 2 篇 数据处理
  • 2 篇 data skipping
  • 2 篇 直方图
  • 2 篇 query optimizati...

机构

  • 6 篇 北京交通大学
  • 3 篇 中国科学院大学
  • 3 篇 东南大学
  • 3 篇 重庆邮电大学
  • 3 篇 上海交通大学
  • 2 篇 华北电力大学
  • 2 篇 北京邮电大学
  • 2 篇 southeast univ s...
  • 2 篇 laval univ ctr r...
  • 2 篇 福建船政交通职业...
  • 1 篇 univ portsmouth ...
  • 1 篇 univ sci & techn...
  • 1 篇 fudan univ sch c...
  • 1 篇 华中科技大学
  • 1 篇 korea univ dept ...
  • 1 篇 chinese acad sci...
  • 1 篇 杭州东方通信软件...
  • 1 篇 计算机体系结构国...
  • 1 篇 univ lyon lyon 2...
  • 1 篇 henan univ inst ...

作者

  • 2 篇 badard thierry
  • 2 篇 胡晶
  • 2 篇 陆会明
  • 2 篇 hu jing
  • 2 篇 engelinus jonath...
  • 2 篇 zhai mingyu
  • 2 篇 song aibo
  • 1 篇 tang jian-chao
  • 1 篇 zhang yufei
  • 1 篇 nasu yuya
  • 1 篇 魏可欣
  • 1 篇 li yang
  • 1 篇 wang jiahui
  • 1 篇 bentayeb fadila
  • 1 篇 li zhifang
  • 1 篇 张曼
  • 1 篇 xiong jin
  • 1 篇 tomasz drabas
  • 1 篇 田彬
  • 1 篇 丁凯泽

语言

  • 39 篇 中文
  • 32 篇 英文
检索条件"主题词=Spark SQL"
71 条 记 录,以下是11-20 订阅
排序:
LOCAT: Low-Overhead Online Configuration Auto-Tuning of spark sql Applications  22
LOCAT: Low-Overhead Online Configuration Auto-Tuning of Spar...
收藏 引用
International Conference on Management of Data (SIGMOD)
作者: Xin, Jinhan Hwang, Kai Yu, Zhibin Chinese Acad Sci Shenzhen Inst Adv Technol SIAT Shenzhen Guangdong Peoples R China Univ Chinese Acad Sci UCAS Beijing Peoples R China Chinese Univ Hong Kong Shenzhen Guangdong Peoples R China Shenzhen Huawei Cloud Comp Co Ltd Shuhai Lab Shenzhen Guangdong Peoples R China
spark sql has been widely deployed in industry but it is challenging to tune its performance. Recent studies try to employ machine learning (ML) to solve this problem, but suffer from two drawbacks. First, it takes a ... 详细信息
来源: 评论
Query Optimization Approach with Shuffle Intermediate Cache Layer for spark sql  38
Query Optimization Approach with Shuffle Intermediate Cache ...
收藏 引用
IEEE 38th International Performance Computing and Communications Conference (IPCCC)
作者: Zhai, Mingyu Song, Aibo Qiu, Jingyi Ji, Xuechun Wu, Qingxi NARI Technol NARI Res Inst Nanjing Peoples R China Southeast Univ Sch Comp Sci & Engn Nanjing Peoples R China Southeast Univ Sch Cyber Sci & Engn Nanjing Peoples R China
spark sql is a big data processing tool for structured data query and analysis. However, due to the execution of spark sql, there are multiple times to write intermediate data to the disk, which reduces the execution ... 详细信息
来源: 评论
基于收益模型的spark sql数据重用机制
收藏 引用
计算机研究与发展 2020年 第2期57卷 318-332页
作者: 申毅杰 曾丹 熊劲 计算机体系结构国家重点实验室(中国科学院计算技术研究所) 北京100190 中国科学院大学 北京100049
通过数据分析发现海量数据中的潜在价值,能够带来巨大的收益.spark具有良好的系统扩展性与处理性能,因而被广泛运用于大数据分析.spark sqlspark最常用的编程接口.在数据分析应用中存在着大量的重复计算,这些重复计算不仅浪费系统资源... 详细信息
来源: 评论
spark sql系统查询优化的研究与实现
SPARK SQL系统查询优化的研究与实现
收藏 引用
作者: 丁凯泽 北京邮电大学
学位级别:硕士
信息化技术的普及与移动互联的迅速崛起,带来了前所未有的“大数据”时代。数据量的飞速爆炸,使得利用及研究数据面临重大挑战,怎样在海量数据中,钻取、挖掘、进而获取数据带来的价值变得尤为关键。在近几年的大数据技术中,以MapReduce... 详细信息
来源: 评论
spark sql查询执行优化技术研究
Spark SQL查询执行优化技术研究
收藏 引用
作者: 万雨桐 东南大学
学位级别:硕士
随着互联网的快速发展,政府机关、企业与研究机构每天都要产生和处理的数据规模已经达到TB级乃至PB级。虽然Hadoop的出现解决了大数据在多台计算机上的可靠存储和处理问题,但是该计算框架也存在一定的问题,即运算产生的中间结果会存放在... 详细信息
来源: 评论
spark sql等值连接优化算法研究
Spark SQL等值连接优化算法研究
收藏 引用
作者: 李思慧 北京交通大学
学位级别:硕士
科学技术的发展以及互联网的普及推动着大数据时代的到来,全球每天都在产生海量的数据,数据的计量单位己从Byte、KB、MB发展到了 PB、EB甚至于YB、BB。面对如此众多的数据,大数据分析成为一个研究热点,同时以Hadoop、spark为首的大数据... 详细信息
来源: 评论
spark sql结构化数据处理及性能优化
Spark SQL结构化数据处理及性能优化
收藏 引用
作者: 罗昭 重庆邮电大学
学位级别:硕士
近年来spark内存计算框架快速崛起,数据处理速度得到极大的提高,但是其速度上限却受限于spark内存规模。当数据量小于或接近内存容量时spark性能最好,反之则性能较差。因此spark sql在处理以4G行业卡数据为代表的通信大数据时暴露出了... 详细信息
来源: 评论
面向容器云的spark sql性能优化研究与实现
面向容器云的Spark SQL性能优化研究与实现
收藏 引用
作者: 张天星 贵州大学
学位级别:硕士
云计算具备大规模数据存算能力,成为现代数字经济发展的基础。在云环境中如何高效的处理大规模数据仍是一个亟待解决的难题。基于CPU处理结构化数据的性能表现不佳,GPU的出现带来了新的优化思路。然而,现有的容器云平台在GPU的集成与调... 详细信息
来源: 评论
基于spark sql的数据源连接器的设计与实现
基于Spark SQL的数据源连接器的设计与实现
收藏 引用
作者: 陶昱正 上海交通大学
学位级别:硕士
随着大数据时代的到来,用户对于海量数据计算和存储的需求不断提高。spark作为一个基于内存计算的分布式计算框架以其优异的性能在近年来得到了业界的广泛认可,而spark生态圈中的组件spark sql也成为了不少企业在面临海量数据分析处理... 详细信息
来源: 评论
基于成本的spark sql优化
基于成本的Spark SQL优化
收藏 引用
作者: 连欣 重庆邮电大学
学位级别:硕士
大数据时代,挖掘海量信息中蕴含的价值,对海量信息进行快速处理成为各个行业的迫切需求。随着spark的广泛应用,spark sql作为一个基于spark的分布式查询组件,利用spark内存计算特性,进一步提高了海量数据检索性能,并在数据清洗、数据挖... 详细信息
来源: 评论