咨询与建议

限定检索结果

文献类型

  • 29 篇 学位论文
  • 25 篇 会议
  • 17 篇 期刊文献
  • 1 册 图书

馆藏范围

  • 72 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 48 篇 工学
    • 41 篇 计算机科学与技术...
    • 12 篇 软件工程
    • 9 篇 电气工程
    • 5 篇 信息与通信工程
    • 4 篇 仪器科学与技术
    • 3 篇 控制科学与工程
    • 2 篇 测绘科学与技术
    • 2 篇 环境科学与工程(可...
    • 1 篇 机械工程
    • 1 篇 电子科学与技术(可...
    • 1 篇 水利工程
    • 1 篇 交通运输工程
    • 1 篇 公安技术
  • 33 篇 管理学
    • 32 篇 管理科学与工程(可...
    • 1 篇 图书情报与档案管...
  • 3 篇 理学
    • 2 篇 地理学
    • 1 篇 系统科学
  • 2 篇 经济学
    • 2 篇 应用经济学
  • 1 篇 医学

主题

  • 72 篇 spark sql
  • 16 篇 spark
  • 13 篇 big data
  • 11 篇 大数据
  • 8 篇 apache spark
  • 3 篇 hive
  • 3 篇 geomesa
  • 3 篇 查询优化
  • 3 篇 parquet
  • 3 篇 in-memory comput...
  • 3 篇 等值连接
  • 3 篇 数据倾斜
  • 2 篇 tuning
  • 2 篇 hash join
  • 2 篇 sparks
  • 2 篇 geospark
  • 2 篇 大数据分析
  • 2 篇 spark streaming
  • 2 篇 数据处理
  • 2 篇 optimization

机构

  • 6 篇 北京交通大学
  • 3 篇 中国科学院大学
  • 3 篇 东南大学
  • 3 篇 重庆邮电大学
  • 3 篇 上海交通大学
  • 2 篇 华北电力大学
  • 2 篇 北京邮电大学
  • 2 篇 southeast univ s...
  • 2 篇 laval univ ctr r...
  • 2 篇 福建船政交通职业...
  • 1 篇 univ portsmouth ...
  • 1 篇 univ sci & techn...
  • 1 篇 fudan univ sch c...
  • 1 篇 华中科技大学
  • 1 篇 korea univ dept ...
  • 1 篇 zhejiang univ co...
  • 1 篇 chinese acad sci...
  • 1 篇 杭州东方通信软件...
  • 1 篇 计算机体系结构国...
  • 1 篇 univ lyon lyon 2...

作者

  • 2 篇 badard thierry
  • 2 篇 胡晶
  • 2 篇 陆会明
  • 2 篇 engelinus jonath...
  • 2 篇 zhai mingyu
  • 2 篇 song aibo
  • 1 篇 tang jian-chao
  • 1 篇 zhang yufei
  • 1 篇 nasu yuya
  • 1 篇 魏可欣
  • 1 篇 li yang
  • 1 篇 wang jiahui
  • 1 篇 mao yuren
  • 1 篇 bentayeb fadila
  • 1 篇 li zhifang
  • 1 篇 张曼
  • 1 篇 tomasz drabas
  • 1 篇 田彬
  • 1 篇 丁凯泽
  • 1 篇 ji xuechun

语言

  • 39 篇 中文
  • 33 篇 英文
检索条件"主题词=spark SQL"
72 条 记 录,以下是1-10 订阅
LOFTune: A Low-Overhead and Flexible Approach for spark sql Configuration Tuning
收藏 引用
IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING 2025年 第6期37卷 3528-3542页
作者: Li, Jiahui Ye, Junhao Mao, Yuren Gao, Yunjun Chen, Lu Zhejiang Univ Sch Software Technol Ningbo 315048 Peoples R China Zhejiang Univ Coll Comp Sci Hangzhou 310027 Peoples R China
The query efficiency of spark sql is significantly impacted by its configurations. Therefore, configuration tuning has drawn great attention, and various automatic configuration tuning methods have been proposed. Howe... 详细信息
来源: 评论
QHB+: Accelerated Configuration Optimization for Automated Performance Tuning of spark sql Applications
收藏 引用
IEEE ACCESS 2024年 12卷 60138-60148页
作者: Jang, Deokyeon Yoon, Hyunsik Jung, Kijung Chung, Yon Dohn Korea Univ Dept Comp Sci & Engn Seoul 02841 South Korea
Apache spark stands out as a well-known solution for big data processing because of its efficiency and rapid processing capabilities. One of its modules, spark sql, serves as a prominent big data query engine. However... 详细信息
来源: 评论
Rover: An Online spark sql Tuning Service via Generalized Transfer Learning  23
Rover: An Online Spark SQL Tuning Service via Generalized Tr...
收藏 引用
29th ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD)
作者: Shen, Yu Ren, Xinyuyang Lu, Yupeng Jiang, Huaijun Xu, Huanyong Peng, Di Li, Yang Zhang, Wentao Cui, Bin Peking Univ Sch CS Beijing Peoples R China ByteDance Inc Beijing Peoples R China Peking Univ Ctr Data Sci Beijing Peoples R China Mila Quebec AI Inst Montreal PQ Canada Peking Univ Inst Computat Social Sci Sch CS Beijing Peoples R China
Distributed data analytic engines like spark are common choices to process massive data in industry. However, the performance of spark sql highly depends on the choice of configurations, where the optimal ones vary wi... 详细信息
来源: 评论
LOCAT: Low-Overhead Online Configuration Auto-Tuning of spark sql Applications  22
LOCAT: Low-Overhead Online Configuration Auto-Tuning of Spar...
收藏 引用
International Conference on Management of Data (SIGMOD)
作者: Xin, Jinhan Hwang, Kai Yu, Zhibin Chinese Acad Sci Shenzhen Inst Adv Technol SIAT Shenzhen Guangdong Peoples R China Univ Chinese Acad Sci UCAS Beijing Peoples R China Chinese Univ Hong Kong Shenzhen Guangdong Peoples R China Shenzhen Huawei Cloud Comp Co Ltd Shuhai Lab Shenzhen Guangdong Peoples R China
spark sql has been widely deployed in industry but it is challenging to tune its performance. Recent studies try to employ machine learning (ML) to solve this problem, but suffer from two drawbacks. First, it takes a ... 详细信息
来源: 评论
面向容器云的spark sql性能优化研究与实现
面向容器云的Spark SQL性能优化研究与实现
收藏 引用
作者: 张天星 贵州大学
学位级别:硕士
云计算具备大规模数据存算能力,成为现代数字经济发展的基础。在云环境中如何高效的处理大规模数据仍是一个亟待解决的难题。基于CPU处理结构化数据的性能表现不佳,GPU的出现带来了新的优化思路。然而,现有的容器云平台在GPU的集成与调... 详细信息
来源: 评论
Handling Data Skew for Aggregation in spark sql Using Task Stealing
收藏 引用
INTERNATIONAL JOURNAL OF PARALLEL PROGRAMMING 2020年 第6期48卷 941-956页
作者: He, Zeyu Huang, Qiuli Li, Zhifang Weng, Chuliang East China Normal Univ Sch Data Sci & Engn Shanghai Peoples R China
In distributed in-memory computing systems, data distribution has a large impact on performance. Designing a good partition algorithm is difficult and requires users to have adequate prior knowledge of data, which mak... 详细信息
来源: 评论
DQN-based Join Order Optimization by Learning Experiences of Running Queries on spark sql  20
DQN-based Join Order Optimization by Learning Experiences of...
收藏 引用
20th IEEE International Conference on Data Mining (ICDM)
作者: Lee, Kyeong-Min Kim, InA Lee, Kyu-Chul Chungnam Natl Univ Dept Comp Engn Daejeon South Korea
In a smart grid, various types of queries such as adhoc queries and analytic queries are requested for data. There is a limit to query evaluation based on a single node database engines because queries are requested f... 详细信息
来源: 评论
基于收益模型的spark sql数据重用机制
收藏 引用
计算机研究与发展 2020年 第2期57卷 318-332页
作者: 申毅杰 曾丹 熊劲 计算机体系结构国家重点实验室(中国科学院计算技术研究所) 北京100190 中国科学院大学 北京100049
通过数据分析发现海量数据中的潜在价值,能够带来巨大的收益.spark具有良好的系统扩展性与处理性能,因而被广泛运用于大数据分析.spark sqlspark最常用的编程接口.在数据分析应用中存在着大量的重复计算,这些重复计算不仅浪费系统资源... 详细信息
来源: 评论
A Cost Model for spark sql
收藏 引用
IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING 2019年 第5期31卷 819-832页
作者: Baldacci, Lorenzo Golfarelli, Matteo Univ Bologna DISI I-40126 Bologna Italy
In this paper, we propose a novel cost model for spark sql. The cost model covers the class of Generalized Projection, Selection, Join (GPSJ) queries. The cost model keeps into account the network and IO costs as well... 详细信息
来源: 评论
融合spark sql的系统误差性能评价技术指标研究
收藏 引用
电工技术 2022年 第6期 29-32,63页
作者: 朱国雄 田彬 陆会明 华北电力大学控制与计算机工程学院 北京102206 国能智深控制技术有限公司 北京102211
提出了一种融合spark sql技术的系统误差性能评价方案,解决了在工业控制系统存在大量数据时往往需要对数据进行分析、处理的问题,通过对数据的统计分析得到当前控制系统的性能指标,由性能指标决定是否对控制过程方案做出相应调整,从而... 详细信息
来源: 评论