咨询与建议

限定检索结果

文献类型

  • 6 篇 期刊文献
  • 5 篇 会议
  • 4 篇 学位论文
  • 1 册 图书

馆藏范围

  • 16 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 12 篇 工学
    • 9 篇 计算机科学与技术...
    • 5 篇 软件工程
    • 1 篇 信息与通信工程
    • 1 篇 控制科学与工程
    • 1 篇 农业工程
    • 1 篇 生物医学工程(可授...
    • 1 篇 网络空间安全
  • 6 篇 管理学
    • 6 篇 管理科学与工程(可...
  • 2 篇 教育学
    • 2 篇 教育学
  • 1 篇 理学
    • 1 篇 大气科学

主题

  • 16 篇 sparksql
  • 4 篇 hdfs
  • 3 篇 hive
  • 3 篇 hadoop
  • 3 篇 impala
  • 2 篇 sql-on-hadoop
  • 2 篇 orc
  • 2 篇 query optimizati...
  • 2 篇 parquet
  • 2 篇 scala
  • 1 篇 csv
  • 1 篇 自适应数据
  • 1 篇 apache spark
  • 1 篇 结构化查询语言
  • 1 篇 flume系统
  • 1 篇 apache zeppelin
  • 1 篇 indexes
  • 1 篇 spark repl.
  • 1 篇 neo4j
  • 1 篇 big data

机构

  • 1 篇 中国移动山东公司
  • 1 篇 comp technol ins...
  • 1 篇 univ patras comp...
  • 1 篇 univ south pacif...
  • 1 篇 延边大学
  • 1 篇 univ perugia dep...
  • 1 篇 beijing univ pos...
  • 1 篇 北京邮电大学
  • 1 篇 goethe univ fran...
  • 1 篇 上海交通大学
  • 1 篇 吉林农业大学
  • 1 篇 电子科技大学
  • 1 篇 chitkara univ co...
  • 1 篇 johannes gutenbe...
  • 1 篇 山西机电职业技术...
  • 1 篇 广西区气象信息中...
  • 1 篇 辽宁工程技术大学

作者

  • 1 篇 karras aristeidi...
  • 1 篇 李晓鹏
  • 1 篇 sharma deepikesh
  • 1 篇 saxena merry
  • 1 篇 sharma jessica
  • 1 篇 宫钦
  • 1 篇 罗希意
  • 1 篇 schuhknecht feli...
  • 1 篇 reutter philipp
  • 1 篇 sridhar alla
  • 1 篇 郭昕彤
  • 1 篇 王桂荣
  • 1 篇 ivanov todor
  • 1 篇 zhou wenli
  • 1 篇 李涛
  • 1 篇 陈兆阳
  • 1 篇 brast nils
  • 1 篇 henneberg justus
  • 1 篇 karras christos
  • 1 篇 gupta anchal

语言

  • 9 篇 中文
  • 7 篇 英文
检索条件"主题词=SparkSQL"
16 条 记 录,以下是1-10 订阅
排序:
Northlight: Declarative and Optimized Analysis of Atmospheric Datasets in sparksql  22
Northlight: Declarative and Optimized Analysis of Atmospheri...
收藏 引用
34th International Conference on Scientific and Statistical Database Management (SSDBM)
作者: Henneberg, Justus Schuhknecht, Felix Reutter, Philipp Brast, Nils Spichtinger, Peter Johannes Gutenberg Univ Mainz Mainz Germany
Research in atmospheric physics, meteorology, and weather prediction requires the processing of very large multi-dimensional observational or modeled datasets on a daily basis. One of the numerous existing array engin... 详细信息
来源: 评论
sparksql上自适应数据集的高效频繁集挖掘算法
收藏 引用
计算机工程与应用 2020年 第21期56卷 72-78页
作者: 王永贵 郭昕彤 辽宁工程技术大学软件学院 辽宁葫芦岛125105
针对基于Spark框架的关联规则算法存在I/O开销大、数据结构和挖掘频繁集方式单一、计算支持度的方式效率低等问题,提出基于sparksql进行分布式编程的算法。将数据集加载到DataFrame,利用改进后的布隆过滤器高效存储频繁集挖掘过程中产... 详细信息
来源: 评论
基于文本信息的sparksql处理研究
收藏 引用
电子技术与软件工程 2020年 第15期 213-214页
作者: 史媛 山西机电职业技术学院 山西省长治市046011
本文以图书信息为例,介绍了Spark中对结构化数据进行处理的组件sparksql,使用sparksql转换文本信息文件为DataFrame数据集,然后运用Scala语言对数据集进行操作运算,得出最终结果并将结果输出,最后分析结果得出可以采取的策略。初步阐述... 详细信息
来源: 评论
Hadoop环境下基于sparksql海量自动站数据查询统计初探
收藏 引用
气象科技 2019年 第5期47卷 768-772,871页
作者: 黄志 詹利群 任晓炜 李涛 广西区气象信息中心
在Hadoop分布式计算和存储架构下,自定义ETL数据清洗规则将海量自动站小时单站文件按所属年和站号合并为大文件流转存储至HDFS中,并运用sparksql并行计算框架进行统计处理生成常用气象要素日统计值。结果表明,数据处理和获取时效较关系... 详细信息
来源: 评论
基于开源sparksql平台处理传统网管性能数据研究
收藏 引用
山东通信技术 2018年 第2期38卷 5-8,12页
作者: 李训潮 宫钦 中国移动山东公司 济南250001
本文针对传统网管OMC北向性能数据,通过基于内存计算的sparksql技术进行处理,有效提升了基于Hadoop的大数据平台的计算能力,整合了分散异构的各传统网管数据,满足了不同租户的快速查询和交互式应用需求。
来源: 评论
SQL Query Optimization in Distributed NoSQL Databases for Cloud-Based Applications  1
收藏 引用
7th International Symposium on Algorithmic Aspects of Cloud Computing
作者: Karras, Aristeidis Karras, Christos Pervanas, Antonios Sioutas, Spyros Zaroliagis, Christos Univ Patras Comp Engn & Informat Dept Patras 26504 Greece Comp Technol Inst & Press Diophantus Patras Univ Campus Patras 26504 Greece
A method for query optimization is presented by utilizing Spark SQL, a module of Apache Spark that integrates relational data processing. The goal of this paper is to explore NoSQL databases and their effective usage ... 详细信息
来源: 评论
Retail Analytics to anticipate Covid-19 effects Using Big Data Technologies
Retail Analytics to anticipate Covid-19 effects Using Big Da...
收藏 引用
8th IEEE Asia-Pacific Conference on Computer Science and Data Engineering (IEEE CSDE)
作者: Sharma, Jessica Sharma, Deepikesh Sharma, Krishneel Univ South Pacific Sch Informat Technol Engn Math & Phys Suva Fiji
Retail analytics helps a company gain a deeper understanding of customer demand, making shopping more relevant, personalized, and convenient and boosting sales using optimal pricing. This paper aims to demonstrate ret... 详细信息
来源: 评论
基于Spark的元数据管理系统的设计与实现
基于Spark的元数据管理系统的设计与实现
收藏 引用
作者: 马张迪 电子科技大学
学位级别:硕士
随着高校数字化建设的深入开展,全国各个高校都在加快建设自己的数据中心,其中的一卡通平台,教学系统和科研管理等系统每天都会产生大量的数据。由于早期各部门数据存储系统和数据定义标准都不尽相同,这给数据的统一管理和使用造成了极... 详细信息
来源: 评论
The impact of columnar file formats on SQL-on-hadoop engine performance: A study on ORC and Parquet
收藏 引用
CONCURRENCY AND COMPUTATION-PRACTICE & EXPERIENCE 2020年 第5期32卷 e5523-e5523页
作者: Ivanov, Todor Pergolesi, Matteo Goethe Univ Frankfurt Frankfurt Big Data Lab Frankfurt Germany Univ Perugia Dept Engn Perugia Italy
Columnar file formats provide an efficient way to store data to be queried by SQL-on-Hadoop engines. Related works consider the performance of processing engine and file format together, which makes it impossible to p... 详细信息
来源: 评论
基于Spark的农业土壤大数据挖掘系统的设计与实现
基于Spark的农业土壤大数据挖掘系统的设计与实现
收藏 引用
作者: 陈兆阳 吉林农业大学
学位级别:硕士
我国是世界农业大国之一,具有悠久的农业历史,农业在整个国家经济中占有重要地位。如今,增强农业生产力、提高现有农田的产量以满足人口增长的需要是21世纪的主要挑战之一。在农业生产不断发展的过程中,虽然我国在农业领域取得了显... 详细信息
来源: 评论