咨询与建议

限定检索结果

文献类型

  • 8 篇 期刊文献
  • 2 篇 学位论文
  • 1 篇 会议

馆藏范围

  • 11 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 7 篇 工学
    • 5 篇 计算机科学与技术...
    • 5 篇 软件工程
    • 3 篇 控制科学与工程
    • 2 篇 仪器科学与技术
  • 5 篇 管理学
    • 5 篇 管理科学与工程(可...
  • 2 篇 理学
    • 2 篇 系统科学
  • 1 篇 教育学
    • 1 篇 教育学
  • 1 篇 艺术学
    • 1 篇 设计学(可授艺术学...

主题

  • 11 篇 随机样本划分
  • 3 篇 人工智能
  • 3 篇 大数据
  • 2 篇 大数据分析
  • 2 篇 最大均值差异
  • 2 篇 逼近式集成学习
  • 2 篇 聚类集成算法
  • 2 篇 分布一致性
  • 1 篇 最大均值差异准则
  • 1 篇 异质簇
  • 1 篇 hadoop分布式文件...
  • 1 篇 观测点分类器
  • 1 篇 文字信息处理
  • 1 篇 独热编码
  • 1 篇 并行分布式计算
  • 1 篇 随机向量函数链接...
  • 1 篇 基聚类质量
  • 1 篇 大数据处理
  • 1 篇 分布式处理系统
  • 1 篇 子空间局部链接

机构

  • 10 篇 深圳大学
  • 3 篇 人工智能与数字经...
  • 1 篇 中国科学院大学
  • 1 篇 河北民族师范学院
  • 1 篇 大数据系统计算技...
  • 1 篇 广东省人工智能与...
  • 1 篇 中国刑事警察学院

作者

  • 9 篇 何玉林
  • 8 篇 he yulin
  • 7 篇 黄哲学
  • 6 篇 huang zhexue
  • 3 篇 魏丞昊
  • 2 篇 张晓亮
  • 2 篇 尹剑飞
  • 2 篇 yin jianfei
  • 2 篇 wei chenghao
  • 2 篇 崔来中
  • 2 篇 cui laizhong
  • 1 篇 zhang xiaoliang
  • 1 篇 杜雪琴
  • 1 篇 黄柏皓
  • 1 篇 于万国
  • 1 篇 李旭
  • 1 篇 吴胤旭
  • 1 篇 袁镇濠
  • 1 篇 jin yi
  • 1 篇 huang jiajie

语言

  • 11 篇 中文
检索条件"主题词=随机样本划分"
11 条 记 录,以下是1-10 订阅
排序:
基于大数据随机样本划分的分布式观测点分类器
收藏 引用
计算机应用 2024年 第6期44卷 1727-1733页
作者: 李旭 何玉林 崔来中 黄哲学 PHILIPPE Fournier-Viger 人工智能与数字经济广东省实验室(深圳) 广东深圳518107 深圳大学计算机与软件学院 广东深圳518060
观测点分类器(OPC)是一种试图通过将多维样本空间线性不可分问题转换成一维距离空间线性可分问题的有监督学习模型,对高维数据的分类问题尤为有效。针对OPC在处理大数据分类问题时表现的较高训练复杂度,在Spark框架下设计一款基于大数... 详细信息
来源: 评论
大数据随机样本划分模型及相关分析计算技术
收藏 引用
数据采集与处理 2019年 第3期34卷 373-385页
作者: 黄哲学 何玉林 魏丞昊 张晓亮 深圳大学计算机与软件学院大数据技术与应用研究所 深圳518060 深圳大学大数据系统计算技术国家工程实验室 深圳518060
设计了一种新的适用于大数据的管理和分析模型大数据随机样本划分(Random samplepartition,RSP)模型,它是将大数据文件表达成一系列RSP数据块文件的集合,分布存储在集群节点上。RSP的生成操作使每个RSP数据块的分布与大数据的分布保持... 详细信息
来源: 评论
大数据随机样本划分模型及相关分析计算技术
大数据随机样本划分模型及相关分析计算技术
收藏 引用
第六届中国计算机学会大数据学术会议
作者: 黄哲学 何玉林 魏丞昊 张晓亮 深圳大学计算机与软件学院大数据技术与应用研究所 广东 深圳518060 大数据系统计算技术国家工程实验室 广东 深圳 518060
本文设计了一种新的适用于大数据的管理和分析模型——大数据随机样本划分模型(Random Sample Partition模型,简称RSP模型),它是将大数据文件表达成一系列RSP数据块文件的集合,分布存储在集群节点上.RSP的生成操作使每个RSP数据块的数... 详细信息
来源: 评论
针对大规模数据的分布一致缺失值插补算法
收藏 引用
清华大学学报(自然科学版) 2023年 第5期63卷 740-753页
作者: 余嘉茵 何玉林 崔来中 黄哲学 深圳大学计算机与软件学院 大数据所深圳518060 广东省人工智能与数字经济实验室(深圳) 深圳518107
缺失值插补(missing value imputation,MVI)作为数据挖掘领域的重要研究分支,旨在为机器学习算法的训练提供高质量的数据支持。不同于现有的以算法性能提升为导向的MVI算法,为对大规模数据的缺失值进行有效插补,该文提出一种以数据结构... 详细信息
来源: 评论
混合属性数据集分布一致性度量的新方法
收藏 引用
深圳大学学报(理工版) 2021年 第2期38卷 170-179页
作者: 何玉林 金一 戴德鑫 黄柏皓 黄家杰 深圳大学计算机与软件学院 广东深圳518060 深圳大学大数据系统计算技术国家工程实验室 广东深圳518060 中国刑事警察学院刑事科学技术学院 辽宁沈阳110854
数据分布一致性的度量是大数据随机样本划分生成过程中的一个关键问题,如何针对混合属性的数据集进行合理有效的分布一致性度量是目前随机样本划分技术研究的重点.提出一种新的基于深度编码和最大平均差异的混合属性数据集分布一致性度... 详细信息
来源: 评论
分布式子空间局部链接随机向量函数链接网络
收藏 引用
深圳大学学报(理工版) 2022年 第6期39卷 675-683页
作者: 于万国 袁镇濠 陈佳琪 何玉林 河北民族师范学院数学与计算机科学学院 河北承德067000 深圳大学计算机与软件学院 广东深圳518060 人工智能与数字经济广东省实验室(深圳) 广东深圳518107
为解决随机向量函数链接(random vector functional link,RVFL)网络处理大规模数据分类时表现出的泛化能力差和计算复杂度高的问题,基于Spark框架设计与实现一种分布式子空间局部链接的RVFL(distributed RVFL with subspace-based local... 详细信息
来源: 评论
基于标签迭代的聚类集成算法
收藏 引用
智能科学与技术学报 2024年 第4期6卷 466-479页
作者: 何玉林 杨锦 黄哲学 尹剑飞 人工智能与数字经济广东省实验室(深圳) 广东深圳518107 深圳大学计算机与软件学院 广东深圳518060
现有的“数据相同,算法不同”式的聚类集成算法训练策略普遍存在处理大规模数据性能受限以及共识函数适应性不强的缺点。为此,对“数据不同,算法相同”式的聚类集成算法训练策略进行了研究,构建了一种基于标签迭代的聚类集成(LICE)算法... 详细信息
来源: 评论
基于统计感知的大数据系统计算框架
收藏 引用
深圳大学学报(理工版) 2018年 第5期35卷 441-443页
作者: 魏丞昊 黄哲学 何玉林 深圳大学计算机与软件学院大数据技术与应用研究所 广东深圳518060
为在一定计算资源条件下实现大数据可计算化,本研究提出一种基于统计感知思想的Tbyte级大数据系统计算框架Bigdata-α,该框架的核心为大数据随机样本划分模型和逼近式集成学习模型.前者保证了划分后每个子数据块所包含的样本与大数据总... 详细信息
来源: 评论
面向数据分析的分布式数据管理系统
面向数据分析的分布式数据管理系统
收藏 引用
作者: 吴胤旭 中国科学院大学(中国科学院深圳先进技术研究院)
学位级别:硕士
随着工业4.0与互联网+的相关产业发展,大数据成为业界的一个普遍现象,也逐渐在方方面面影响着大众的生活。如何管治与利用好大数据,是目前众多政府机关与企业所面临的难题,而目前的大数据生态圈正处于一个刚刚为大众所了解,正在稳步发... 详细信息
来源: 评论
分布一致为导向的聚类集成方法研究
分布一致为导向的聚类集成方法研究
收藏 引用
作者: 杜雪琴 深圳大学
学位级别:硕士
聚类集成作为一种利用多个聚类结果的互补性而得到比单个聚类质量更好的有效无监督学习方式,解决了在没有先验知识的情况下,为给定数据集选取合适的聚类方法的难题。不同于传统数据聚类方法直接得到最终的聚类结果,聚类集成方法通过多... 详细信息
来源: 评论