大数据挖掘技术与应用

首页 > 图书 > 经济管理类图书/2020-06-08 / 加入收藏 / 阅读 [打印]
大数据挖掘技术与应用

大数据挖掘技术与应用

作者:孟海东

开 本:16开

书号ISBN:9787502467807

定价:56.0

出版时间:2014-12-01

出版社:冶金工业出版社

大数据挖掘技术与应用 本书特色

本书针对数据的海量性、复杂性、高维性、模糊性和不完整性,对数据挖掘技术中的聚类分析和关联规则分析进行了系统的研究。设计与实现了基于密度和自适应密度可达聚类算法、基于簇特征的动态增量聚类算法、并行聚类算法、基于密度加权的模糊聚类算法、高唯复杂数据聚类算法、基于数据场的聚类算法、基于距离的量化关联规则和基于数据场的量化关联规则算法,给出了在矿产资源评价、遥感图像分类、矿业经济分析中的应用例证。全书共分11章,主要内容包括:绪论,基于密度和密度可达聚类分析,基于簇特征的动态增量聚类分析,并行聚类分析,基于密度加权的模糊聚类分析,高唯复杂数据聚类分析,基于数据场的聚类分析,基于距离的量化关联规则,基于数据场的量化关联规则,数据挖掘结果可视化和数据挖掘算法应用。

大数据挖掘技术与应用 目录

1 绪论1 
1.1 大数据    1  
1.1.1 大数据概念1  
1.1.2 大数据特征4 
1.2 云计算与大数据挖掘    5  
1.2.1 云计算5  
1.2.2 大数据挖掘6 
1.3 传统数据挖掘    6  
1.3.1 数据源与挖掘任务7  
1.3.2 数据挖掘方法7  
1.3.3 数据挖掘面临问题9 
参考文献    10  
2 基于属性加权和密度聚类分析11 
2.1 聚类分析技术    11  
2.1.1 数据基础11  
2.1.2 聚类分析方法16  
2.1.3 簇的类型16 
2.2 聚类算法    17  
2.2.1 聚类算法分类17  
2.2.2 聚类算法特性19  
2.2.3 选用聚类算法参考因素20  
2.2.4 聚类算法面临的挑战21 
2.3 聚类算法改进    23  
2.3.1 聚类算法分析23  
2.3.2 数据对象属性加权25 
2.3.3 基于属性加权k-means算法27  
2.3.4 实例验证算法28 
2.4 基于密度与对象方向聚类算法    29  
2.4.1 算法的提出29  
2.4.2 denclue算法30  
2.4.3 算法设计31 
2.5 cabwad算法实现    36  
2.5.1 数据结构建立36  
2.5.2 数据结构上聚类38  
2.5.3 时间和空间复杂度40 
2.6 实验分析    40  
2.6.1 准确度分析41  
2.6.2 可扩展性分析43 
参考文献    44  
3 基于密度与密度可达聚类分析46 
3.1 cabwad算法分析    46  
3.1.1 算法过程分析46  
3.1.2 两个输入参数的分析47 
3.2 算法设计与分析    50  
3.2.1 相关定义50  
3.2.2 cadd算法设计53  
3.2.3 算法执行过程分析53 
3.3 实验分析    55  
3.3.1 不同分布形态的簇(缠绕簇)55  
3.3.2 不同密度的簇56  
3.3.3 分布在不同密度噪声中的变密度簇57  
3.3.4 复杂形态簇58  
3.3.5 算法复杂度分析59 
参考文献    60  
4 动态增量聚类分析62
 4.1 算法提出    62 
4.1.1 增量聚类算法62  
4.1.2 cadd算法分析64  
4.1.3 抽样技术66 
4.2 基于密度可达的动态增量聚类算法    67  
4.2.1 算法设计67  
4.2.2 算法实现69  
4.2.3 算法复杂度分析69 
4.3 基于子簇特征的增量聚类算法    70  
4.3.1 相关定义70  
4.3.2 算法设计72  
4.3.3 算法实现72 
4.4 实验分析    73  
4.4.1 仿真动态增量聚类73  
4.4.2 算法对比分析77 
参考文献    78  
5 并行聚类分析80 
5.1 并行计算技术    80  
5.1.1 并行计算定义81 
 5.1.2 并行计算分类81  
5.1.3 并行计算模型和体系结构82  
5.1.4 并行数据挖掘85  
5.1.5 并行聚类分析86 
5.2 并行聚类算法设计与实现    88  
5.2.1 算法总体流程88  
5.2.2 数据并行聚类算法89  
5.2.3 数据并行和任务并行聚类算法90 
5.3 实验分析    92  
5.3.1 算法有效性分析92  
5.3.2 算法加速比分析92  
5.3.3 算法时间复杂度分析93 
 5.3.4 pcadd与cadd算法执行时间对比93 
参考文献    94 
6 高维多类型属性数据对象聚类分析95 
6.1 高维多类型属性数据对象    95  
6.1.1 高维数据处理95  
6.1.2 多类型属性处理96  
6.1.3 高维数据对象聚类96 
 6.1.4 多类型属性数据对象聚类98 
6.2 维度对聚类算法精度影响    99  

 1/3    1 2 3 下一页 尾页

管理 管理信息系统

在线阅读

 1/3    1 2 3 下一页 尾页
  • 最新内容
  • 相关内容
  • 网友推荐
  • 图文推荐