图书介绍

大数据挖掘技术与应用【2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载】

大数据挖掘技术与应用
  • 孟海东,宋宇辰著 著
  • 出版社: 北京:冶金工业出版社
  • ISBN:9787502467807
  • 出版时间:2014
  • 标注页数:278页
  • 文件大小:108MB
  • 文件页数:294页
  • 主题词:数据处理

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

大数据挖掘技术与应用PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

1 绪论1

1.1 大数据1

1.1.1 大数据概念1

1.1.2 大数据特征4

1.2 云计算与大数据挖掘5

1.2.1 云计算5

1.2.2 大数据挖掘6

1.3 传统数据挖掘6

1.3.1 数据源与挖掘任务7

1.3.2 数据挖掘方法7

1.3.3 数据挖掘面临问题9

参考文献10

2 基于属性加权和密度聚类分析11

2.1 聚类分析技术11

2.1.1 数据基础11

2.1.2 聚类分析方法16

2.1.3 簇的类型16

2.2 聚类算法17

2.2.1 聚类算法分类17

2.2.2 聚类算法特性19

2.2.3 选用聚类算法参考因素20

2.2.4 聚类算法面临的挑战21

2.3 聚类算法改进22

2.3.1 聚类算法分析23

2.3.2 数据对象属性加权25

2.3.3 基于属性加权K-means算法27

2.3.4 实例验证算法28

2.4 基于密度与对象方向聚类算法29

2.4.1 算法的提出29

2.4.2 DENCLUE算法30

2.4.3 算法设计31

2.5 CABWAD算法实现36

2.5.1 数据结构建立36

2.5.2 数据结构上聚类38

2.5.3 时间和空间复杂度40

2.6 实验分析40

2.6.1 准确度分析41

2.6.2 可扩展性分析43

参考文献44

3 基于密度与密度可达聚类分析46

3.1 CABWAD算法分析46

3.1.1 算法过程分析46

3.1.2 两个输入参数的分析47

3.2 算法设计与分析50

3.2.1 相关定义50

3.2.2 CADD算法设计53

3.2.3 算法执行过程分析53

3.3 实验分析55

3.3.1 不同分布形态的簇(缠绕簇)55

3.3.2 不同密度的簇56

3.3.3 分布在不同密度噪声中的变密度簇57

3.3.4 复杂形态簇58

3.3.5 算法复杂度分析58

参考文献60

4 动态增量聚类分析61

4.1 算法提出61

4.1.1 增量聚类算法61

4.1.2 CADD算法分析63

4.1.3 抽样技术65

4.2 基于密度可达的动态增量聚类算法66

4.2.1 算法设计66

4.2.2 算法实现68

4.2.3 算法复杂度分析68

4.3 基于子簇特征的增量聚类算法69

4.3.1 相关定义69

4.3.2 算法设计71

4.3.3 算法实现71

4.4 实验分析72

4.4.1 仿真动态增量聚类72

4.4.2 算法对比分析76

参考文献77

5 并行聚类分析79

5.1 并行计算技术79

5.1.1 并行计算定义80

5.1.2 并行计算分类80

5.1.3 并行计算模型和体系结构81

5.1.4 并行数据挖掘84

5.1.5 并行聚类分析85

5.2 并行聚类算法设计与实现87

5.2.1 算法总体流程87

5.2.2 数据并行聚类算法88

5.2.3 数据并行和任务并行聚类算法89

5.3 实验分析91

5.3.1 算法有效性分析91

5.3.2 算法加速比分析91

5.3.3 算法时间复杂度分析92

5.3.4 PCADD与CADD算法执行时间对比92

参考文献93

6 高维多类型属性数据对象聚类分析94

6.1 高维多类型属性数据对象94

6.1.1 高维数据处理94

6.1.2 多类型属性处理95

6.1.3 高维数据对象聚类95

6.1.4 多类型属性数据对象聚类97

6.2 维度对聚类算法精度影响98

6.2.1 高维数据聚类98

6.2.2 数据集与相关定义98

6.2.3 实验结果及分析99

6.3 多类型属性数据聚类分析102

6.3.1 处理多类型数据方法102

6.3.2 聚类效果度量标准102

6.3.3 实验结果及分析103

6.4 基于属性加权的高维数据聚类107

6.4.1 属性加权CADD算法107

6.4.2 实验结果及分析108

参考文献112

7 基于密度加权模糊聚类分析114

7.1 模糊聚类分析114

7.1.1 模糊聚类产生114

7.1.2 模糊聚类分类115

7.1.3 模糊聚类算法优化116

7.2 模糊聚类算法117

7.2.1 模糊簇117

7.2.2 HC-means聚类算法117

7.2.3 FC-means聚类算法118

7.2.4 HCM和FCM的关系119

7.2.5 FCM算法存在问题分析120

7.3 基于密度函数加权的FCM121

7.3.1 聚类算法提出121

7.3.2 聚类算法设计122

7.3.3 实验结果及分析123

参考文献131

8 基于距离量化关联规则挖掘133

8.1 关联规则挖掘133

8.1.1 关联规则相关概念133

8.1.2 关联规则度量135

8.1.3 关联规则分类136

8.1.4 关联规则挖掘模型与步骤137

8.2 量化关联规则138

8.2.1 量化关联规则提出138

8.2.2 量化关联规则定义141

8.2.3 算法描述143

8.2.4 算法分析144

8.3 基于距离算法设计与实现146

8.3.1 算法设计146

8.3.2 数据预处理147

8.3.3 基于距离量化规则148

8.3.4 簇间关联度的度量148

8.3.5 关联度参数D0限定149

8.3.6 规则的生成151

8.4 算法实验分析151

8.4.1 系统交互界面151

8.4.2 地球化学数据分析152

8.4.3 临床医学调查数据154

参考文献154

9 基于数据场的数据挖掘技术156

9.1 数据场156

9.1.1 数据场的概念156

9.1.2 数据场主要特征157

9.1.3 数据场表达157

9.2 数据场聚类算法159

9.2.1 数据场聚类算法设计159

9.2.2 测试数据集产生160

9.2.3 位场聚类实验160

9.2.4 辐射场聚类实验161

9.2.5 参数对数据场聚类效果影响162

9.3 聚类效果实验分析164

9.3.1 模拟数据分析164

9.3.2 UCI数据集实验166

9.4 基于数据场量化关联规则挖掘170

9.4.1 常用量化关联规则挖掘方法170

9.4.2 算法相关定义171

9.4.3 算法设计与实现173

9.5 关联规则挖掘实验与分析174

9.5.1 身体脂肪bodyfat数据集174

9.5.2 临床医学数据实验测试176

参考文献177

10 基于MapReduce聚类分析179

10.1 Hadoop开源云计算平台179

10.1.1 MapReduce179

10.1.2 HDFS文件系统181

10.1.3 基于MapReduce聚类算法182

10.2 基于MapReduce K-means算法改进184

10.2.1 距离三角不等式聚类算法184

10.2.2 距离三角不等式算法设计185

10.2.3 聚类算法实验结果分析187

10.3 基于MapReduce CADD聚类算法189

10.3.1 算法设计189

10.3.2 MapReduce聚类模型190

10.3.3 聚类算法实验结果分析191

参考文献191

11 数据挖掘结果可视化表达194

11.1 可视化数据挖掘194

11.1.1 数据可视化195

11.1.2 数据挖掘过程可视化196

11.1.3 数据挖掘结果可视化196

11.1.4 交互式可视化数据挖掘197

11.2 数据可视化方法及分类198

11.2.1 基于几何的技术198

11.2.2 面向像素的技术200

11.2.3 基于图标的技术200

11.2.4 基于层次的技术201

11.3 可视化数据挖掘系统设计与实现202

11.3.1 可视化挖掘系统202

11.3.2 聚类结果可视化203

11.3.3 关联规则结果可视化206

参考文献210

12 地球化学数据挖掘(Ⅰ)212

12.1 地球化学数据处理方法212

12.1.1 传统处理方法212

12.1.2 数据挖掘方法213

12.2 地球化学数据聚类分析215

12.2.1 地球化学数据来源215

12.2.2 区域地质概况215

12.2.3 聚类分析研究218

12.2.4 靶区地球化学特征219

12.3 区域矿产资源预测223

12.3.1 地球化学异常靶区223

12.3.2 元素组合特征分析224

12.3.3 区域矿产资源预测230

参考文献231

13 地球化学数据挖掘(Ⅱ)233

13.1 区域地质形貌233

13.1.1 自然地理环境233

13.1.2 区域地质概况233

13.2 地球化学元素聚类分析236

13.2.1 数据整理和建立数据库236

13.2.2 地球化学数据聚类分析236

13.2.3 聚类结果MapGIS成图238

13.3 地球化学元素组合特征分析240

13.3.1 靶区1~4元素组合特征240

13.3.2 靶区5元素组合特征240

13.3.3 矿产资源预测241

13.4 地球化学元素模糊C-means聚类244

13.4.1 某金矿区模糊C-means聚类分析244

13.4.2 某锡矿区模糊C-means聚类分析245

13.4.3 某采样地区模糊C-means聚类分析246

参考文献247

14 资源与经济发展关系分析248

14.1 资源与经济248

14.1.1 矿产资源开发248

14.1.2 传统研究方法249

14.2 数据源与数据预处理252

14.2.1 数据的选取252

14.2.2 数据标准化253

14.3 聚类分析254

14.3.1 资源储量属性254

14.3.2 环境指标属性256

14.3.3 经济指标属性258

14.3.4 技术指标属性271

14.3.5 结论与建议274

参考文献276

热门推荐