经典原版书库数据挖掘导论(英文版.原书第2版)/[美]陈封能
经典原版书库数据挖掘导论(英文版.原书第2版)/[美]陈封能作者:[美]陈封能(Pang-NingTan) 开 本:16开 书号ISBN:9787111637882 定价: 出版时间:2018-01-01 出版社:机械工业出版社 |
经典原版书库数据挖掘导论(英文版.原书第2版)/[美]陈封能 本书特色
本书从算法的角度介绍数据挖掘所使用的主要原理与技术。为了更好地理解数据挖掘技术如何用于各种类型的数据,研究这些原理与技术是至关重要的。
本书所涵盖的主题包括:数据预处理、预测建模、关联分析、聚类分析、异常检测和避免错误发现。通过介绍每个主题的基本概念和算法,为读者提供将数据挖掘应用于实际问题所需的必要背景以及使用方法。
经典原版书库数据挖掘导论(英文版.原书第2版)/[美]陈封能 内容简介
本书从算法的角度介绍数据挖掘所使用的主要原理与技术。为了更好地理解数据挖掘技术如何用于各种类型的数据,研究这些原理与技术是至关重要的。 本书所涵盖的主题包括:数据预处理、预测建模、关联分析、聚类分析、异常检测和避免错误发现。通过介绍每个主题的基本概念和算法,为读者提供将数据挖掘应用于实际问题所需的必要背景以及使用方法。
经典原版书库数据挖掘导论(英文版.原书第2版)/[美]陈封能 目录
第1章 绪论 11.1 什么是数据挖掘 4
1.2 数据挖掘要解决的问题 5
1.3 数据挖掘的起源 7
1.4 数据挖掘任务 9
1.5 本书组织结构 13
1.6 文献注释 15
1.7 习题 21
第2章 数据 23
2.1 数据类型 26
2.1.1 属性与度量 27
2.1.2 数据集的类型 34
2.2 数据质量 42
2.2.1 测量和数据收集问题 42
2.2.2 关于应用的问题 49
2.3 数据预处理 50
2.3.1 聚集 51
2.3.2 抽样 52
2.3.3 维归约 56
2.3.4 特征子集选择 58
2.3.5 特征创建 61
2.3.6 离散化和二元化 63
2.3.7 变量变换 69
2.4 相似性和相异性的度量 71
2.4.1 基础 72
2.4.2 简单属性之间的相似度和相异度 74
2.4.3 数据对象之间的相异度 76
2.4.4 数据对象之间的相似度 78
2.4.5 邻近度度量的例子 79
2.4.6 互信息 88
* 2.4.7 核函数 90
* 2.4.8 Bregman散度 94
2.4.9 邻近度计算问题 96
2.4.10 选择正确的邻近度度量 98
2.5 文献注释 100
2.6 习题 105
第3章 分类:基本概念和技术 113
3.1 基本概念 114
3.2 一般的分类框架 117
3.3 决策树分类器 119
3.3.1 构建决策树的基本算法 121
3.3.2 表示属性测试条件的方法 124
3.3.3 选择属性测试条件的方法 127
3.3.4 决策树归纳算法 136
3.3.5 示例:Web机器人检测 138
3.3.6 决策树分类器的特征 140
3.4 模型的过拟 147
3.5 模型选择 156
3.5.1 验证集应用 156
3.5.2 模型复杂度合并 157
3.5.3 统计范围估计 162
3.5.4 决策树的模型选择 162
3.6 模型评估 164
3.6.1 保持方法 165
3.6.2 交叉验证 165
3.7 超参数的使用 168
3.7.1 超参数选择 168
3.7.2 嵌套交叉验证 170
3.8 模型选择和评估中的陷阱 172
3.8.1 训练集和测试集之间的重叠 172
3.8.2 使用验证错误率作为泛化错误率
*3.9 模型比较 173
3.9.1 估计准确率的置信区间 174
3.9.2 比较两个模型的性能 175
3.10 文献注释 176
3.11 习题 185
第4章 分类:其他技术 193
4.1 分类器的种类 193
4.2 基于规则的分类器 195
4.2.1 基于规则的分类器原理 197
4.2.2 规则集的属性 198
4.2.3 规则提取的直接方法 199
4.2.4 规则提取的间接方法 204
4.2.5 基于规则的分类器的特点 206
4.3 *近邻分类器 208
4.3.1 算法 209
4.3.2 *近邻分类器的特点 210
4.4 朴素贝叶斯分类器 212
4.4.1 概率论基础 213
4.4.2 朴素贝叶斯假设 218
4.5 贝叶斯网络 227
4.5.1 图表示 227
4.5.2 推理与学习 233
4.5.3 贝叶斯网络的特点 242
4.6 logistic回归 243
4.6.1 logistic回归用作广义线性模型 244
4.6.2 学习模型参数 245
4.6.3 logistic回归模型的特点 248
4.7 人工神经网络 249
4.7.1 感知机 250
4.7.2 多层神经网络 254
4.7.3 人工神经网络的特点 261
4.8 深度学习 262
4.8.1 使用协同损失函数 263
4.8.2 使用响应激活函数 266
4.8.3 正则化 268
4.8.4 模型参数的初始化 271
4.8.5 深度学习的特点 275
4.9 支持向量机 276
4.9.1 分离超平面的边缘 276
4.9.2 线性SVM 278
4.9.3 软边缘SVM 284
4.9.4 非线性SVM 290
4.9.5 SVM的特点 294
4.10 组合方法 296
4.10.1 组合方法的基本原理 297
4.10.2 构建组合分类器的方法 297
4.10.3 偏置–方差分解 300
4.10.4 装袋 302
4.10.5 提升 305
4.10.6 随机森林 310
教材 研究生/本科/专科教材 工学
在线阅读
- 最新内容
- 相关内容
- 网友推荐
- 图文推荐
零零教育社区:论坛热帖子
[家长教育] 孩子为什么会和父母感情疏离? (2019-07-14) |
[教师分享] 给远方姐姐的一封信 (2018-11-07) |
[教师分享] 伸缩门 (2018-11-07) |
[教师分享] 回家乡 (2018-11-07) |
[教师分享] 是风味也是人间 (2018-11-07) |
[教师分享] 一句格言的启示 (2018-11-07) |
[教师分享] 无规矩不成方圆 (2018-11-07) |
[教师分享] 第十届全国教育名家论坛有感(二) (2018-11-07) |
[教师分享] 贪玩的小狗 (2018-11-07) |
[教师分享] 未命名文章 (2018-11-07) |