经典原版书库数据挖掘导论(英文版.原书第2版)/[美]陈封能
经典原版书库数据挖掘导论(英文版.原书第2版)/[美]陈封能作者:[美]陈封能(Pang-NingTan) 开 本:16开 书号ISBN:9787111637882 定价: 出版时间:2018-01-01 出版社:机械工业出版社 |
4.10.7 组合方法的实验比较 312
4.11 类不平衡问题 313
4.11.1 类不平衡的分类器构建 314
4.11.2 带类不平衡的性能评估 318
4.11.3 寻找*优的评分阈值 322
4.11.4 综合评估性能 323
4.12 多类问题 330
4.13 文献注释 333
4.14 习题 345
第5章 关联分析:基本概念和算法 357
5.1 预备知识 358
5.2 频繁项集的产生 362
5.2.1 先验原理 363
5.2.2 Apriori算法的频繁项集产生 364
5.2.3 候选项集的产生与剪枝 368
5.2.4 支持度计数 373
5.2.5 计算复杂度 377
5.3 规则的产生 380
5.3.1 基于置信度的剪枝 380
5.3.2 Apriori算法中规则的产生 381
5.3.3 示例:美国国会投票记录 382
5.4 频繁项集的紧凑表示 384
5.4.1 极大频繁项集 384
5.4.2 闭项集 386
*5.5 其他产生频繁项集的方法 389
*5.6 FP增长算法 393
5.6.1 FP树表示法 394
5.6.2 FP增长算法的频繁项集产生 397
5.7 关联模式的评估 401
5.7.1 兴趣度的客观度量 402
5.7.2 多个二元变量的度量 414
5.7.3 辛普森悖论 416
5.8 倾斜支持度分布的影响 418
5.9 文献注释 424
5.10 习题 438
第6章 关联分析:高级概念 451
6.1 处理分类属性 451
6.2 处理连续属性 454
6.2.1 基于离散化的方法 454
6.2.2 基于统计学的方法 458
6.2.3 非离散化方法 460
6.3 处理概念分层 462
6.4 序列模式 464
6.4.1 预备知识 465
6.4.2 序列模式发现 468
* 6.4.3 时限约束 473
* 6.4.4 可选计数方案 477
6.5 子图模式 479
6.5.1 预备知识 480
6.5.2 频繁子图挖掘 483
6.5.3 候选生成 487
6.5.4 候选剪枝 493
6.5.5 支持度计数 493
*6.6 非频繁模式 493
6.6.1 负模式 494
6.6.2 负相关模式 495
6.6.3 非频繁模式、负模式和负相关模式比较 496
6.6.4 挖掘有趣的非频繁模式的技术 498
6.6.5 基于挖掘负模式的技术 499
6.6.6 基于支持度期望的技术 501
6.7 文献注释 505
6.8 习题 510
第7章 聚类分析:基本概念和算法 525
7.1 概述 528
7.1.1 什么是聚类分析 528
7.1.2 聚类的不同类型 529
7.1.3 簇的不同类型 531
7.2 K均值 534
7.2.1 K均值算法 535
7.2.2 K均值:附加的问题 544
7.2.3 二分K均值 547
7.2.4 K均值和不同的簇类型 548
7.2.5 优点与缺点 549
7.2.6 K均值作为优化问题 549
7.3 凝聚层次聚类 554
7.3.1 基本凝聚层次聚类算法 555
7.3.2 特殊技术 557
7.3.3 簇邻近度的Lance-Williams公式 562
7.3.4 层次聚类的主要问题 563
7.3.5 离群点 564
7.3.6 优点与缺点 565
7.4 DBSCAN 565
7.4.1 传统的密度:基于中心的方法 565
7.4.2 DBSCAN算法 567
7.4.3 优点与缺点 569
7.5 簇评估 571
7.5.1 概述 571
7.5.2 无监督簇评估:使用凝聚度和分离度 574
7.5.3 无监督簇评估:使用邻近度矩阵 582
7.5.4 层次聚类的无监督评估 585
7.5.5 确定正确的簇个数 587
7.5.6 聚类趋势 588
7.5.7 簇有效性的监督度量 589
7.5.8 评估簇有效性度量的显著性 594
7.5.9 簇有效性度量的选择 596
7.6 文献注释 597
7.7 习题 603
第8章 聚类分析:其他问题与算法 613
8.1 数据、簇和聚类算法的特性 614
8.1.1 示例:比较K均值和DBSCAN 614
8.1.2 数据特性 615
8.1.3 簇特性 617
8.1.4 聚类算法的一般特性 619
8.2 基于原型的聚类 621
8.2.1 模糊聚类 621
8.2.2 使用混合模型的聚类 627
8.2.3 自组织映射 637
8.3 基于密度的聚类 644
8.3.1 基于网格的聚类 644
8.3.2 子空间聚类 648
8.3.3 DENCLUE:基于密度聚类的一种基于核的方案 652
8.4 基于图的聚类 656
8.4.1 稀疏化 657
8.4.2 *小生成树聚类 658
8.4.3 OPOSSUM:使用METIS的稀疏相似度*优划分 659
8.4.4 Chameleon:使用动态建模的层次聚类 660
8.4.5 谱聚类 666
8.4.6 共享*近邻相似度 673
8.4.7 Jarvis-Patrick聚类算法 676
8.4.8 SNN密度 678
8.4.9 基于SNN密度的聚类 679
8.5 可伸缩的聚类算法 681
8.5.1 可伸缩:一般问题和方法 681
8.5.2 BIRCH 684
8.5.3 CURE 686
8.6 使用哪种聚类算法 690
8.7 文献注释 693
8.8 习题 699
第9章 异常检测 703
9.1 异常检测问题的特性 705
9.1.1 异常的定义 705
9.1.2 数据的性质 706
9.1.3 如何使用异常检测 707
9.2 异常检测方法的特性 708
9.3 统计方法 710
9.3.1 使用参数模型 710
9.3.2 使用非参数模型 714
9.3.3 对正常类和异常类建模 715
9.3.4 评估统计意义 717
9.3.5 优点与缺点 718
9.4 基于邻近度的方法 719
9.4.1 基于距离的异常分数 719
9.4.2 基于密度的异常分数 720
9.4.3 基于相对密度的异常分数 722
9.4.4 优点与缺点 723
9.5 基于聚类的方法 724
9.5.1 发现异常簇 724
9.5.2 发现异常实例 725
9.5.3 优点与缺点 728
9.6 基于重构的方法 728
9.7 单类分类 732
9.7.1 核函数的使用 733
9.7.2 原点技巧 734
9.7.3 优点与缺点 738
9.8 信息论方法 738
9.9 异常检测评估 740
9.10 文献注释 742
9.11 习题 749
第10章 避免错误发现 755
10.1 预备知识:统计检验 756
10.1.1 显著性检验 756
10.1.2 假设检验 761
10.1.3 多重假设检验 767
10.1.4 统计检验中的陷阱 776
10.2 对零分布和替代分布建模 778
教材 研究生/本科/专科教材 工学
在线阅读
- 最新内容
- 相关内容
- 网友推荐
- 图文推荐
零零教育社区:论坛热帖子
[家长教育] 孩子为什么会和父母感情疏离? (2019-07-14) |
[教师分享] 给远方姐姐的一封信 (2018-11-07) |
[教师分享] 伸缩门 (2018-11-07) |
[教师分享] 回家乡 (2018-11-07) |
[教师分享] 是风味也是人间 (2018-11-07) |
[教师分享] 一句格言的启示 (2018-11-07) |
[教师分享] 无规矩不成方圆 (2018-11-07) |
[教师分享] 第十届全国教育名家论坛有感(二) (2018-11-07) |
[教师分享] 贪玩的小狗 (2018-11-07) |
[教师分享] 未命名文章 (2018-11-07) |