数据科学理论与实践-(第2版)
数据科学理论与实践-(第2版)作者:朝乐门 开 本:16开 书号ISBN:9787302531913 定价: 出版时间:2019-09-01 出版社:清华大学 |
表目录
表1?1结构化数据、非结构化数据与半结构化数据的区别与联系5 表1?2某数据科学家的画像(Profile)37 表2?1参数估计与假设检验的主要区别53 表2?2统计学与机器学习的术语对照表57 表2?3机器学习的相关学科61 表2?4已知6部电影的类型及其中出现的接吻次数和打斗次数64 表2?5已知电影与未知电影的距离64 表2?6分析学习和归纳学习的比较70 表2?7Anscombe的四组数据(Anscombe?s Quartet)76 表3?1测试数据A86 表3?2测试数据B86 表3?3测试数据C86 表3?4Pew论坛部分人员信仰与收入数据统计(规整化处理之前)87 表3?5Pew论坛部分人员信仰与收入数据统计(规整化处理之后)87 表3?6探索性统计中常用的集中趋势统计量89 表3?7探索性统计中常用的离散程度统计量89 表3?8探索性统计中常用的数据分布统计量89 表3?9常见的数据变换策略97 表3?10十进制**数字的使用概率103 表3?11数据分析中常见错误109 表3?12数据类型及所支持的操作类型118 表3?13数据类型与视觉通道的对应关系118 表3?14数据故事化描述应遵循的基本原则128 表3?15数据科学项目中的主要角色及其任务130 表4?1Transformation常用函数166 表4?2Action常用函数166 表4?3RDD的存储级别167 表4?4Spark数据类型和R数据类型之间的映射关系170 表4?5较有代表性的云数据库产品174 表4?6NoSQL数据库中常用的数据模型175 表4?7R与Python对比186 表4?8云计算的基本类型189 表4?9排名前10位数据科学产品的使用率及变化情况/4 表5?1数据转换与数据加工的区别202 表5?2Google公司的十大产品与服务202 表5?3数据管理成熟度模型的过程域分类226 表5?4信息系统安全等级及保护基本要求237 表5?5肾结石治疗数据分析——两种治疗方案的分别统计240 表5?6两种治疗方案的汇总统计240 表6?1数据集women248 表6?2Protein数据集266 表6?3工资信息274 表6?4各字段的名称及含义292 表A?1Spark版本差异性331 表A?2Spark与R的数据类型对比332 表A?3SparkR与sparklyr比较340
数据科学理论与实践-(第2版) 作者简介
中国人民大学副教授,博士生导师;国家精品在线开放课程《数据科学导论》负责人;中国计算机学会信息系统专委员会委员、中国软件行业协会中国软件专业人才培养工程专家委员、全国高校人工智能与大数据创新联盟专家委员会副主任、全国高校大数据教育联盟大数据教材专家指导委员会委员;
教材 研究生/本科/专科教材
在线阅读
- 最新内容
- 相关内容
- 网友推荐
- 图文推荐
上一篇:税务会计学-(第13版)
下一篇:中国近代文学发展史
零零教育社区:论坛热帖子
[家长教育] 孩子为什么会和父母感情疏离? (2019-07-14) |
[教师分享] 给远方姐姐的一封信 (2018-11-07) |
[教师分享] 伸缩门 (2018-11-07) |
[教师分享] 回家乡 (2018-11-07) |
[教师分享] 是风味也是人间 (2018-11-07) |
[教师分享] 一句格言的启示 (2018-11-07) |
[教师分享] 无规矩不成方圆 (2018-11-07) |
[教师分享] 第十届全国教育名家论坛有感(二) (2018-11-07) |
[教师分享] 贪玩的小狗 (2018-11-07) |
[教师分享] 未命名文章 (2018-11-07) |