数据科学理论与实践-(第2版)

首页 > 图书 > 教材教辅/2020-09-23 / 加入收藏 / 阅读 [打印]
数据科学理论与实践-(第2版)

数据科学理论与实践-(第2版)

作者:朝乐门

开 本:16开

书号ISBN:9787302531913

定价:

出版时间:2019-09-01

出版社:清华大学


表目录
表1?1结构化数据、非结构化数据与半结构化数据的区别与联系5 表1?2某数据科学家的画像(Profile)37 表2?1参数估计与假设检验的主要区别53 表2?2统计学与机器学习的术语对照表57 表2?3机器学习的相关学科61 表2?4已知6部电影的类型及其中出现的接吻次数和打斗次数64 表2?5已知电影与未知电影的距离64 表2?6分析学习和归纳学习的比较70 表2?7Anscombe的四组数据(Anscombe?s Quartet)76 表3?1测试数据A86 表3?2测试数据B86 表3?3测试数据C86 表3?4Pew论坛部分人员信仰与收入数据统计(规整化处理之前)87 表3?5Pew论坛部分人员信仰与收入数据统计(规整化处理之后)87 表3?6探索性统计中常用的集中趋势统计量89 表3?7探索性统计中常用的离散程度统计量89 表3?8探索性统计中常用的数据分布统计量89 表3?9常见的数据变换策略97 表3?10十进制**数字的使用概率103 表3?11数据分析中常见错误109 表3?12数据类型及所支持的操作类型118 表3?13数据类型与视觉通道的对应关系118 表3?14数据故事化描述应遵循的基本原则128 表3?15数据科学项目中的主要角色及其任务130 表4?1Transformation常用函数166 表4?2Action常用函数166 表4?3RDD的存储级别167 表4?4Spark数据类型和R数据类型之间的映射关系170 表4?5较有代表性的云数据库产品174 表4?6NoSQL数据库中常用的数据模型175 表4?7R与Python对比186 表4?8云计算的基本类型189 表4?9排名前10位数据科学产品的使用率及变化情况/4 表5?1数据转换与数据加工的区别202 表5?2Google公司的十大产品与服务202 表5?3数据管理成熟度模型的过程域分类226 表5?4信息系统安全等级及保护基本要求237 表5?5肾结石治疗数据分析——两种治疗方案的分别统计240 表5?6两种治疗方案的汇总统计240 表6?1数据集women248 表6?2Protein数据集266 表6?3工资信息274 表6?4各字段的名称及含义292 表A?1Spark版本差异性331 表A?2Spark与R的数据类型对比332 表A?3SparkR与sparklyr比较340

数据科学理论与实践-(第2版) 作者简介

中国人民大学副教授,博士生导师;国家精品在线开放课程《数据科学导论》负责人;中国计算机学会信息系统专委员会委员、中国软件行业协会中国软件专业人才培养工程专家委员、全国高校人工智能与大数据创新联盟专家委员会副主任、全国高校大数据教育联盟大数据教材专家指导委员会委员;

数据科学理论与实践-(第2版)

 2/2   首页 上一页 1 2

教材 研究生/本科/专科教材

在线阅读

  • 最新内容
  • 相关内容
  • 网友推荐
  • 图文推荐