大数据处理技术——R语言专利分析方法与应用
大数据处理技术——R语言专利分析方法与应用作者:屠忻主编 开 本:23cm 书号ISBN:9787513064347 定价:58.0 出版时间:2019-09-01 出版社:知识产权出版社有限责任公司 |
大数据处理技术——R语言专利分析方法与应用 本书特色
本书是一本关于大数据处理技术的图书,主要研究R语言在专利分析领域的应用方法。全书从四个方面展开:首先给出R语言快速入门需要掌握的基本知识;然后从专利分析数据处理角度出发,总结归纳用R语言处理专利数据的几种常用场景;接着结合专利分析中的数据可视化给出常用专利分析图表的R语言制图方法;*后结合数据挖掘算法介绍了利用R语言进行专利数据挖掘与建模的几种常见任务。
大数据处理技术——R语言专利分析方法与应用 内容简介
全书从四个方面展开: 首先给出R语言快速入门需要掌握的基本知识 ; 然后从专利分析数据处理角度出发, 总结归纳用R语言处理专利数据的几种常用场景 ; 接着结合专利分析中的数据可视化给出常用专利分析图表的R语言制图方法 ; *后结合数据挖掘算法介绍了利用R语言进行专利数据挖掘与建模的几种常见任务。
大数据处理技术——R语言专利分析方法与应用 目录
第1章 简 介0011.1 关于本书 001
1.1.1 为什么要撰写本书 001
1.1.2 本书的撰写原则 002
1.1.3 本书的读者对象 003
1.1.4 本书的使用方法 004
1.2 专利分析概论 004
1.2.1 专利分析基本流程 004
1.2.2 当前专利分析基本方法 010
1.2.3 专利分析的发展方向 011
1.3 数据科学概论 012
1.3.1 数据取样与探索 012
1.3.2 数据预处理与可视化 013
1.3.3 数据挖掘与建模 014
1.4 小结 014
第2章 R语言入门016
2.1 本章概述 016
2.2 R语言简介与安装 017
2.2.1 R语言简介 017
2.2.2 R安装及RStudio简介 018
2.3 R包的使用 021
2.3.1 R包的介绍 021
2.3.2 R包的安装和载入 022
2.4 常用R包及函数使用介绍 023
2.4.1 数据整理——tidyr 023
2.4.2 表格操纵——dplyr 027
2.4.3 字符处理——stringr 031
2.4.4 时间处理——lubridate 034
2.4.5 数据导入导出——openxlsx 036
2.5 R语言数据结构 037
2.5.1 向量 037
2.5.2 矩阵 038
2.5.3 数组 039
2.5.4 数据框 040
2.5.5 因子 042
2.5.6 列表 043
2.6 小结 044
第3章 专利数据处理045
3.1 本章概述 045
3.2 申请年份统计 046
3.2.1 年份申请量统计 047
3.2.2 年份国内外申请量统计 050
3.2.3 年份国别申请量统计 052
3.3 专利申请人统计 055
3.3.1 申请人专利数量统计 056
3.3.2 标准申请人清洗 058
3.3.3 申请人合作关系统计 062
3.4 技术主题统计 069
3.4.1 技术主题分布统计 069
3.4.2 技术主题占比统计 072
3.5 同族数据统计 073
3.5.1 同族数据拆分为多列 073
3.5.2 同族数据拆分为多行 076
3.6 多维数据联合统计 080
3.6.1 三维数据的联合统计 080
3.6.2 四维数据的联合统计 085
3.7 小结 086
第4章 专利数据可视化087
4.1 本章概述 087
4.2 利用ggplot2包制图 088
4.2.1 柱形(条形)图 088
4.2.2 折线(路径)图 098
4.2.3 散点(气泡)图 103
4.3 利用Highcharter包制图 108
4.3.1 圆环类图 109
4.3.2 极坐标图 113
4.3.3 矩形树图及热力图 118
4.4 利用Dygraphs包绘制交互式时序图 121
4.4.1 折线时序图 122
4.4.2 折线 条形时序图 123
4.4.3 堆叠条形 折线时序图 124
4.5 利用Circlelize包制图 126
4.5.1 申请人合作关系弦图 126
4.5.2 五局技术流向弦图 128
4.5.3 条形跑道图 132
4.6 专利地图的绘制 134
4.6.1 基于baidumap和Remap包绘制地图 135
4.6.2 专利地图与其他图表的结合 140
4.7 利用NetworkD3包制图 145
4.7.1 力导图 145
4.7.2 网络图 152
4.8 小结 155
第5章 专利数据挖掘与建模156
5.1 本章概述 156
5.2 数据挖掘基础 157
5.2.1 数据挖掘的基本任务 157
5.2.2 数据挖掘建模的过程 158
5.3 变量主成分分析 159
5.3.1 问题背景 159
5.3.2 主成分分析方法 160
5.4 聚类分析 166
5.4.1 问题背景 166
5.4.2 K-means聚类分析 166
5.5 分类与预测分析 173
5.5.1 问题背景 173
5.5.2 人工神经网络算法 174
5.5.3 支持向量机算法 181
5.5.4 朴素贝叶斯算法 185
5.6 小结 189
附录A 本书代码索引190
附录B 本书用到的扩展包192
附录C R语言学习资源195
参考文献198
法律 民法 知识产权
在线阅读
- 最新内容
- 相关内容
- 网友推荐
- 图文推荐
零零教育社区:论坛热帖子
[家长教育] 孩子为什么会和父母感情疏离? (2019-07-14) |
[教师分享] 给远方姐姐的一封信 (2018-11-07) |
[教师分享] 伸缩门 (2018-11-07) |
[教师分享] 回家乡 (2018-11-07) |
[教师分享] 是风味也是人间 (2018-11-07) |
[教师分享] 一句格言的启示 (2018-11-07) |
[教师分享] 无规矩不成方圆 (2018-11-07) |
[教师分享] 第十届全国教育名家论坛有感(二) (2018-11-07) |
[教师分享] 贪玩的小狗 (2018-11-07) |
[教师分享] 未命名文章 (2018-11-07) |