搜索引擎以信息检索教程
搜索引擎以信息检索教程作者:袁津生 开 本:16开 书号ISBN:750845394 定价:28.0 出版时间:2008-04-01 出版社:中国水利水电出版社 |
7.2.3 nb分类算法
7.2.4 决策树分类算法
7.2.5 rocchio分类算法
7.2.6 支持向量机分类算法
7.2.7 特征选择分类算法.
7.2.8 文本分类系统的实现
7.3 常用文本聚类方法
7.3.1 层次聚类算法
7.3.2 分割聚类算法
7.3.3 基于密度的聚类算法
7.3.4 基于网格的聚类算法
7.3.5 基于模型的聚类算法
7.4 小结
思考题
第8章 web信息检索技术
8.1 web信息处理的基本技术
8.1.1 web信息的基本特点
8.1.2 web信息的表现方式
8.1.3 web信息系统结构
8.1.4 网络信息资源的组织与管理
8.2 web数据挖掘
8.2.1 web挖掘流程
8.2.2 web挖掘的分类及现状
8.2.3 web数据挖掘和web信息检索的区别
8.3 web信息检索的关键技术
8.3.1 文档搜集
8.3.2 文档预处理
8.3.3 索引数据库的建立
8.3.4 相似度计算与排序方法
8.4 搜索引擎的基本结构
8.4.1 搜索引擎的结构分类
8.4.2 网页收集模块
8.4.3 网页索引模块
8.4.4 查询模块
8.4.5 用户界面
8.4.6 搜索引擎的主要指标及分析
8.5 搜索引擎的数据结构
8.5.1 存储结构
8.5.2 信息库
8.5.3 文本索引
8.5.4 词典
8.5.5 采样表
8.5.6 前向索引
8.5.7 后向索引
8.6 搜索引擎爬虫
8.6.1 网络爬虫
8.6.2 深度优先策略
8.6.3 广度优先策略
8.6.4 不重复抓取策略
8.6.5 网页抓取优先策略
8.6.6 网页重访策略
8.6.7 网页抓取提速策略
8.6.8 robots协议
8.6.9 网页内容提取技术
8.7 元搜索引擎
8.7.1 元搜索引擎的基本构成
8.7.2 常用元搜索引擎介绍及其分类
8.7.3 与独立搜索引擎的比较
8.7.4 主要技术指标及分析
8.8 小结
思考题
第9章 搜索引擎开发技术
9.1 实例简介
9.1.1 搜索引擎的体系结构
9.1.2 网页搜集
9.1.3 网页预处理
9.1.4 查询服务
9.2 环境搭建与配置
9.2.1 idk 1.6的安装与配置
9.2.2 eclipse的安装与配置
9.2.3 tomcat的安装与配置
9.2.4 heritrix的安装与配置
9.3 网页搜集的实现
9.3.1 扩展heritrix
9.3.2 抓取网页
9.4 预处理的实现
9.4.1 原始网页的处理
9.4.2 建立索引——lucene
9.5 提供查询服务
9.5.1 搜索引擎架构设计
9.5.2 后台设计和实现
9.5.3 页面设计和实现
9.5.4 部署到tomcat
9.6 小结
实验
参考文献
社会科学 图书馆学档案学
在线阅读
- 最新内容
- 相关内容
- 网友推荐
- 图文推荐
零零教育社区:论坛热帖子
[家长教育] 孩子为什么会和父母感情疏离? (2019-07-14) |
[教师分享] 给远方姐姐的一封信 (2018-11-07) |
[教师分享] 伸缩门 (2018-11-07) |
[教师分享] 回家乡 (2018-11-07) |
[教师分享] 是风味也是人间 (2018-11-07) |
[教师分享] 一句格言的启示 (2018-11-07) |
[教师分享] 无规矩不成方圆 (2018-11-07) |
[教师分享] 第十届全国教育名家论坛有感(二) (2018-11-07) |
[教师分享] 贪玩的小狗 (2018-11-07) |
[教师分享] 未命名文章 (2018-11-07) |