这就是搜索引擎核心技术详解 内容简介
搜索引擎作为互联网发展中至关重要的一种应用,已经成为互联网各个领域的制高点,其重要性不言而喻。搜索引擎领域也是互联网应用中不多见的以核心技术作为其命脉的领域,搜索引擎各个子系统是如何设计的?这成为广大技术人员和搜索引擎优化人员密切关注的内容。
本书的*大特点是内容新颖全面而又通俗易懂。对于实际搜索引擎所涉及的各种核心技术都有全面细致的介绍,除了作为搜索系统核心的网络爬虫、索引系统、排序系统、链接分析及用户分析外,还包括网页反作弊、缓存管理、网页去重技术等实际搜索引擎必须关注的技术,同时用相当大的篇幅讲解了云计算与云存储的核心技术原理。另外,本书也密切关注搜索引擎发展的前沿技术:google的咖啡因系统及megastore等云计算新技术、百度的暗网抓取技术阿拉丁计划、内容农场作弊、机器学习排序等。诸多新技术在相关章节都有详细讲解,同时对于社会化搜索、实时搜索及情境搜索等搜索引擎的未来发展方向做了技术展望。为了增进读者的理解,全书大量引入形象的图片来讲解算法原理,相信读者会发现原来搜索引擎的核心技术理解起来比原先想象的要简单得多。
这就是搜索引擎核心技术详解 目录
第1章 搜索引擎及其技术架构
1.1 搜索引擎为何重要
1.1.1 互联网的发展
1.1.2 商业搜索引擎公司的发展
1.1.3 搜索引擎的重要地位
1.2 搜索引擎技术发展史
1.2.1 史前时代:分类目录的一代
1.2.2 **代:文本检索的一代
1.2.3 第二代:链接分析的一代
1.2.4 第三代:用户中心的一代
1.3 搜索引擎的3个目标
1.4 搜索引擎的3个核心问题
1.4.1 3个核心问题
1.4.2 与技术发展的关系
1.5 搜索引擎的技术架构
|