基于Web挖掘的个性化信息推荐 本书特色
本书在总结国内外个性化信息推荐相关理论与方法的基础上,将web挖掘理论与方法应用到个性化信息推荐中,并利用全信息理论和信息运动过程模型,对基于web挖掘的个性化信息推荐机理与方法展开研究。全书共分9个章节,具体内容包括基于web挖掘的个性化信息推荐机理、语法层次的web用户偏好分析与推荐、基于网络书签的个性化信息推荐方法、语义层次的基于web文本挖掘的推荐规则获取与匹配等。可供各大专院校作为教材使用,也可供从事相关工作的人员作为参考用书使用。
基于Web挖掘的个性化信息推荐 内容简介
基于web挖掘的个性化信息推荐是解决当前互联网“信息过载”问题的重要手段之一。本书在继承国内外相关研究成果的基础上,建立了基于web挖掘的个性化信息推荐模型,并构建了语法层次、语义层次和语用层次的个性化信息推荐方法体系。然后,从语法层次的角度,利用web使用挖掘方法研究了web用户偏好分析与推荐问题,并借鉴复杂网络中的社团结构划分方法,提出了基于网络书签的个性化信息推荐方法;从语义层次的角度,提出了基于web文本挖掘的推荐规则获取与匹配方法,分析了基于web领域本体的个性化信息推荐方法,研究了基于社会化标签的web用户兴趣建模方法;从语用层次的角度,利用用户反馈和贝叶斯网络理论讨论了web用户效用函数的构建方法。
本书内容丰富、应用性强,可供信息管理、计算机应用等领域从事相关研究的专家学者、工程技术人员及高等院校相关专业教师、研究生参考使用。
基于Web挖掘的个性化信息推荐 目录
总序
序
前言
第1章 绪论
1.1 本书研究背景
1.2 本书研究目的与意义
1.2.1 本书研究目的
1.2.2 本书研究意义
1.3 国内外研究现状
1.3.1 web挖掘研究现状
1.3.2 个性化信息推荐研究现状
1.4 本书研究内容与方法
1.4.1 本书研究内容
1.4.2 本书的研究方法
第2章 研究对象及问题界定
2.1 数据挖掘与web挖掘
2.1.1 数据挖掘
2.1.2 web挖掘
2.2 个性化与个性化信息推荐
2.2.1 个性化相关概念
2.2.2 个性化信息推荐
2.3 基于web挖掘的个性化信息推荐流程
2.3.1 数据输入
2.3.2 数据预处理
2.3.3 模式分析
2.3.4 在线推荐
第3章 基于web挖掘的个性化信息推荐机理
3.1 全信息理论与信息过程模型
3.1.1 全信息理论
3.1.2 信息过程模型
3.2 基于全信息的“点击流”信息运动过程模型
3.2.1 “点击流”的含义
3.2.2 “点击流”信息的层次
3.2.3 “点击流”信息运动过程模型
3.3 “点击流”信息运动视角的个性化信息推荐模型
3.3.1 “点击流”信息获取——捕获web用户点击行为
3.3.2 “点击流”信息认知——提取web用户点击行为模式
3.3.3 “点击流”信息再生——产生个性化信息推荐策略
3.3.4 “点击流”信息施效——实施个性化信息推荐策略
3.4 基于web挖掘的个性化信息推荐的方法体系
3.4.1 语法层次的个性化信息推荐方法
3.4.2 语义层次的个性化信息推荐方法
3.4.3 语用层次的个性化信息推荐方法
第4章 语法层次的web用户偏好分析与推荐
4.1 语法层次的web用户偏好分析与推荐框架
4.2 web交易事务集的提取
4.2.1 数据过滤
4.2.2 用户识别
4.2.3 会话识别
4.2.4 路径补充
4.3 基于web交易事务聚类的web用户偏好分析
4.3.1 交易事务的表示
4.3.2 交易事务聚类
4.3.3 导出web使用文档
4.3.4 生成web用户偏好页面集
4.4 基于频繁web页面集的web用户偏好视图
4.4.1 提取频繁web页面集
4.4.2 生成web用户偏好视图
第5章 基于网络书签的个性化信息推荐方法
5.1 web 2.0与网络书签
5.1.1 web 2.0概述
5.1.2 网络书签概述
5.2 基于网络书签的社团结构划分
5.2.1 社团结构的定义
5.2.2 网络书签系统模型
5.2.3 基于cpm算法的社团结构划分
5.2.4 实验分析
5.3 网络书签系统中基于社团结构的个性化信息推荐
5.3.1 社团内基于协作过滤的个性化信息推荐
5.3.2 社团间基于“信息桥”的个性化信息推荐
5.3.3 实验分析
第6章 语义层次的基于web文本挖掘的推荐规则获取与匹配
6.1 基于web文本挖掘的推荐规则获取与匹配模型
6.2 基于向量空间模型的web文本表示
6.2.1 web页面的净化
6.2.2 web文本特征粒度的选择
6.2.3 web文本特征的提取
6.2.4 web文本特征的选择
6.3 基于web特征词条聚类的文本挖掘
6.3.1 交易事务的特征词条表示
6.3.2 基于特征词条的交易事务聚类
6.3.3 导出web文本文档
6.3.4 生成匹配文档
6.4 web文本关联规则获取与匹配
6.4.1 基于关联规则的频繁web特征词条集
6.4.2 生成匹配文档
第7章 整合web语义知识的个性化信息推荐方法
7.1 整合web语义知识的个性化信息推荐概述
7.1.1 整合web语义知识的个性化信息推荐框架
7.1.2 整合web语义知识的个性化信息推荐方法的优势
7.2 本体的基本理论
7.2.1 本体的概念与特点
7.2.2 本体的分类
7.2.3 本体的建模元语
7.2.4 本体的表示方法
7.3 web领域本体的构建
7.3.1 本体构建的一般方法
7.3.2 web领域本体的构建过程
7.4 基于web领域本体的个性化信息推荐方法
7.4.1 导出语义层次的web使用文档
7.4.2 生成个性化推荐web页面集
第8章 基于社会化标签的web用户兴趣建模
8.1 社会化标签概述
8.1.1 社会化标签的起源
8.1.2 社会化标签系统模型
8.1.3 社会化标签系统的特点与不足
8.2 基于社会化标签聚类的web用户兴趣模型
8.2.1 基于社会化标签的向量空间模型
8.2.2 基于密度聚类的web用户兴趣模型
8.2.3 实验分析
8.3 基于社会化标签网络的web用户兴趣模型
8.3.1 社会网络分析概述
8.3.2 web用户的社会化标签网络模型
8.3.3 基于sna的社会化标签网络分析
8.3.4 web用户兴趣建模与个性化信息推荐
第9章 语用层次的web用户效用函数构建
9.1 引言
9.1.1 语用层次的个性化信息推荐方法的核心问题
9.1.2 面向此次web站点访问的web用户效用函数构建方法
9.2 基于用户反馈的效用函数
9.2.1 用户反馈
9.2.2 基于用户显式反馈的效用函数
9.2.3 基于用户隐式反馈的效用函数
9.3 基于贝叶斯网络学习机制的效用函数构建
9.3.1 贝叶斯网络
9.3.2 基于一般web用户效用函数的先验贝叶斯网络构建
9.3.3 基于一般web用户效用函数的贝叶斯网络学习
参考文献
后记
基于Web挖掘的个性化信息推荐 节选
基于Web挖掘的个性化信息推荐是解决当前互联网“信息过载”问题的重要手段之一。《基于Web挖掘的个性化信息推荐》在继承国内外相关研究成果的基础上,建立了基于Web挖掘的个性化信息推荐模型,并构建了语法层次、语义层次和语用层次的个性化信息推荐方法体系。然后,从语法层次的角度,利用Web使用挖掘方法研究了Web用户偏好分析与推荐问题,并借鉴复杂网络中的社团结构划分方法,提出了基于网络书签的个性化信息推荐方法;从语义层次的角度,提出了基于Web文本挖掘的推荐规则获取与匹配方法,分析了基于Web领域本体的个性化信息推荐方法,研究了基于社会化标签的Web用户兴趣建模方法;从语用层次的角度,利用用户反馈和贝叶斯网络理论讨论了Web用户效用函数的构建方法。《基于Web挖掘的个性化信息推荐》内容丰富、应用性强,可供信息管理、计算机应用等领域从事相关研究的专家学者、工程技术人员及高等院校相关专业教师、研究生参考使用。
基于Web挖掘的个性化信息推荐 相关资料
插图:美国未来学家奈斯比特说过:我们在信息海洋中淹溺,但却不得不面临知识饥渴。这形象地描绘了目前人们在互联网时代所处的困境:一方面是日益泛滥的信息,另一方面却是有用知识的缺失。由此,Web用户获取信息的机会成本不断上升,迫切需要从这些纷繁芜杂的信息中找到有用知识的工具。鉴于数据挖掘的日益成熟和完善,人们自然而然想到要把数据挖掘技术应用到Web上来,即将数据挖掘的思想和方法应用于Web,利用Web挖掘从Web文档和Web活动中提取感兴趣的、潜在的、有用的模式和隐含信息。Web信息的多样性决定了Web挖掘的多样性。根据处理对象的不同,可以将Web挖掘分为三类:Web内容挖掘、Web结构挖掘和Web使用挖掘。Web内容挖掘是指从Web文件的内容及其描述中获取有用信息的过程,可以用于Web页面特征提取、基于内容的Web页面聚类、Web页面之间内容的关联规则发现等;Web结构挖掘是从WWW的组织结构和链接结构中发现知识的过程,可用于Web页面分类,并由此获得有关不同Web页面之间相似度及关联度的信息,并有助于发现权威Web站点;Web使用挖掘是从Web站点服务器日志中发现有用知识和模式的过程。Web站点服务器日志记录了Web用户的行为轨迹,分析这些数据可以帮助理解Web用户的行为,从而提供个性化信息服务。3.Web挖掘的复杂性分析相对于面向数据库的数据挖掘而言,面向Web的数据挖掘要复杂得多,主要表现在以下三个方面。1)Web用户的复杂性。相对传统的数据库应用系统而言Web信息系统面对的是一个广泛的、形形色色的Web用户群体,几乎覆盖了社会的各个领域和阶层。然而,每个Web用户可能有不同的背景、兴趣和目的,他们往往对需要挖掘的主题只有一个粗浅的认识,提不出明确的目标。这就需要Web挖掘具有较强的智能性,不断跟踪Web用户的兴趣,简单明了地提供挖掘结果。2)半结构化的数据源。每个Web站点都是异构的数据源,使得整个互联网可以看做一个巨大的异构数据库环境。针对这种数据集合进行数据挖掘,首先必须解决Web站点之间异构数据的集成问题。此外,还要解决Web上的数据查询问题,否则对这些数据进行分析、集成、处理就无从谈起。由此,就需要定义一个半结构化数据模型,并借助半结构化模型提取技术,自动从现有数据中提取半结构化模型(刘智等,2001)。
基于Web挖掘的个性化信息推荐 作者简介
易明,1978年生,湖北黄冈人。华中科技大学管理科学与工程专业博士,武汉大学图书馆、情报与档案管理在站博士后。华中师范大学信息管理系副教授,情报学专业硕士生导师。主要从事web挖掘与信息服务、社会网络与知识管理等领域的研究。主持教育部人文社会科学研究青年基金项目1项、全国高等学校教学研究中心项目1项,参加国家级、省部级项目6项。主编出版《客户关系管理》、《电子商务概论》等教材。在《中国图书馆学报》、《情报学报》,《中国管理科学》、《图书情报工作》、《情报科学》、《现代图书情报技术》等国内刊物公开发表论文30余篇,l收录1篇,ISTP收录3篇。编者简介:王伟军,华中师范大学教授、博士生导师。现任华中师范大学信息管理系副主任;华中师范大学教学委员会委员、学位评定委员会管理学分会委员、知识管理与知识服务研究中心主任;兼任教育部高等学校图书馆学科教学指导委员会委员,中国索引学会常务理事,中国社会科学情报学会理事,中国信息经济学会电子商务专业委员会副秘书长,湖北省电子商务学会常务理事、副秘书长,湖北省信息学会常务理事;《情报科学》、《评价与管理》、《湖北信息化》等杂志的编委和《情报资料工作》学术指导委员会委员;曾担任第七届IFIP电子商务、电子服务与电子社会(13E2007)国际会议主席。2007年入选教育部新世纪优秀人才支持计划。一直从事信息资源管理、知识管理与知识服务,电子商务等领域的教学和研究工作;公开发表学术论文80余篇,出版著作嘟(含合著);近5年来,主持或参与国家自然科学基金、国家社会科学基金,国家“863”计划、教育部高等学校学科创新引智计划、教育部人文社会科学研究和武汉市社会科学基金等10多项课题;曾荣获湖北省社会科学优秀成果一等奖和三等奖、湖北省自然科学优秀学术论文三等奖,第六届全国多媒体课件大赛优秀奖、武汉市社会科学优秀科研成果奖等多项奖励。