快速发展的现代互联网在带给人们大量信息的同时,也不可避免地产生了难以让用户快速获取有效信息的问题。作为一种常见的Web信息资源检索工具,搜索引擎13益受到人们的关注并得到广泛的使用。
本书共分为6章,第1章对相关技术和概念做了介绍,包括Web信息检索、Web挖掘和web个性化信息推荐服务等。第2章对网页权重分析技术从网页质量和网页相关度两个角度做出了说明。第3章对目前个性化搜索引擎的研究现状和相关概念进行了分析,也分析了这些技术所存在的主要问题。第4章主要比较了各种常见的用户模式识别方法。第5章提出了基于修改网页权重值的个性化PageRank算法和基于添加修正参数的个性化PageRank方法。第6章给出了一个较为完整的个性化搜索引擎系统原型,并对用户模式识别方法和PageRank方法的运行效果的测试。
本书通过对基于个怀化信息推荐技术的搜索引擎服务器日志中所具有关键词序列得到用户模式,并按照事务模式聚类的方法实现用户个性化特征的表达,最后在搜索引擎的网页索引中,利用得到的用户个性化特征改进传统的PegeRank算法。通过上述工作,本书构建了一个完整的基于Web个性化信秘推荐技术的搜索引擎框架结构。
本书可作为计算机专业的本科生和研究生的参考用书,也可供有关技术人员参考。
前言
第1章 绪论
1.1 Web信息检索
1.1.1 Web信息检索模型
1.1.2 向量空间模型
1.1.3 搜索引擎
1.1.4 搜索引擎工作原理
1.1.5 相关度排序技术
1.2 Web挖掘
1.2.1 Web挖掘的概念
1.2.2 Web挖掘的类型
1.2.3 Web挖掘的研究进展
1.3 web个性化信息推荐服务
1.3.1 概念
1.3.2 Web个性化信息推荐服务的种类划分
1.3.3 Web个性化信息推荐服务的发展
第2章 网页权重分析技术
2.1 网页质量分析技术
2.1.1 结合网页质量分析的Web信息检索模式
2.1.2 网页质量测度方法
2.2 网页相关度分析技术
2.2.1 标准PageRank算法
2.2.2 PageRank的优化计算
第3章 个性化搜索引擎
3.1 概念与特点
3.1.1 现代搜索引擎系统存在的问题
3.1.2 个性化搜索引擎的含义
3.1.3 现阶段个性化搜索引擎的不足
3.2 基本类型
3.2.1 基于个性化信息采集的个性化搜索引擎
3.2.2 基于查询改进的个性化搜索引擎
3.2.3 基于个性化网页权重的个性化搜索引擎
第4章 用户个性化模式的获取和表达
4.1 基于关键词序列的用户模式识别
4.1.1 概述
4.1.2 数据准备
4.1.3 用户识别
4.1.4 事务模式识别
4.2 基于用户事务模式聚类的Web信息个性化表达
4.2.1 用户事务模式的类别构造
4.2.2 基于频繁路径的用户事务模式类别构造
4.2.3 降维处理问题
第5章 基于关键词序列的个性化网页权重方法
5.1 方法概述
5.2 基于修改网页权重值的个性化PageRank
5.3 基于添加修正参数的个性化PageRank
5.3.1 使用事务聚类模式的个性化PageRank方法
5.3.2 使用主题化事务聚类模式的个性化PageRank方法
第6章 系统原型的实现
6.1 系统的开发方式
6.2 数据结构
6.3 存储过程
6.4 系统的功能模块
6.4.1 爬虫模块
6.4.2 Web网页分析模块
6.4.3 日志分析模块
6.4.4 用户接口模块
6.5 结果分析
6.5.1 关键词访问序列的获取情况
6.5.2 用户事务模式的获取情况
6.5.3 用户事务模式的聚类情况
6.5.4 个性化PageRank值的计算情况
6.6 系统框架评价
参考文献