本书是“现代信息科学译丛”之一,全书共分26个章节,主要对链接分析的相关知识作了介绍,具体内容包括网络爬虫与搜索引擎、链接统计的理论基础、Web图中的链接结构、搜索引擎与网站设计、链向大学网站的个人网页等。该书可供各大专院校作为教材使用,也可供从事相关工作的人员作为参考用书使用。
链接分析,源于对Web结构中超链接的多维分析。当前其应用主要体现在网络信息检索、网络计量学、数据挖掘、Web结构建模等方山。作为Google的核心技术之一,链接分析算法应用已经显现出巨人的商业价值。本书作为英国信息科学专家迈克·塞沃尔(Mike Thelwall)教授的最新著作,从情报学的视角系统阐述了链接分析的理论、方法与应用,具体分六部分:概述、网络结构背景、学术型链接分析、链接分析的应用、链接分析的丁具和技术、总结。从结构上看,本书逻辑严谨,条分缕析;从内容上看,本书资料翔实,通过大量的方法、工具、技术介绍及案例分析,向读者展示了整个链接分析分析研究的全貌;从表达上看,本书文字深入浅出,用较简洁的语言捕述了较复杂的理论与技术。
本书可供情报学、图书馆学、信息资源管理、信息管理与信息系统、计算机科学与技术等专业的师生课堂使用,同时,其翔实的资料町作为国内情报学、计算机科学、传播学、社会学等领域从事应用统计研究时的重要参考。
第一部分 理论
第1章 前言
目标
链接分析
历史回顾
信息科学视角的链接分析是什么?
内容与结构
关键术语
小结
阅读与提高
参考文献
第2章 网络爬虫与搜索引擎
目标
引言
网络爬虫
查找网页
内容遍历与地址遍历
内容遍历
动态链接
遍历深度与人为限制
动态网页
道德规范和robot.txt文档
网页
网络爬虫小结
搜索引擎
公认的偏好
搜索引擎排序
网络档案
小结
阅读与提高
参考文献
第3章 链接统计的理论基础
目标
引言
链接统计的理论基础
异常
手工过滤和禁止列表
选择性文档模型(Alternative Doctlinent Model,简称ADM)
网站和网络文档
ADMs和标准ADM统计
ADM域统计模型
选择链接统计方法
小结
阅读与提高
参考文献
第4章 对链接数的解释:随机样本与相关性
目标
引言
解释链接数
初步的可行性和有效性研究
全面的随机抽样
分类结果的置信度
……
第二部分 Web结构
第5章 Web图中的链接结构
第6章 Web的内容结构
第三部分 学术链接
第7章 大学:链接类型
第8章 大学:链接模型
第9章 大学:国际链接
第10章 院系和学科
第11章 期刊和论文
第四部分 应用
第12章 搜索引擎与网站设计
第13章 西班牙大学网站健康度检验
第14章 链向大学网站的个人网页
第15章 学术网络
第16章 商业网站
第五部分 工具和方法
第17章 商业搜索引擎和网络档案的使用
第18章 个人爬虫
第19章 数据清理
第20章 大学在线链接数据库
第21章 嵌入式链接分析方法
第22章 社会网络分析
第23章 网络可视化
第24章 学术链接指标
第六部分 总结
第25章 总结
第26章 术语表
附录:SocSciBot使用指南