![]()
内容推荐 本书主要针对网络计量分析中普遍存在的问题,例如开放获取网络资源的技术门槛较高、网络内容提取和分析技术繁多且复杂、定量分析的结果解读困难等,提出具体解决方案和技术实践路径,尤其是利用B语言编程的方法解决上述问题,包括网页数据自动抓取、网络链接分析和网络文本内容分析等,以便相关专业的师生掌握网络计量分析的方法和技能,并依据统计分析的原理和方法解释定量分析的结果,本书可作为信息分析和信息资源管理专业本科生和研究生教材使用。 作者简介 刘越男,管理学博士,中国人民大学信息资源管理学院(原档案学院)教授、副院长、博士生导师。主要研究领域是电子文件管理、数字档案馆、信息资源管理。目前已经发表学术论文数十篇,并且主编、参编、撰写了多部教材和专著,其中《电子文件管理国家战略》、《建立新秩序》、《电子文件风险管理》、《政府网站的构建与运作》等教材和专著,均受到社会的普遍好评。 目录 第1章 网络计量分析 1.1 大数据理论 1.2 Web超链接分析 1.3 计算文本分析 1.4 网络分析 第2章 如何找到合适的网络数据 2.1 Google Books Ngram Viewer 2.2 Google Trends 2.3 Google Search 2.4 Google Scholar 第3章 网页数据自动抓取 3.1 下载并安装Data Miner到Google Chrome中 3.2 开启Data Miner 3.3 打开Data Miner 3.4 注册并登录Data Miner 3.5 创建Recipe 3.6 设置待爬取网页的类型 3.7 设置待爬取网页中行的信息 3.8 设置待爬取网页中列的信息 3.9 设置爬取时自动翻页 3.10 设置爬取动作 3.11 设置脚本 3.12 保存设置 3.13 开始爬取 3.14 本章小结 第4章 网络链接分析 4.1 URL提取 4.2 URL分析 4.3 Domain分析 4.4 Site分析 4.5 顶级域名TLD分析 4.6 本章小结 第5章 网络文本内容分析 5.1 R语言文本分析框架 5.2 数据准备 5.3 数据分析 5.4 高级主题 第6章 网络分析 6.1 网络分析基础 6.2 R语言中的网络数据管理 6.3 基本网络绘图和布局 6.4 有效的网络图形设计 6.5 高级网络图形 6.6 网络成员的重要性评估 6.7 割点和桥 6.8 子组(子群子图子网) 6.9 随机网络模型 6.10 统计网络模型 结束语 参考文献 |