网站首页  软件下载  游戏下载  翻译软件  电子书下载  电影下载  电视剧下载  教程攻略

请输入您要查询的图书:

 

书名 文本挖掘技术及其应用
分类
作者 谢邦昌//朱建平//李毅
出版社 厦门大学出版社
下载
简介
编辑推荐

谢邦昌、朱建平、李毅著的这本《文本挖掘技术及其应用》共分三部分十一章内容。其中,第一部分包括两章,介绍了常用文本挖掘技术,总结了基本流程。第二部分共五章,介绍了R软件在文本挖掘上的应用。第三部分共四章,介绍在SQL Sever 2014上如何实现文本挖掘。

内容推荐

谢邦昌、朱建平、李毅著的《文本挖掘技术及其应用》主要框架是基于跨行业数据挖掘标准流程(CRISP-DM)这一知识发现(KDD)过程模型展开,其内容主要包括互联网数据(来自新浪微博、Facebook和Twitter)的收集、准备、建模、评估和实施,并利用R软件和Microsoft SQL Server软件在实务案例中进行文本挖掘。本书通过实战案例整合大量文本挖掘中各种碎片化经验,提供相关的程序代码和技术实践支持,让读者阅读之后就能亲自动手做,而且做出来就可以解决许多实际问题。

目录

第一部分 文本挖掘技术

第一章 绪论

 1.1 整合文本挖掘与数据挖掘

 1.2 基础技术

第二章 资料分析

 2.1 数据分析作业

2.1.1 数据清洗

2.1.2 建立基本词汇数据库

2.1.3 Metaclata(元数据)及非结构化文本数据的自动分类

2.1.4 数据聚类

2.1.5 关系型分析

 2.2 基础挖掘过程

2.2.1 文献的树状知识分类

2.2.2 数据检索

2.2.3 主题侦测追踪

2.2.4 概念丛集

2.2.5 个人化议题式词库(增列)

2.2.6 动态索引词库

2.2.7 推论分析

第二部分 文本挖掘:以R软件为例

第三章 R软件

 3.1 R软件简介

 3.2 R软件的特色

 3.3 R软件的基本安装

 3.4 程序包安装

第四章 基本工具

 4.1 基本工具

4.1.1 安装rJava包

4.1.2 安装Rwordseg包

4.1.3 安装tm包

4.1.4 安装tmcn包

4.1.5 安装wordcloud、ggplot2、graphics包

4.1.6 安装Rfacebook、Rweibo、Rtwitter包

 4.2 社群开放平台权限申请

4.2.1 如何获得Facebook权限

4.2.2 如何获得微博权限

第五章 文本挖掘之爬虫

 5.1 Rfacebook

5.1.1 用户发文

5.1.2 粉丝发文

5.1.3 所需R包

 5.2 Rweibo

5.2.1 主题

5.2.2 实例说明

5.2.3 所需R包

 5.3 R Twitter

5.3.1 关键词

5.3.2 所需R包

 5.4 网页爬虫

5.4.1 爬一般网页文字

5.4.1 爬PTT网页文字

5.4.3 所需R包

 5.5 SpideR

5.5.1 所需R包

5.5.2 有关爬虫时的注意事项

5.5.3 抓取网页数据的标准作业程序

5.5.4 R IDE的编码

5.5.5 读取文档或网页的编码

5.5.6 R IDE开发spideR面对编码的解决方案

第六章 数据预处理

 6.1 编码处理

6.1.1 乱码问题

6.1.2 字符编码种类

 6.2 代表性语料库、词库简介

6.2.1 知网http:www.keenage.com

6.2.2 中文词知识库小组(http://ckip.iis.sinica.edu.tw/CKIP/index.htm)

 6.3 断词方法

 6.4 字词处理

 6.5 语料库建立

 6.6 正则表达式(regular expressions

第七章 资料分析

 7.1 频率(词频)

 7.2 DTM(TDM)matrix

7.2.1 DocumentTermMatrix与TermDocumentMatrix

7.2.2 稀疏矩阵(sparse matrix)

 7.3 关联分析

 7.4 聚类分析

7.4.1 常用的两种相似系数

7.4.2 常用的点间距离公式

7.4.3 层次式聚类法

7.4.4 非层次式聚类法

7.4.5 R聚类分析语法

 7.5 主成分分析

7.5.1 主成分分析原理

7.5.2 主成分分析数学模型

7.5.3 主成分特性

7.5.4 R语言主成分分析语法

 7.6 词云聚类分析

7.6.1 词云聚类简介

7.6.2 R语言词云聚类语法

第三部分 文本挖掘之SQL Server 2014

第八章 SQL Server 2014简介

 8.1 商业智能应用程序

 8.2 文本挖掘技术

第九章 文本挖掘应用

 9.1 导入文本数据

 9.2 建立NGArticles的词库

9.2.1 建立词库(Dictionary)

9.2.2 建立词向量

9.2.3 建立Train Sample和Test Sample

第十章 资料分析

 10.1 串联Train Samplc、Test Sample和Term Vectors

 10.2 构建数据挖掘模型(决策树、神经网络、逻辑回归)

 10.3 图表分析

10.3.1 各模型的准确度图表分析

10.3.2 决策树图表分析

10.3.3 神经网络图表分析

第十一章 文本挖掘在实务上的应用

 11.1 创造商机

11.1.1 商品卖得好

11.1.2 社群操作得好

11.1.3 危机预警

11.1.4 广告ROI高

 11.2 结语

随便看

 

霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。

 

Copyright © 2002-2024 101bt.net All Rights Reserved
更新时间:2025/3/1 18:32:37