文本挖掘/大数据丛书(美)迈克尔·W.贝瑞//雅克布·柯岗机械工业出版社豆瓣PDF电子书bt网盘迅雷下载-霍普软件下载网

目录
译者序
原书序
第1章独立文档的关键词的自动提取
1.1 简介
1.1.1 关键词提取方法
1.2 快速自动关键词提取
1.2.1 候选关键词
1.2.2 关键词得分
1.2.3 邻接关键词
1.2.4 提取关键词
1.3 基准评估
1.3.1 准确率和召回率评估
1.3.2 效率评估
1.4 停用词列表生成
1.5 新闻消息的评估
1.5.1 MPQA语料库
1.5.2 从新闻消息中提取关键词
1.6 总结
参考文献
第2章利用数学方法进行多语言文档聚类
2.1 简介
2.2 背景
2.3 实验设置
2.4 多语言LSA
2.5 Tucker1方法
2.6 PARAFAC2方法
2.7 词对齐的LSA
2.8 潜在形态语义分析(LMSA)
2.9 词对齐的LMSA
2.10 对技术和结果的讨论
参考文献
第3章使用机器学习算法对基于内容的垃圾邮件进行分类
3.1 简介
3.2 机器学习算法
3.2.1 朴素贝叶斯
3.2.2 LogitBoost
3.2.3 支持向量机
3.2.4 增广的潜在语义索引空间
3.2.5 径向基函数网络
3.3 数据预处理
3.3.1 特征选择
3.3.2 信息表示
3.4 邮件分类的评估
3.5 实验
3.5.1 使用PU1的实验
3.5.2 使用ZH1的实验
3.6 分类器特点
3.7 结束语
参考文献第4章利用非负矩阵分解研究邮件分类问题
4.1 简介
4.1.1 相关工作
4.1.2 概要
4.2 研究背景
4.2.1 非负矩阵分解
4.2.2 计算NMF的算法
4.2.3 数据集
4.2.4 解释
4.3 基于特征排序的NMF初始化
4.3.1 特征子集选择
4.3.2 FS初始化
4.4 基于NMF的分类方法
4.4.1 使用基础特征分类
4.4.2 基于NMF的一般化LSI
4.5 结束语
参考文献
第5章使用k-均值算法进行约束聚类
5.1 简介
5.2 表示法和古典k-均值算法
5.3 具有布莱格曼散度的k-均值约束聚类算法
5.3.1 具有“不能链接”约束关系的二次k-均值聚类
5.3.2 “必须链接”约束关系的移除
5.3.3 使用布莱格曼散度进行聚类
5.4 smoka 类型约束聚类
5.5 球形k-均值约束聚类
5.5.1 仅有“不能链接”约束关系的球形k-均值聚类算法
5.5.2 具有“不能链接”和“必须链接”约束关系的球形k-均值聚类
5.6 数值实验
5.6.1 二次k-均值聚类
5.6.2 球形k-均值聚类
5.7 总结
参考文献
第6章文本可视化技术的研究
6.1 文本分析的可视化
6.2 标签云图
6.3 著作权及其变更的追踪
6.4 数据探索和novel模式的探索
6.5 情绪追踪
6.6 可视化分析和FutureLens
6.7 场景发现
6.7.1 场景
6.7.2 评估策略
6.8 早期版本
6.9 FutureLens 的特征
6.10 场景发现举例：生态恐怖主义
6.11 场景发现举例：毒品走私
6.12 未来的工作
参考文献
第7章新颖性挖掘的自适应阈值设置 7.1 简介
7.2 新颖性挖掘中的自适应阈值设置
7.2.1 背景
7.2.2 动机
7.2.3 基于高斯分布的自适应阈值设置
7.2.4 实现过程中的问题
7.3 实验研究
7.3.1 数据集
7.3.2 加工实例
7.3.3 实验及结果
7.4 总结
参考文献
第8章文本挖掘与网络犯罪
8.1 简介
8.2 网络欺凌和网络捕食研究的现状
8.2.1 获取即时通信和在线聊天
8.2.2 当前用于分析的收集
8.2.3 对即时通信和在线聊天的分析
8.2.4 网络捕食检测
8.2.5 网络欺凌检测
8.2.6 法律问题
8.3 监控聊天的商业软件
8.4 结论与未来的方向
参考文献
第9章文本流中的事件和发展趋势
9.1 引言
9.2 文本流
9.3 特征提取和数据还原
9.4 事件监测
9.5 趋势检测
9.6 事件和趋势描述
9.7 相关讨论
9.8 总结
参考文献
第10章在LDA主题模型中嵌入语义
10.1 简介
10.2 背景
10.2.1 向量空间模型
10.2.2 潜在语义分析
10.2.3 概率潜在语义分析
10.3 潜在狄利克雷分配
10.3.1 图模型和生成过程
10.3.2 后验推断
10.3.3 在线潜在狄利克雷分配(OLDA)
10.3.4 算例分析
10.4 在维基百科中嵌入外部语义
10.4.1 相关维基百科文章
10.4.2 维基百科影响的主题模型
10.5 数据驱动语义的嵌入
10.5.1 数据驱动语义嵌入的生成过程 10.5.2 嵌入数据驱动语义的OLDA算法
10.5.3 实验设计
10.5.4 实验结果
10.6 相关工作
10.7 结论与未来工作
参考文献

书名	文本挖掘/大数据丛书
分类
作者	(美)迈克尔·W.贝瑞//雅克布·柯岗
出版社	机械工业出版社
下载
简介	目录目录译者序原书序第1章独立文档的关键词的自动提取 1.1 简介 1.1.1 关键词提取方法 1.2 快速自动关键词提取 1.2.1 候选关键词 1.2.2 关键词得分 1.2.3 邻接关键词 1.2.4 提取关键词 1.3 基准评估 1.3.1 准确率和召回率评估 1.3.2 效率评估 1.4 停用词列表生成 1.5 新闻消息的评估 1.5.1 MPQA语料库 1.5.2 从新闻消息中提取关键词 1.6 总结参考文献第2章利用数学方法进行多语言文档聚类 2.1 简介 2.2 背景 2.3 实验设置 2.4 多语言LSA 2.5 Tucker1方法 2.6 PARAFAC2方法 2.7 词对齐的LSA 2.8 潜在形态语义分析(LMSA) 2.9 词对齐的LMSA 2.10 对技术和结果的讨论参考文献第3章使用机器学习算法对基于内容的垃圾邮件进行分类 3.1 简介 3.2 机器学习算法 3.2.1 朴素贝叶斯 3.2.2 LogitBoost 3.2.3 支持向量机 3.2.4 增广的潜在语义索引空间 3.2.5 径向基函数网络 3.3 数据预处理 3.3.1 特征选择 3.3.2 信息表示 3.4 邮件分类的评估 3.5 实验 3.5.1 使用PU1的实验 3.5.2 使用ZH1的实验 3.6 分类器特点 3.7 结束语参考文献第4章利用非负矩阵分解研究邮件分类问题 4.1 简介 4.1.1 相关工作 4.1.2 概要 4.2 研究背景 4.2.1 非负矩阵分解 4.2.2 计算NMF的算法 4.2.3 数据集 4.2.4 解释 4.3 基于特征排序的NMF初始化 4.3.1 特征子集选择 4.3.2 FS初始化 4.4 基于NMF的分类方法 4.4.1 使用基础特征分类 4.4.2 基于NMF的一般化LSI 4.5 结束语参考文献第5章使用k-均值算法进行约束聚类 5.1 简介 5.2 表示法和古典k-均值算法 5.3 具有布莱格曼散度的k-均值约束聚类算法 5.3.1 具有“不能链接”约束关系的二次k-均值聚类 5.3.2 “必须链接”约束关系的移除 5.3.3 使用布莱格曼散度进行聚类 5.4 smoka 类型约束聚类 5.5 球形k-均值约束聚类 5.5.1 仅有“不能链接”约束关系的球形k-均值聚类算法 5.5.2 具有“不能链接”和“必须链接”约束关系的球形k-均值聚类 5.6 数值实验 5.6.1 二次k-均值聚类 5.6.2 球形k-均值聚类 5.7 总结参考文献第6章文本可视化技术的研究 6.1 文本分析的可视化 6.2 标签云图 6.3 著作权及其变更的追踪 6.4 数据探索和novel模式的探索 6.5 情绪追踪 6.6 可视化分析和FutureLens 6.7 场景发现 6.7.1 场景 6.7.2 评估策略 6.8 早期版本 6.9 FutureLens 的特征 6.10 场景发现举例：生态恐怖主义 6.11 场景发现举例：毒品走私 6.12 未来的工作参考文献第7章新颖性挖掘的自适应阈值设置 7.1 简介 7.2 新颖性挖掘中的自适应阈值设置 7.2.1 背景 7.2.2 动机 7.2.3 基于高斯分布的自适应阈值设置 7.2.4 实现过程中的问题 7.3 实验研究 7.3.1 数据集 7.3.2 加工实例 7.3.3 实验及结果 7.4 总结参考文献第8章文本挖掘与网络犯罪 8.1 简介 8.2 网络欺凌和网络捕食研究的现状 8.2.1 获取即时通信和在线聊天 8.2.2 当前用于分析的收集 8.2.3 对即时通信和在线聊天的分析 8.2.4 网络捕食检测 8.2.5 网络欺凌检测 8.2.6 法律问题 8.3 监控聊天的商业软件 8.4 结论与未来的方向参考文献第9章文本流中的事件和发展趋势 9.1 引言 9.2 文本流 9.3 特征提取和数据还原 9.4 事件监测 9.5 趋势检测 9.6 事件和趋势描述 9.7 相关讨论 9.8 总结参考文献第10章在LDA主题模型中嵌入语义 10.1 简介 10.2 背景 10.2.1 向量空间模型 10.2.2 潜在语义分析 10.2.3 概率潜在语义分析 10.3 潜在狄利克雷分配 10.3.1 图模型和生成过程 10.3.2 后验推断 10.3.3 在线潜在狄利克雷分配(OLDA) 10.3.4 算例分析 10.4 在维基百科中嵌入外部语义 10.4.1 相关维基百科文章 10.4.2 维基百科影响的主题模型 10.5 数据驱动语义的嵌入 10.5.1 数据驱动语义嵌入的生成过程 10.5.2 嵌入数据驱动语义的OLDA算法 10.5.3 实验设计 10.5.4 实验结果 10.6 相关工作 10.7 结论与未来工作参考文献内容推荐迈克尔·W.贝瑞、雅克布·柯岗编的《文本挖掘/大数据丛书》呈现了文本挖掘领域先进的算法，同时从学术界和产业界的角度介绍了文本挖掘。本书涉及的业界学者跨越多个国家，来自多个机构：大学、企业和政府实验室。本书介绍了文本挖掘在多个领域中的自动文本分析和挖掘计算模型，这些领域包括：机器学习、知识发现、自然语言处理和信息检索等。本书适合作为人工智能、机器学习和自然语言处理等领域相关人员的教科书和参考书。同时，也适合研究人员和从业人员阅读。
随便看	辽廖声声于北岛京极及其他但是流景已老承蒙时光不弃浮生之盛世沉渊许你一世欢颜虚妄 [综漫]半夏微凉° 庚澈问津灰姑娘的故事·改 11111 AF小短篇雇佣兄长作者！请在苏一次妃守护甜心之花开彼岸娱乐圈之管好你的妖孽春头天直到世界尽头指尖雪 [家教]KNIT 其实不是玛丽苏萨那家教半城半夏半微凉壁纸魔术师 V1.1 Build 1106 绿色版 Flash批量缩略图 V1.0.0 绿色版 mtPaint(绘图工具) V3.21 多国语言绿色版文件目录结构转文本网页 V4.0 绿色版 CopyText(捕获窗口文字工具) V2.2 绿色汉化版 Duplicate File Detective(查找和管理文件) V1.515 绿色汉化版道富深蓝 V2.209 绿色版无忧快递查询小助手 V1.0 绿色版聚宝阁 V1.06 新毒霸(悟空) SP7.5.(0416) 中文安装版鬼谷八荒坊市商品扩展MOD v1.0 星辰沙海修改器 v1.0 yuzu模拟器(Switch模拟器) v662 猛兽之地五项修改器 V1.1.0.16910 绿色版 FIFA17比赛时间修改器 V1.0 绿色版 QQ水浒包子辅助 V1.8 绿色版浮岛物语修改器 v1.0 不义联盟2十三项修改器 v1.0-20211104 破晓传说Action服装MOD v1.75 虐杀原形6项属性修改器 V1.001 绿色版 trews tri- triad trial trial and error trial run triangle triangular triangulation Triassic [BT下载][夏日口袋][第21集][WEB-MKV/1.31G][中文字幕][1080P][流媒体][BlackTV] [BT下载][阿曼达·诺克斯杀人疑案][第03集][WEB-MKV/1.82G][无字片源][1080P][流媒体][BlackTV] [BT下载][阿曼达·诺克斯杀人疑案][第03集][WEB-MKV/4.91G][无字片源][4K-2160P][HDR+杜比视界双版本][H265 [BT下载][阿曼达·诺克斯杀人疑案][第03集][WEB-MKV/3.48G][无字片源][4K-2160P][H265][流媒体][BlackTV] [BT下载][君有云.第一季][第17集][WEB-MP4/0.55G][中文字幕][1080P][流媒体][ColorTV] [BT下载][她从深渊来][短剧][第01-24集][WEB-MKV/4.10G][中文字幕][1080P][流媒体][ColorTV] [BT下载][紫川.第二季][第07集][WEB-MP4/0.41G][国语配音/中文字幕][1080P][流媒体][ColorTV] [BT下载][紫川.第二季][第07集][WEB-MP4/0.79G][国语配音/中文字幕][4K-2160P][H265][流媒体][ColorTV] [BT下载][缥缈剑仙传][第11集][WEB-MKV/1.16G][国语配音/中文字幕][4K-2160P][H265][流媒体][ColorTV] [BT下载][缥缈剑仙传][第11集][WEB-MKV/1.03G][国语配音/中文字幕][4K-2160P][HDR版本][H265][流媒体][Colo 重返帝国技能怎么选择-重返帝国技能选择技巧介绍剪映电脑版怎么取消撤回-剪映电脑版取消撤回的方法重返帝国摧城属性怎么提高-重返帝国提高摧城属性方法剪映电脑版怎么给字体加粗-剪映电脑版给字体加粗的方法重返帝国联盟怎么管理-重返帝国联盟管理方法剪映电脑版怎么添加闭幕效果-剪映电脑版添加闭幕效果的方法重返帝国最高王城怎么攻占-重返帝国攻占最高王城方法攻略剪映电脑版素材库怎么用-剪映电脑版素材库使用方法剪映电脑版怎么调整分辨率-剪映电脑版调整分辨率的方法重返帝国新手枪兵怎么搭配-重返帝国新手枪兵搭配指南