![]()
内容推荐 文本信息是Web上一类非常重要的信息,里面包含了大量的商业价值,对于洞察市场、识别创新机会、了解竞争对手、识别利益相关者、改进商品服务、了解消费者并与之价值共创,都具有重要意义。本书从商学院学生的角度出发,介绍文本知识挖掘的基本方法,以及它在商务问题上的应用。本书可以分为两个部分,第1~4章主要介绍文本知识挖掘的基础知识,第5~12章介绍文本知识挖掘的应用和工具本书的特色是包含大量的案例和实验,帮助商学院学生深入理解所学知识所具有的商业价值,以及如何通过Python语言来实现这些功能。 本书适合作为高等院校信息管理与信息系统专业本科生、管理科学与工程专业硕士生以及MBA、MEM等专业硕士研究生学习“文本知识挖掘”“Web商务分析”等课程用书,对于从事文本挖掘的工程师和研究人员也具有一定的参考价值。 目录 第1章 文本知识挖掘导论 1.1 文本挖掘的概念 1.2 文本挖掘的主要技术手段 1.3 文本挖掘的基本任务 1.4 文本挖掘的一般过程 思考题 第2章 网络爬虫 2.1 网络爬虫的分类 2.2 网络数据抓取的基本步骤 2.3 网络爬虫的基本工作流程 2.4 爬虫的抓取策略 2.5 实验 思考题 第3章 文本的语言学处理 3.1 词频统计分析 3.2 停用词 3.3 中文分词 3.4 词性标注 3.5 句法分析 3.6 词干提取和词形还原 3.7 实验 思考题 第4章 文本表示 4.1 向量空间模型 4.2 概念模型 4.3 特征生成 4.4 特征选择和特征提取 4.5 实验:特征选择 思考题 第5章 信息抽取 5.1 信息抽取简介 5.2 信息抽取的任务 5.3 应用案例:药物副作用挖掘 5.4 实验:命名实体识别 思考题 第6章 文本分类 6.1 文本分类的种类 6.2 文本分类的知识工程方法 6.3 文本分类的机器学习监督算法 6.4 文本分类的评价 6.5 应用案例:言语行为分析 6.6 实验:垃圾邮件检测 思考题 第7章 文本聚类 7.1 聚类的基本问题 7.2 文本聚类的算法 7.3 文本聚类的评价 7.4 应用案例:研讨文本的主题聚类 7.5 实验:使用K-means算法对文本进行聚类 思考题 第8章 主题模型 8.1 主题模型概述 8.2 文本建模 8.3 Unigram模型 8.4 主题模型和PLSA 8.5 LDA 8.6 应用案例:医生评论的主题提取 8.7 实验:使用LDA发现新闻中的主题 思考题 第9章 情感分析 9.1 情感分析的粒度 9.2 情感分析面临的问题 9.3 文档级情感分类 9.4 句子级情感分类 9.5 一些复杂句式的处理 9.6 应用案例:在线口碑预测市场成功 9.7 实验:评论的情感分析 思考题 第10章 知识图谱 10.1 知识图谱的基本概念 10.2 知识图谱的架构 10.3 代表性的知识图谱 10.4 知识抽取的关键技术 10.5 知识表示的关键技术 10.6 应用案例:知识图谱在部分领域的重要应用 10.7 实验 思考题 第11章 文本可视化 11.1 可视化的基本概念 11.2 可视化的基本方法 11.3 文本可视化的研究现状 11.4 应用案例:舆情可视化 11.5 实验 思考题 第12章 自然语言处理的商业套件 12.1 IBM SPSS Text Analytics 12.2 自然语言处理开放平台 12.3 知识图谱开放平台 思考题 参考文献 |