内容推荐 大数据时代,快速分析数据并从中提取有效信息是所有数据科学家必须完成的任务。本书由分析领域的专家撰写,面向所有对数据科学感兴趣的读者,既是初学者的必备入门指南,也可帮助不同行业的技术人员扩充工具库,实现数据分析技能的快速提升。 元分析既是混合分析,也是关于分析的分析。本书既讨论元方法,也讲解常规的分析方法和分析系统,特别是提供了一系列详尽的模式和方法,它们可用于任何基于机器学习的数据分析任务。通过学习这些方法,你至少能找到一种更为有效的模式,并且获得优于传统分析方法的整体系统行为。 通过阅读本书,你将学习以下知识: 背景知识,涉及统计学、算法、机器学习和人工智能等方面,涵盖回归、聚类、马尔可夫模型、熵、支持向量机、降维和神经网络等概念,并演示了如何构建分别适用于二分类和一般情况的分类器。 真值获取与真值估算,提出了打破传统“训练、验证和测试”模式的新模式。 实验设计与设计模式,前者包括数据归一化、剪枝老化数据和系统之系统,后者包括累积响应模式、分析的优化和模型一致性模式。 分析系统的各个方面,包括灵敏度分析、大型系统工程、建模与拟合、同义词一反义词模式、强化一无效化模式以及系统设计的优化等,引入了射幸技术和专家系统技术等概念。 应用与挑战,介绍元分析在机器翻译、机器人技术、医学和金融等领域的广泛应用,并畅想了元分析的未来。 作者简介 潘微科,博士,深圳大学计算机与软件学院副教授,硕士生导师,深圳市优秀教师。主要研究方向为迁移学习、联邦学习、推荐系统和机器学习,曾获ACM TiiS 2016最佳论文奖和SDM 2013最佳论文提名奖。主持国家自然科学基金面上项目等多个科研项目,担任知名国际期刊的编委、客座编委和杰出审稿人。 目录 译者序 致谢 第1章 概述和应用 1.1 引言 1.2 本书为什么重要 1.3 本书的组织结构 1.4 信息学 1.5 分析统计学 1.5.1 值和方差 1.5.2 样本和总体检验 1.5.3 回归和估计 1.6 分析算法 1.6.1 k均值和k近邻聚类 1.6.2 反聚类 1.6.3 马尔可夫模型 1.7 机器学习 1.7.1 熵 1.7.2 支持向量机和核函数 1.7.3 概率 1.7.4 降维和信息增益 1.7.5 优化和搜索 1.7.6 数据挖掘和知识发现 1.7.7 识别 1.7.8 集成学习 1.8 人工智能 1.8.1 遗传算法 1.8.2 神经网络 1.8.3 免疫算法 1.9 一个从头开始构建分类器的平台(二分类) 1.10 一个从头开始构建分类器的平台(一般情况) 1.10.1 训练和验证 1.10.2 测试和部署 1.10.3 比较训练和测试数据集上的结果 1.11 本章小结 参考文献 扩展阅读 第2章 获取真值 2.1 引言 2.2 预验证 2.3 根据训练数据优化设置 2.4 学习如何学习 2.5 从深度学习到深度反学习 2.6 本章小结 参考文献 第3章 实验设计 3.1 引言 3.2 数据归一化 3.2.1 简单的归一化 3.2.2 偏差归一化 3.2.3 归一化和实验设计表 3.3 剪枝老化数据的设计 3.4 系统之系统 …… 第4章 元分析设计模式 第5章 灵敏度分析和大型系统工程 第6章 多面预测性选择 第7章 建模和模型拟合 第8章 同义词-反义词模式和强化-无效化模式 第9章 关于分析的分析 第10章 系统设计优化 第11章 射幸技术和专家系统技术 第12章 应用一:机器翻译、机器人技术和生物科学中的主题及挑战 第13章 应用二:医学及医疗信息学、经济学、商业和金融 第14章 探讨、总结和数据的未来 中英文术语对照表 |