吴军编著的《数学之美(第2版)》一个目的在于揭示信息和自然语言处理以及它们在通信和互联网各种应用(语音识别、机器翻译、搜索、分类等)中的数学原理,从而帮助读者认识到:解决这些问题,好的方法是什么。毫无疑问,解决这些问题需要智能,而计算机本身并没有智能,它有的只是巨大的计算能力。只有找到描述这些问题的数学模型,才能利用计算机解决这些需要智能的问题,这样,计算机看上去也似乎聪明起来了。
几年前,“数学之美”系列文章原刊载于谷歌黑板报,获得上百万次点击,得到读者高度评价。 正式出版前,吴军博士几乎把所有文章都重写了一遍,为的是把高深的数学原理讲得更加通俗易懂,让非专业读者也能领略数学的魅力。
吴军编著的《数学之美(第2版)》第一版上市后深受广大读者欢迎,并荣获国家图书馆第八届文津图书奖。读者说,读了《数学之美》,才发现大学时学的数学知识,比如马尔科夫链、矩阵计算,甚至余弦函数原来都如此亲切,并且栩栩如生,才发现自然语言和信息处理这么有趣。
而今,数学在信息产业中的应用越来越广泛,因此,作者在第二版中增加了一些内容,尤其是针对大数据和机器学习的内容,以便满足人们对当下技术的学习需求。
第一版读者赞誉
第二版出版说明
第一版序言
第二版序言
第二版前言
第1章 文字和语言vs数字和信息
1 信息
2 文字和数字
3 文字和语言背后的数学
4 小结
第2章 自然语言处理——从规则到统计
1 机器智能
2 从规则到统计
3 小结
第3章 统计语言模型
1 用数学的方法描述语言规律
2 延伸阅读:统计语言模型的工程诀窍
3 小结
第4章 谈谈分词
1 中文分词方法的演变
2 延伸阅读:如何衡量分词的结果
3 小结
第5章 隐含马尔可夫模型
1 通信模型
2 隐含马尔可夫模型
3 延伸阅读:隐含马尔可夫模型的训练
4 小结
第6章 信息的度量和作用
1 信息熵
2 信息的作用
3 互信息
4 延伸阅读:相对熵
5 小结
第7章 贾里尼克和现代语言处理
1 早年生活
2 从水门事件到莫妮卡·莱温斯基
3 一位老人的奇迹
第8章 简单之美——布尔代数和搜索引擎
1 布尔代数
2 索引
3 小结
第9章 图论和网络爬虫
1 图论
2 网络爬虫
3 延伸阅读:图论的两点补充说明
4 小结
第10章 PageRank——Google的民主表决式网页排名技术
1 PageRank 算法的原理
2 延伸阅读:PageRank的计算方法
3 小结
第11章 如何确定网页和查询的相关性
1 搜索关键词权重的科学度?
2 延伸阅读:TF-IDF的信息论依据
3 小结
第12章 有限状态机和动态规划——地图与本地搜索的核心技术
1 地址分析和有限状态机
2 全球导航和动态规划
3 延伸阅读:有限状态传感器
4 小结
第13章 Google AK-47的设计者——阿米特·辛格博士
第14章 余弦定理和新闻的分类
1 新闻的特征向量
2 向量距离的度量
3 延伸阅读:计算向量余弦的技巧
4 小结
第15章 矩阵运算和文本处理中的两个分类问题
1 文本和词汇的矩阵
2 延伸阅读:奇异值分解的方法和应用场景
3 小结
第16章 信息指纹及其应用
1 信息指纹
2 信息指纹的用途
3 延伸阅读:信息指纹的重复性和相似哈希
4 小结
第17章 由电视剧《暗算》所想到的——谈谈密码学的数学原理
1 密码学的自发时代
2 信息论时代的密码学
3 小结
第18章 闪光的不一定是金子——谈谈搜索引擎反作弊问题和搜索结果的权威性问题
1 搜索引擎的反作弊
2 搜索结果的权威性
3 小结
第19章 谈谈数学模型的重要性
第20章 不要把鸡蛋放到一个篮子里——谈谈最大熵模型
1 最大熵原理和最大熵模型
2 延伸阅读:最大熵模型的训练
3 小结
第21章 拼音输入法的数学原理
1 输入法与编码
2 输入一个汉字需要敲多少个键——谈谈香农第一定理
3 拼音转汉字的算法
4 延伸阅读:个性化的语言模型
5 小结
第22章 自然语言处理的教父马库斯和他的优秀弟子们
1 教父马库斯
2 从宾夕法尼亚大学走出的精英们
第23章 布隆过滤器
1 布隆过滤器的原理
2 延伸阅读:布隆过滤器的误识别问题
3 小结
第24章 马尔可夫链的扩展——贝叶斯网络
1 贝叶斯网络
2 贝叶斯网络在词分类中的应用
3 延伸阅读:贝叶斯网络的训练
4 小结
第25章 条件随机场、文法分析及其他
1 文法分析——计算机算法的演变
2 条件随机场
3 条件随机场在其他领域的应用
4 小结
第26章 维特比和他的维特比算法
1 维特比算法
2 CDMA技术——3G移动通信的基础
3 小结
第27章 上帝的算法——期望最大化算法
1 文本的自收敛分类
2 延伸阅读:期望最大化和收敛的必然性
3 小结
第28章 逻辑回归和搜索广告
1 搜索广告的发展
2 逻辑回归模型
3 小结
第29章 各个击破算法和Google云计算的基础
1 分治算法的原理
2 从分治算法到Ma
3 小结
第30章 Google大脑和人工神经网络
1 人工神经网络
2 训练人工神经网络
3 人工神经网络与贝叶斯网络的关系
4 延伸阅读:Google大脑
5 小结
第31章 大数据的威力——谈谈数据的重要性
1 数据的重要性
2 数据的统计和信息技术
3 为什么需要大数据
4 小结
附录 计算复杂度
第二版后记
索引