内容推荐 交通信息是交通决策的关键,如果我们采用合理的技术,交通信息就可以帮助我们节约大量成本,并提高工作效率。更重要的是,研发适当的技术还可以使我们理解并掌握所有的信息流。《交通数据科学:编程实践指南》为处理大量交通相关的多种形式数据提供基础,并且在各种数据集组合在一起时提供更多的见解和合作的可能。如果我们要实现“大数据”“物联网”“智慧城市”等交通领域当前的重要目标,那么这些便是新兴数据科学领域的基础。 本书可作为相关专业本科生和研究生学习智能交通系统数据分析的教材,也适用于从事智能交通行业的研发人员阅读使用。 作者简介 马晓磊,国家万人计划青年拔尖人才,交通运输部城市轨道交通综合应急技术与装备研发中心副主任。2013年于美国华盛顿大学获得博士学位,现任北京航空航天大学交通科学与工程学院教授,博士生导师。主要研究领域包括公共交通运营规划及交通大数据分析,主持国家级、省部级项目20余项。目前已在交通领域重点期刊以及会议上发表论文100余篇,其中60余篇被SCI/SSCI收录,SCI他引3000余次;获北京市自然科学二等奖、中国地理信息科技进步特等奖、中国商业科技进步一等奖等省部级奖励7项;担任IEEE Transactions on ITS、IET ITS、Transportation Research Part C/D等7个权威SCI/SSCI期刊副主编及编委,世界交通运输大会交叉学部数据与信息学科主席等学术组织成员;入选中国科协青年人才托举工程、北京市优秀青年、北京市科技新星等人才计划;担任中国致公党中央青年工作委员会委员、第十三届全国青联委员、第六届中国青年科技工作者协会理事。 目录 作者简介 译者简介 序 前言 读者推荐 第1章 “数据科学”与“大数据” 1.1 交通数据科学示例 1.1.1 伦敦轨道高速公路的起点-终点分析 1.1.2 航空公司定价与套利 1.1.3 凹坑检测 1.1.4 Foursquare 1.1.5 自动驾驶汽车 1.1.6 出租车服务 1.2 综述 1.3 定义 1.4 与其他领域的关系 1.5 道德和法律 1.6 批评观点 1.7 练习:itsleeds虚拟桌面设置 1.8 延伸阅读 1.9 附录:本地安装 第2章 基于交通数据科学的Python入门 2.1 编程技能测试 2.2 编程语言 2.3 编程环境 2.4 语言核心 2.4.1 列表 2.4.2 字典 2.4.3 控制结构 2.4.4 文件 2.4.5 函数 2.5 库 2.5.1 模块 2.5.2 数学公式 2.5.3 绘图 2.5.4 数据框 2.5.5 调试 2.6 延伸阅读 第3章 数据库设计 3.1 关系模型基础 3.2 描绘世界 3.2.1 本体论 3.2.2 哲学本体论 3.2.3 数据本体论 3.2.4 SQL 3.3 练习 3.3.1 设置PostgreSQL 3.3.2 SQL创建语言 3.3.3 SQL查询语言 3.3.4 SQL和Python的连接 3.3.5 导入车载蓝牙数据 3.4 延伸阅读 第4章 数据准备 4.1 数据获取 4.2 基本文本处理 4.3 格式语法:乔姆斯基层次结构 4.3.1 正则语言(类型3) 4.3.2 上下文无关语言(类型2) 4.3.3 CFG以外的类型(类型1和类型0) 4.4 特殊类型 4.4.1 字符串和数值 4.4.2 日期和时间 4.4.3 美国国家海洋电子协会(NMEA)格式 4.5 通用格式 4.6 数据清洗 4.7 B+树的实现 4.8 练习 4.8.1 用Pandas读取数据库 4.8.2 printf表示法 4.8.3 DateTimes 4.8.4 时间的偏差与校正 4.8.5 数据匹配 4.8.6 车载蓝牙 4.9 延伸阅读 第5章 空间数据 5.1 大地测量学 5.2 全球导航卫星系统(GNSS) 5.3 地理信息系统(GIS) 5.3.1 GIS的作用 5.3.2 空间本体论 5.3.3 空间数据结构 5.4 实施 5.4.1 空间文件 5.4.2 空间数据源 5.4.3 空间数据库 5.4.4 空间数据框 5.5 练习 5.5.1 GPS投影 5.5.2 PostGIS 5.5.3 GeoPandas 5.5.4 QGIS路线图 5.5.5 绘制开放式街道地图(OSM)道路 5.5.6 获取OSM数据 5.5.7 蓝牙车辆传感器站点 5.6 延伸阅读 第6章 贝叶斯推断 6.1 贝叶斯推断与“统计” 6.2 高速公路行程时间 6.3 贝叶斯推断 6.3.1 贝叶斯定理 6.3.2 法律判定:车辆撞人事故 6.3.3 先验和后验 6.3.4 道路用户跟踪 6.4 贝叶斯网络 6.4.1 红绿灯贝叶斯网络 6.4.2 交通事故贝叶斯网络 6.4.3 事故报告 6.4.4 汽车保险 6.5 先验和偏见 6.6 因果关系 6.7 模型的比较与组合 6.8 练习 6.8.1 用PyMC3推断交通信号灯 6.8.2 用PyMC3推断事故道路状态变化 6.8.3 切换泊松动态 6.9 延伸阅读 第7章 机器学习 7.1 产生性与区分性汽车排放 7.2 简单分类 7.2.1 线性判别分析(LDA) 7.2.2 最邻近分析 7.2.3 模块匹配 7.2.4 朴素贝叶斯分类 7.2.5 决策树 7.3 神经网络和“深度学习” 7.4 局限与拓展 7.5 练习 7.6 延伸阅读 第8章 空间分析 8.1 空间数据 8.2 贝叶斯空间模型 8.2.1 马尔可夫随机场(MRF) 8.2.2 高斯过程(克里金法) 8.3 车辆路线 8.4 空间特征 8.5 探索性分析 8.6 问题扩展 8.7 练习 8.7.1 GPy中的高斯过程 8.7.2 高斯过程车辆密度 8.7.3 使用PostGIS的车辆路线选择 8.7.4 查找路边传感器站点 8.8 延伸阅读 第9章 数据可视化 9.1 视觉感知 9.1.1 颜色 9.1.2 视觉注意 9.2 地理可视化(地图) 9.2.1 交通流图 9.2.2 滑图 9.2.3 信息图 9.3 练习 9.3.1 带有Leaflet的网络地图 9.3.2 蓝牙起止点路线流 9.3.3 大型项目建议 9.4 延伸阅读 第10章 大数据 10.1 中型数据加速 10.2 企业数据拓展 10.3 CAP定理 10.4 大数据扩展 10.4.1 数据“湖” 10.4.2 网格计算 10.4.3 Map-Reduce和云计算 10.4.4 Hadoop生态系统 10.4.5 非关系数据库(NoSQL) 10.4.6 分布式关系数据库(NewSQL) 10.5 练习 10.5.1 PrologAI汽车保险查询 10.5.2 车载蓝牙数据的Mapper-Reduce 10.5.3 设置Hadoop和Spark 10.5.4 在Hadoop中查找车辆匹配项 10.5.5 用Spark预测交通流 10.5.6 大型项目建议 10.6 延伸阅读 第11章 专业问题 |