![]()
内容推荐 《大数据分析技术与应用实践/面向新工科专业建设计算机系列教材》首先从大数据技术概述出发,给出大数据领域的技术概貌及相关应用场景,从而使读者对大数据概念有清晰的认识;其次,《大数据分析技术与应用实践/面向新工科专业建设计算机系列教材》采取top-down模式,先从计算广告这一具有代表性的应用实践着手,阐明大数据技术是如何应用并发挥效用的;再次,依次介绍大数据采集与处理、大数据存储与查询、大数据计算与分析等关键技术;很后,将关键技术引申到两类重要的大数据应用技术:一类是Spark和机器学习应用,另一类是数据可视化应用。以此构建了一个大数据分析技术的基本闭环。 除了内容的闭环体系之外,《大数据分析技术与应用实践/面向新工科专业建设计算机系列教材》的另一大特色是将项目实践拆解融入各项关键技术中,从而实现理论与实践的有机融合,满足“新工科”建设的首要需求。 《大数据分析技术与应用实践/面向新工科专业建设计算机系列教材》可作为高等院校计算机类专业的大数据分析、应用方面的理论或实践课程的教材,也可供自学者及从事计算机应用、大数据开发等的工程技术人员参考。 作者简介 王宇新,博士,大连理工大学计算机科学与技术学院副教授,主管教学副院长。承担多项重量和省部级教育教学改革项目,主要目标是加强大数据、人工智能等新兴技术在传统计算机专业中的教学质量。 目录 章大数据技术概述 1.1大数据产品诞生 1.2什么是大数据 1.3大数据解决的问题场景 1.4大数据与Google 习题1 第2章计算广告介绍与课程应用实践 2.1计算广告 2.1.1互联网广告介绍 2.1.2互联网广告效果评估 2.1.3如何计算 2.1.4计算广告系统 2.2应用实践 2.2.1应用实践数据 2.2.2CTR预测 2.2.3项目实践1:了解应用实践数据 2.2.4项目实践2:实践环境搭建 习题2 第3章大数据采集与处理 3.1网络爬虫 3.1.1网络爬虫介绍 3.1.2构建一个网络爬虫的实践经验 3.1.3HTTP介绍 3.1.4网页解析与CSS选择器 3.1.5项目实践3:抓取网页并提取标题和正文 3.2ApacheKafka 3.2.1系统架构 3.2.2消息、主题和Schema 3.2.3分区 3.2.4生产者与消费者 3.2.5代理 3.2.6Kafka关键特性 3.2.7项目实践4:通过Kafka进行数据处理 3.2.8构建一个真实数据通道需要考虑的问题 3.3ETL、ApacheFlume和其他框架 3.3.1ETL 3.3.2ApacheFlume 3.3.3其他大数据采集处理框架 习题3 …… 第4章大数据存储与查询 第5章大数据计算与分析 第6章Spark和机器学习 第7章数据可视化 |