网站首页  软件下载  游戏下载  翻译软件  电子书下载  电影下载  电视剧下载  教程攻略

请输入您要查询的图书:

 

书名 Alink权威指南(基于Flink的机器学习实例入门Python)
分类
作者 杨旭
出版社 电子工业出版社
下载
简介
内容推荐
Alink是阿里巴巴开源的机器学习算法平台,提供了丰富、高效的算法及简便的使用方式,可帮助用户快速构建业务应用。Alink非常适合工业级的实际应用,支持在个人计算机上快速进行原型研发,支持分布式计算处理海量的数据,支持流式数据的场景,同时机器学习流程与模型可以方便地嵌入用户的应用系统或预测服务中。
本书是根据机器学习的知识点由浅入深来逐层讲述的,这样可降低阅读的门槛,让读者能对所学的内容有一个清晰的印象,并可熟练地运用到实践中。本书重点介绍算法的使用,每节结合实际的数据和典型的场景,通过Alink算法组件形成完整的解决方案,可帮助读者理解各类算法所擅长处理的问题,同时本书的方案还可以被推广、应用到类似的场景中。
本书适合机器学习算法的初学者及中级用户快速入门,也可供数据分析师、算法工程师等专业人员参考阅读。
作者简介
杨旭,Alink创始人。2004年获南开大学数学博士学位,随后在南开大学信息学院从事博士后研究工作;2006年加入微软亚洲研究院,进行并行计算及机器学习算法研究;2010年加入阿里巴巴集团,从事大数据和机器学习算法研发工作;2017年开始Alink的研发,致力于Alink的发展和开源。著有《重构大数据统计》《机器学习在线:解析阿里云机器学习平台》。
目录
第1章 Alink快速上手
1.1 Alink是什么
1.2 免费下载、安装
1.3 Alink的功能
1.3.1 丰富的算法库
1.3.2 多样的使用体验
1.3.3 与SparkML的对比
1.4 关于数据和代码
1.5 简单示例
1.5.1 数据的读/写与显示
1.5.2 批式训练和批式预测
1.5.3 流式处理和流式预测
1.5.4 定义Pipeline,简化操作
1.5.5 嵌入预测服务系统
第2章 系统概况与核心概念
2.1 基本概念
2.2 批式任务与流式任务
2.3 Alink=A+link
2.3.1 BatchOperator和StreamOperator
2.3.2 link方式是批式算法/流式算法的通用使用方式
2.3.3 link的简化
2.3.4 组件的主输出与侧输出
2.4 Pipeline与PipelineModel
2.4.1 概念和定义
2.4.2 深入介绍
2.5 触发Alink任务的执行
2.6 模型信息显示
2.7 文件系统与数据库
2.8 Schema String
第3章 文件系统与数据文件
3.1 文件系统简介
3.1.1 本地文件系统
3.1.2 Hadoop文件系统
3.1.3 阿里云OSS文件系统
3.2 数据文件的读入与导出
3.2.1 CSV格式
3.2.2 TSV格式、LibSVM格式和Text格式
3.2.3 AK格式
第4章 数据库与数据表
4.1 简介
4.1.1 Catalog的基本操作
4.1.2 Source组件和Sink组件
4.2 Hive示例
4.3 Derby示例
4.4 MySQL示例
第5章 支持Flink SQL
第6章 用户定义函数(UDF/UDTF)
第7章 基本数据处理
第8章 线性二分类模型
第9章 朴素贝叶斯模型与决策树模型
第10章 特征的转化
第11章 构造新特征
第12章 从二分类到多分类
第13章 常用的多分类算法
第14章 在线学习
第15章 回归的由来
第16章 常用的回归算法
第17章 常用的聚类算法
第18章 批式与流式聚类
第19章 主成分分析
第20章 超参数搜索
第21章 文本分析
第22章 单词向量化
第23章 情感分析
第24章 构建推荐系统
随便看

 

霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。

 

Copyright © 2002-2024 101bt.net All Rights Reserved
更新时间:2025/3/29 14:58:16