![]()
编辑推荐 (1)作者背景权威:R和Python数据分析与挖掘领域的社区领军人物,某大型国资寿险公司数据团队负责人。 (2)作者经验丰富:拥有超过16年的数据分析与挖掘经验,擅长使用ChatGPT等AI工具辅助数据分析与挖掘。 (3)零编程经验也能成为Python数据分析高手:详细讲解如何巧妙地使用ChatGPT学习Python数据分析与挖掘,大大降低学习门槛,大幅提升学习效率。 (4)快速成为AI数据分析达人:围绕数据分析与挖掘的全生命周期,提供了大量使用ChatGPT进行数据分析与挖掘的方法和技巧。 (5)通俗易懂,容易上手:采用由浅入深的讲解方式,既适用于 Python 初学者,也适用于有经验的数据分析人员;采用通俗易懂的语言,避免了复杂的数学公式和理论推导。 (6)内容丰富,实用性强:内容涵盖了从数据分析基础到高级分析的各个方面,每章都提 供了大量的代码示例,读者可以跟随书中的指导进行操作。 (7)涵盖主流 Python 库:包括NumPy、Pandas、scikit-learn 等常用数据分析及建模库,Matplotlib、Bokeh等常用数据可视化库以及深度学习框架 TensorFlow。 内容推荐 内容简介 这既是一本引导读者如何使用ChatGPT低门槛、高效率学习Python数据分析与挖掘方法的著作,又是一本指导读者如何使用ChatGPT精准、高效地进行Python数据分析与挖掘实操的著作。 从读者对象的角度看,本书既大大降低了没有编程经验的读者学习Python数据分析的门槛,又为有经验的Python数据分析师提供了大量实用的AI数据分析技巧,帮助他们快速转型为具备AI能力的数据分析师。 从核心内容的角度看,本书不仅讲解了如何在数据预处理、数据清洗、数据可视化等基础的数据分析环节使用AI工具,而且还讲解了如何在聚类分析、预测分析等高级的数据建模环节使用AI工具。 阅读完本书,你将掌握以下知识: (1)数据分析、数据挖掘以及机器学习算法的基础知识。 (2)ChatGPT等AI工具的注册及使用,以及如何使用这些AI工具学习Python。 (3)使用ChatGPT辅助各种常见的数据操作和数据预处理。 (4)使用ChatGPT辅助静态数据可视化和数据交互可视化。 (5)使用ChatGPT辅助聚类分析、关联规则分析、回归分析。 (6)使用ChatGPT辅助学习降维算法、决策树算法、随机森林、k近邻算法、支持向量机算法、神经网络算法。 (7)使用ChatGPT辅助数据建模以及对模型的性能进行评估和优化。 本书采用由浅入深的写作方式,既确保了内容的可理解性,又保持了足够的深度,配有详细的代码示例和实践指导,确保每位读者能够轻松上手并从中获益,提升自己的分析效率和洞察能力。 本书采用案例驱动的写作方式,通过实际业务案例详细拆解AI技术在各个场景中的应用步骤和技巧。语言简洁易懂,理论与 目录 目 录?Contents<br />前 言<br />第1章 数据分析及ChatGPT概述 1<br />1.1 数据分析概述 1<br />1.1.1 用ChatGPT快速了解数据<br />分析 1<br />1.1.2 数据分析与数据挖掘 4<br />1.1.3 机器学习算法概述 5<br />1.2 常用AIGC工具的注册及使用 6<br />1.2.1 如何使用OpenAI的<br />GPT-3.5 6<br />1.2.2 如何使用百度的文心一言 10<br />1.2.3 如何使用科大讯飞的星火<br />认知大模型 14<br />1.3 使用ChatGPT辅助工具安装 16<br />1.3.1 Anaconda的安装 16<br />1.3.2 Jupyter Notebook的使用 17<br />1.4 使用ChatGPT辅助Python<br />入门 18<br />1.4.1 使用ChatGPT学习Python<br />数据对象 19<br />1.4.2 使用ChatGPT学习NumPy 23<br />1.4.3 使用ChatGPT学习Pandas 25<br />1.5 本章小结 28<br />第2章 使用ChatGPT学习数据<br />操作 29<br />2.1 使用ChatGPT学习数据的基本<br />管理 29<br />2.1.1 数据去重 29<br />2.1.2 数据排序 33<br />2.1.3 数据合并 35<br />2.1.4 数据分箱 38<br />2.2 使用ChatGPT学习描述统计<br />分析 40<br />2.2.1 描述统计分析概述 41<br />2.2.2 中心趋势分析 42<br />2.2.3 离散程度分析 45<br />2.2.4 分布形状分析 48<br />2.2.5 频数分布分析 50<br />2.3 使用ChatGPT学习中文文本<br />操作 52<br />2.3.1 Jieba分词 52<br />2.3.2 添加自定义词典 55<br />2.3.3 关键词提取 57<br />2.3.4 词性标注 60<br />2.4 使用ChatGPT学习图像数据<br />操作 62<br />2.4.1 图像的读取、显示及保存 62<br />2.4.2 图像像素的获取和编辑 64<br />2.4.3 图像的几何变换操作 65<br />2.5 本章小结 68<br />第3章 使用ChatGPT学习数据预<br />处理 69<br />3.1 使用ChatGPT学习数据抽样 69<br />3.1.1 常用的数据抽样方法 69<br />3.1.2 简单随机抽样 70<br />3.1.3 数据分区 73<br />3.1.4 分层随机抽样 76<br />3.1.5 数据类失衡处理 79<br />3.2 使用ChatGPT学习数据清洗 82<br />3.2.1 缺失值的识别及处理 82<br />3.2.2 异常值的识别及处理 89<br />3.3 使用ChatGPT学习数据变换 91<br />3.3.1 数据标准化处理 91<br />3.3.2 数据独热编码处理 94<br />3.4 本章小结 96<br />第4章 使用ChatGPT学习数据静态可视化 97<br />4.1 使用ChatGPT了解数据可视化<br />工具 97<br />4.2 使用ChatGPT学习Matplotlib<br />数据可视化 98<br />4.2.1 Matplotlib绘图基础 99<br />4.2.2 使用Matplotlib绘制图形 111<br />4.3 使用ChatGPT学习Pandas数据<br />可视化 130<br />4.3.1 Pandas绘图方法 130<br />4.3.2 使用Pandas绘制图形 132<br />4.4 使用ChatGPT学习Seaborn数据<br />可视化 138<br />4.4.1 Seaborn绘图方法 139<br />4.4.2 使用Seaborn绘制图形 140<br />4.5 使用ChatGPT学习plotnine数据<br />可视化 154<br />4.5.1 plotnine绘图方法 154<br />4.5.2 使用plotnine绘制图形 156<br />4.6 本章小结 158<br />第5章 使用ChatGPT学习交互数据<br />可视化 159<br />5.1 使用ChatGPT学习Plotly数据<br />可视化 159<br />5.1.1 Plotly交互可视化绘图<br />方法 160<br />5.1.2 使用graph_objs进行交互<br />可视化 161<br />5.1.3 使用express进行交互可<br />视化 174<br />5.2 使用ChatGPT学习Bokeh数据<br />可视化 180<br />5.2.1 Bokeh交互可视化绘图<br />方法 181<br />5.2.2 使用Bokeh进行交互可<br />视化 182<br />5.3 使用ChatGPT学习Pyecharts数据可视化 187<br />5.3.1 Pyecharts交互可视化绘图<br />方法 187<br />5.3.2 使用Pyecharts进行交互<br />可视化 188<br />5.4 本章小结 200<br />第6章 使用ChatGPT学习聚类<br />分析 201<br />6.1 使用ChatGPT了解无监督<br />学习 201<br />6.2 聚类分析方法概述 203<br />6.3 k均值聚类 205<br />6.3.1 k均值聚类的原理 205<br />6.3.2 k均值聚类的Python<br />实现 206<br />6.3.3 案例:对iris数据集进行k<br />均值聚类 208<br />6.3.4 使用统计方法寻找很好聚类<br />簇数 210<br />6.4 层次聚类 215<br />6.4.1 层次聚类的原理 215<br />6.4.2 层次聚类的Python实现 217<br />6.4.3 案例:对USArrests数据集进行层次聚类 218<br />6.4.4 使用轮廓系数寻找很好聚类<br />簇数 222<br />6.5 密度聚类 223<br />6.5.1 密度聚类的原理 223<br />6.5.2 密度聚类的Python实现 225<br />6.5.3 案例:对multishapes数据集进行密度聚类 226<br />6.6 本章小结 230<br />第7章 使用ChatGPT学习降维算法及关联规则分析 231<br />7.1 使用ChatGPT了解降维算法 231<br />7.2 主成分分析 233<br />7.2.1 主成分分析的原理 233<br />7.2.2 主成分分析的Python<br />实现 234<br />7.2.3 案例:对iris数据集进行主成<br />分分析 236<br />7.3 关联规则分析 239<br />7.3.1 关联规则分析的原理 239<br />7.3.2 关联规则分析的Python<br />实现 241<br />7.3.3 案例:对用户购买物品的行为<br />进行关联规则分析 242<br />7.4 本章小结 249<br />第8章 使用ChatGPT学习回归<br />分析 250<br />8.1 使用ChatGPT了解常用的有监督<br />学习算法 250<br />8.2 一元线性回归 252<br />8.2.1 一元线性回归的原理 252<br />8.2.2 使用scikit-learn实现一元线<br />性回归 254<br />8.2.3 案例:对women数据集进行<br />一元线性回归 255<br />8.3 多元线性回归 258<br />8.3.1 多元线性回归的原理 259<br />8.3.2 案例:对个人医疗费用进行<br />多元线性回归 259<br />8.4 对自变量中有定性变量的数据集进行线性回归 263<br />8.4.1 对自变量中有定性变量的数据<br />集建立线性回归模型 263<br />8.4.2 回归模型的效果评估 267<br />8.5 通过逐步回归寻找很优模型 270<br />8.6 逻辑回归 272<br />8.6.1 逻辑回归的原理 272<br />8.6.2 逻辑回归的Python实现 274<br />8.6.3 案例:对iris数据集进行逻辑<br />回归 275<br />8.7 本章小结 276<br />第9章 使用ChatGPT学习决策树算法及随机森林算法 277<br />9.1 决策树算法的原理 277<br />9.1.1 决策树算法概述 277<br />9.1.2 常用的决策树算法 280<br />9.2 决策树算法的Python实现 288<br />9.2.1 实现决策树算法的常用库 288<br />9.2.2 基于scikit-learn实现决策树<br />分类 289<br />9.3 案例:对iris数据集进行决策树<br />分类 290<br />9.3.1 构建决策树 290<br />9.3.2 查看生成的决策规则 291<br />9.3.3 决策树可视化 293<br />9.3.4 绘制决策边界 295<br />9.4 案例:对乳腺癌数据集进行决策树分类 299<br />9.4.1 构建决策树分类模型 299<br />9.4.2 对决策树分类模型进行<br />调优 304<br />9.5 随机森林算法的原理及实现 305<br />9.5.1 常用的集成学习算法 305<br />9.5.2 基于scikit-learn实现随机森林<br />分类 307<br />9.5.3 案例:对乳腺癌数据集进行<br />随机森林分类 309<br />9.6 本章小结 311<br />第10章 使用ChatGPT学习k近邻算法及支持向量机算法 312<br />10.1 k近邻算法的原理 312<br />10.1.1 k近邻算法的思想 312<br />10.1.2 k近邻算法的推导过程 313<br />10.1.3 距离的度量方法 315<br />10.2 k近邻算法的Python实现 316<br />10.2.1 基于scikit-learn实现k近邻<br />分类 316<br />10.2.2 案例:对乳腺癌数据集进行<br />k近邻分类 318<br />10.3 支持向量机算法的原理 322<br />10.3.1 了解支持向量机 323<br />10.3.2 常见的支持向量机模型 325<br />10.4 支持向量机算法的Python<br />实现 326<br />10.4.1 基于scikit-learn实现支持向<br />量机分类 326<br />10.4.2 案例:对乳腺癌数据集进行<br />支持向量机分类 328<br />10.5 本章小结 331<br />第11章 使用ChatGPT学习神经网络<br />算法 332<br />11.1 神经网络算法的理论基础 332<br />11.1.1 了解神经网络算法 332<br />11.1.2 神经网络的拓扑结构 333<br />11.1.3 常用的激活函数 335<br />11.1.4 常用的神经网络模型 338<br />11.2 前馈神经网络 339<br />11.2.1 了解前馈神经网络 339<br />11.2.2 前馈神经网络的scikit-learn<br />实现 341<br />11.2.3 案例:对乳腺癌数据集进行<br />前馈神经网络分类 342<br />11.3 卷积神经网络 346<br />11.3.1 卷积神经网络的原理 346<br />11.3.2 卷积层的原理 349<br />11.3.3 卷积层的TensorFlow<br />实现 352<br />11.3.4 池化层的原理 357<br />11.3.5 池化层的TensorFlow<br />实现 359<br />11.3.6 全连接层 361<br />11.3.7 案例:使用卷积神经网络<br />实现手写数字识别 362<br />11.4 本章小结 368<br />第12章 使用ChatGPT学习模型性能<br />评估及优化 369<br />12.1 模型性能评估 369<br />12.1.1 数值预测的评估方法及其scikit-learn实现 369<br />12.1.2 分类预测的评估方法及其scikit-learn实现 371<br />12.2 模型参数优化 375<br />12.2.1 正则化 375<br />12.2.2 数据分区 377<br />12.2.3 K折交叉验证 378<br />12.2.4 网格搜索 379<br />12.2.5 Dropout 381<br />12.2.6 梯度下降法 382<br />12.3 案例:对乳腺癌数据集寻找<br />很优模型 385<br />12.4 本章小结 389 |