![]()
编辑推荐 ·涵盖AIGC、大模型、扩散模型等热点话题; ·以技术视角透彻解读大模型底层技术; ·系统介绍GPT、LLaMa、GLM等主流大模型的技术原理; ·给出GPT的基本代码实现,帮助读者深入理解技术原理; ·介绍如何构建私有大模型,带领读者动手构建私有大模型。 内容推荐 本书从技术角度深度解析大模型的原理,从大模型的基础概念及领域发展现状入手,概述大模型的理论基础,介绍OpenAI GPT、清华大学GLM、Meta Llama等主流大模型的技术原理,并从大模型参数高效微调、大模型指令微调、大模型训练优化和大模型推理优化等多角度解析大模型背后的技术,带领读者全方位掌握大模型的原理和实践方法。本书最后介绍私有大模型的构建,手把手指导读者做技术选型并搭建自己的私有大模型。 本书适合人工智能领域有大模型开发需求或对大模型技术感兴趣的技术人员阅读,也适合普通用户扩展了解大模型的前沿应用。 目录 第1章大模型简介 1.1大模型初探 1.1.1 OpenAl大模型ChatGPT 1.1.2国内大模型——360智脑 1.2大模型的概念 1.3百花齐放——大模型发展现状 1.4压缩即智能——为什么ChatGPT拥有智能 1.4.1直观理解通用人工智能 1.4.2如何实现无损压缩 1.4.3GPT是对数据的无损压缩 1.5小结 1.6参考文献 第2章大模型理论基础 2.1什么是语言模型 2.2传统语言模型 …… |