本书是一本系统介绍Transformer原理、源码、应用的技术书籍,全书分为Transformer架构及源码篇、ChatGPT技术:从基础应用到进阶实践篇。
Transformer架构及源码篇,从Transformer的基本原理入手,深入浅出进行讲解,可使读者能够深刻理解Transformer的工作原理和设计思想,包括Transformer架构的理论知识、实际案例以及Transformer架构在时序预测等领域的应用等。本篇特点是采用大量的图片和图表,通过图文并茂的方式让读者直观地了解Trans-former的原理和应用和Bayesian Transformer思想及数学原理完整论证、Transformer架构源码完整实现、Transformer语言模型架构、数学原理及内幕机制、GPT自回归语言模型架构、数学原理及内幕机制、BERT下的自编码语言模型架构、数学原理及内幕机制、BERT Pre-taining模型源码完整实现、BERT Fine-tuning背后的数学原理详解、使用BERT进行NER案例实战、使用BERT进行多任务Fine-Tuning解密、使用BERT对影评数据分析的数据处理、模型代码、线上部署等方面的内容,深入分析Transformer在自然语言处理中的应用。
ChatGPT技术:从基础应用到进阶实践篇,则以ChatGPT技术为主线,介绍了GPT系列模型的发展历程和技术特点、ChatGPT技术的基本原理以及OpenAI API的基础应用实践等内容。
本书中既有理论讲述,又有案例应用指导,结构清晰,详略得当,既可作为机器学习、