![]()
内容推荐 本书为新文科教育指导思想下的金融科技编程教材,通过示例讲解Python编程在审计行业的具体应用。作者基于20多年的大学计算机教学经历与行业大数据人工智能软件开发经验,从基本的概念开始,逐步深入地介绍清洗表格数据、采集网络信息、手写票据的光学字符识别、财经文本的量化、知识图谱自动构建等热门知识要点,并通过实例给出算法原理与实现路径,同时详细介绍了代码生成的过程和结果,有助于读者真正掌握大数据审计中的Python编程思想与技术,并将其应用于自己的生产实践中。 本书可作为高等院校审计、财经和金融科技等专业相关课程的教材,也可作为财经和金融科技等方面从业人员的培训用书和参考书。 目录 第1章 审计基础与审计报告的构成 1.1 审计概述 1.1.1 审计概念 1.1.2 审计目的 1.1.3 审计风险 1.1.4 审计证据 1.2 会计概述 1.2.1 会计的概念及基本假设 1.2.2 会计信息质量要求 1.2.3 财务会计报告简述 1.2.4 会计科目简述 1.3 审计报告的构成 1.3.1 审计意见 1.3.2 形成审计意见的基础 1.3.3 关键审计事项 1.3.4 其他信息 1.3.5 管理层和治理层对财务报表的责任 1.3.6 注册会计师对财务报表审计的责任 1.4 智能审计国内外研究现状 1.4.1 国外研究现状 1.4.2 国内研究现状 1.5 如何构建人工智能审计规则 1.5.1 基于法律法规构建规则库 1.5.2 基于家经验构建规则库 参考文献 第2章 Python语法基础 2.1 Python开发环境安装 2.1.1 Anaconda的安装 2.1.2 PyCharm的安装配置 2.2 数据类型 2.2.1 数字 2.2.2 字符串 2.2.3 列表与元组 2.2.4 字典与集合 2.3 语句语法 2.3.1 变量、行、缩进与注释 2.3.2 运算符 2.3.3 布尔值和空值 2.3.4 if条件语句 2.3.5 for循环语句 2.3.6 while循环语句 2.3.7 break与continue 2.4 函数与库 2.4.1 函数的定义与调用 2.4.2 函数的返回值与作用域 2.4.3 常用基本函数介绍 2.4.4 库 2.5 文件的读与写 2.5.1 input()函数与print()函数 2.5.2 文件的写作 2.5.3 文件的读作 2.6 类 2.6.1 类和对象的基本概念 2.6.2 面向对象的征 2.6.3 type和isinstance 2.7 读写数据库MySQL 2.7.1 MySQL的安装配置 2.7.2 Python与MySQL的交互 参考文献 第3章 Python科学计算与表格处理 3.1 Python科学计算 3.1.1 Pandas库 3.1.2 NumPy库 3.1.3 Pipeline 3.2 表格处理 3.2.1 读取表格文件 3.2.2 表格数据的合并与拼接 3.2.3 输出到表格文件 第4章 数据预处理:清洗表格数据 4.1 数据背景 4.2 数据清洗 4.2.1 内容替换 4.2.2 数据类型转换 4.2.3 删除无效数据 4.2.4 数据创造 4.2.5 DataFrame转换 第5章 数据预处理:采集网络信息 5.1 爬虫基础知识 5.1.1 网页源代码 5.1.2 正则表达式 5.2 爬虫基础方式 5.2.1 提取搜狗资讯标题、网址、日期和来源 5.2.2 获取百度翻译结果 5.2.3 Selenium库详解 5.2.4 BeautifulSoup库详解 5.3 爬虫处理方法 5.3.1 处理数据乱码 5.3.2 数据清洗与筛选 5.3.3 生成数据文本文件 5.3.4 批量爬取多家公司多页资讯 5.3.5 基础爬虫实践 5.3.6 Python与MySQL的交互实践 参考文献 第6章 数据预处理:解析财经报告 6.1 批量下载PDF文件位置 6.2 解析单个PDF文件信息 6.2.1 解析PDF文件的文本内容 6.2.2 解析PDF文件的表格内容 6.3 批量提取PDF文件信息 6.3.1 批量输出PDF文件的文本内容 6.3.2 筛选并转移PDF文件 参考文献 第7章 数据预处理:手写票据的光学字符识别 7.1 问题场景 7.2 表格和单元格定位 7.2.1 解析PDF文件 7.2.2 表格定位 7.2.3 表格自动旋转 7.2.4 单元格定位 7.3 单元格配准 7.3.1 DBSCAN聚类 7.3.2 描述性统计 7.3.3 模板可视化 7.4 单元格内容识别 7.4.1 图片预处理 7.4.2 LSTM-RNN-CTC模型 第8章 自然语言处理:财经文本的量化 8.1 自然语言处理 8.1.1 自然语言处理概述 8.1.2 机器学 8.1.3 语料库 8.1.4 HanLP环境搭建 8.2 中文分词 8.2.1 中文分词 8.2.2 词典分词 8.2.3 二元语法分词 8.2.4 词典的构建 8.3 命名实体识别 8.3.1 命名实体识别 8.3.2 基于规则的命名实体识别 8.3.3 基于预训练模型的实体关系抽取 8.3.4 基于依存句法分析的实体关系抽取 8.3.5 财经文本命名实体识别 8.4 信息提取 8.4.1 关键词提取 8.4.2 关键句提取 8.4.3 情感分析 8.5 综合训练 参考文献 第9章 自然语言处理:金融文本摘要 9.1 文本摘要自动生成概述 9.1.1 研究背景与问题定义 9.1.2 技术分类与实现方法 9.1.3 评指标与数据集 9.2 偏好构建模块 9.2.1 获取偏好文本 9.2.2 文本预处理 9.2.3 LDA主题模型 9.2.4 构建偏好语料库 9.3 锁定段落中心句 9.3.1 获取偏好文本关键词 9.3.2 相似度计算 9.3.3 提取携带偏好的段落中心句 9.4 摘要生成模块 9.4.1 依存句法分析 9.4.2 结构树剪枝 参考 |