网站首页  软件下载  游戏下载  翻译软件  电子书下载  电影下载  电视剧下载  教程攻略

请输入您要查询的图书:

 

书名 SQL Server2005Integration Services专家教程
分类
作者 (美)耐特//(美)弗尔曼
出版社 清华大学出版社
下载
简介
编辑推荐

不同于那些只注重功能介绍的书,本书的目的不是向您介绍所有属性、所有功能,而只是教会您如何将SSIS组件应用到ETL任务。本书首先提供了有关脚本和数据提取的所有背景知识和基础信息。然后详细介绍了数据仓储ETL、错误处理、管理和数据集成的内容。由于DTS的流行性,还有一章讲到了从DTS到SSIS的迁移,另有一章提到伸缩SSIS。

本书适用于有经验的SQL Server数据库开发人员、架构师和想使用SSIS构建ETL应用程序的管理人员。

内容推荐

通过阅读这样一本实用的参考书,开发能对数据进行ETL(提取、转换和加载)处理的解决方案将变得比以前更容易。本书介绍了如何应用SQL Server 2005 Integration Services(SSIS)组件构建符合要求的企业ETL应用程序,内容涉及数据仓储ETL、错误处理、管理和数据集成等,对SQL Server管理员有极高的参考价值。

本书由两位SQL Server MVP编写,给出了清楚的描述和具体的范例,全面介绍了有关脚本和数据提取方面的所有背景信息和基础知识,教会您设计和实现必要的体系结构以及应用正确的管理技术。通过学习本书,您将快速了解如何利用SSIS功能实现数据集成和处理需求。

本书主要内容:充分利用脚本开发出更高级的应用程序;关系型数据库转换及维度表和事实表的加载方法;逐步创建能简单、有效处理错误的复杂解决方案;利用SSIS功能更好地维护可移植程序的技巧;如何设计和调整程序包来实现最大的可伸缩性。

本书适用于有经验的SQL Server数据库开发人员、架构师和想使用SSIS构建ETL应用程序的管理人员。

目录

第1章 绪言 1

 1.1 选择合适的工具 1

1.1.1 数据仓储ETL 4

1.1.2 数据集成 6

1.1.3 SSIS管理 6

 1.2 SSIS的回顾 6

1.2.1 创建连接管理器 7

1.2.2 使用控制流 7

1.2.3 使用数据流 8

1.2.4 优先级约束 14

1.2.5 程序包执行 16

1.2.6 容器 18

1.2.7 回顾总结 19

 1.3 小结 19

第2章 扩展SSIS中的脚本 21

 2.1 Script Tasks和自定义库 22

2.1.1 用户定义的变量 22

2.1.2 通过代码检索变量 24

2.1.3 访问数据流中的变量 26

 2.2 构建一个自定义程序集 26

2.2.1 通过HTTP下载文件 29

2.2.2 将程序集添加到GAC 29

 2.3 使连接成为可配置的和动态的 35

 2.4 引发错误事件 37

 2.5 通过Script Component加密数据 39

 2.6 数据剖析 49

 2.7 小结 53

第3章 数据提取 55

 3.1 程序包连接和数据流源 56

3.1.1 源适配器 57

3.1.2 高级功能和概念 63

3.1.3 优化的数据分段方法 66

 3.2 增量数据提取 68

3.2.1 使用一个变化标识符值增量提取 69

3.2.2 从不带有触发器的SQL Server中进行增量提取 79

3.2.3 使用SSIS处理增量提取的各方面 81

 3.3 跟踪数据谱系标识符 85

 3.4 小结 87

第4章 使用SSIS进行维度ETL 89

 4.1 维度ETL概览 89

 4.2 维度基本知识 90

 4.3 维度ETL的挑战 93

4.3.1 为维度ETL准备数据 94

4.3.2 维度变化类型 98

 4.4 SSIS的Slowly Changing Dimension Wizard 103

4.4.1 SCD的高级属性和其他输出 114

4.4.2 渐变维度向导的优缺点 115

4.4.3 优化内置的渐变维度支持 116

4.4.4 带有渐变维度支持的高级维度处理 118

 4.5 创建一个自定义的渐变程序包 127

4.5.1 连接源数据和维度数据 128

4.5.2 确定维度变化 131

4.5.3 处理维度插入和更新 132

 4.6 小结 135

第5章 事实表ETL 137

 5.1 事实表概览 137

5.1.1 映射维度键 138

5.1.2 计算度量 138

5.1.3 添加元数据 139

5.1.4 事实表类型 139

 5.2 事实表ETL 140

 5.3 事实表ETL的难点 140

 5.4 事实表ETL的基础知识 141

5.4.1 获取维度代理键 141

5.4.2 度量计算 150

5.4.3 管理事实表变化 153

 5.5 高级事实表ETL概念 163

5.5.1 管理事实表粒度 163

5.5.2 粒度改变的SSIS示例 165

5.5.3 处理缺少维度查找 170

5.5.4 处理迟到事实 175

5.5.5 高级事实表加载 177

 5.6 小结 177

第6章 通过SSIS处理Analysis Services对象 179

 6.1 SSAS ETL处理和管理概述 179

6.1.1 SSAS对象和处理基础 180

6.1.2 通过SSIS处理SSAS对象的方法 185

6.1.3 分区的创建和修改 186

 6.2 SSIS中SSAS集成的基础知识 186

6.2.1 SSAS的控制流任务 187

6.2.2 SSAS对象的数据流目标 192

 6.3 高级处理和分区管理的示例 195

6.3.1 维度的处理 195

6.3.2 分区的创建和处理 198

6.3.3 分区管理 205

6.3.4 处理来自非SQL Server源的SSAS立方体 208

6.3.5 特性关系上类型1、类型2以及推断成员的含义 209

 6.4 小结 211

第7章 程序包的可靠性 213

 7.1 错误和事件处理 213

7.1.1 事件处理程序的类型 213

7.1.2 通过事件处理程序进行审核 214

7.1.3 禁止事件处理功能 217

7.1.4 将快照集成到SSIS中 218

 7.2 日志记录 222

7.2.1 创建唯一的日志文件 225

7.2.2 关于日志记录提供器的报告 226

 7.3 检查点文件 227

7.3.1 动态化检查点文件名 230

7.3.2 错误逻辑的测试 230

 7.4 事务 232

 7.5 原始文件 235

 7.6 前摄的WMI集成(Proactive WMI Integration) 240

 7.7 File Watcher Task的构建 241

 7.8 小结 243

第8章 部署 245

 8.1 与SSIS中的团队一起工作 245

8.1.1 源控制集成 245

8.1.2 添加新项目 246

 8.2 可重用的程序包 250

 8.3 程序包模板的创建 250

 8.4 程序包的配置 251

8.4.1 SSIS程序包配置 251

8.4.2 配置知识库 256

 8.5 部署实用程序 266

 8.6 小结 270

第9章 SSIS的管理 271

 9.1 Package Store 271

9.1.1 SSIS中央服务器的创建 274

9.1.2 SSIS的群集 275

9.1.3 文件系统或msdb部署 277

 9.2 Management Studio 278

 9.3 通过DTExecUI来运行程序包 280

 9.4 安全性 286

 9.5 防火墙问题 288

 9.6 命令行实用程序 288

9.6.1 DTExec.exe 288

9.6.2 DTUtil.exe 289

 9.7 程序包的调度 290

 9.8 代理账户 292

 9.9 64位的问题 295

 9.10 性能计数器 297

 9.11 小结 298

第10章 异构数据和不寻常数据的处理 299

 10.1 不寻常数据流的情形 299

  10.1.1 通过列来创建行 299

10.1.2 单个文件中的多个记录类型 303

  10.1.3 原始文件的使用 310

 10.2 Oracle 313

  10.2.1 从Oracle中读取数据 313

  10.2.2 把数据写到Oracle中 317

 10.3 其他的数据源 318

  10.3.1 DB2 318

  10.3.2 VSAM 319

 10.4 小结 320

第11章 从DTS迁移到SSIS 321

 11.1 SQL Server 2005 DTS的向后兼容性 321

 11.2 DTS程序包的管理和编辑 321

 11.3 从DTS升级 325

  11.3.1 Upgrade Advisor 326

  11.3.2 Migration Wizard 327

 11.4 例外情况的处理 330

11.4.1 Dynamic PropertiesTask 331

11.4.2 Complex Transform Data Tasks 333

11.4.3 Flat File Connection Manager 336

  11.4.4 ActiveX Script Task 337

 11.5 小结 338

第12章 扩展SSIS 339

 12.1 概述 339

 12.2 SSIS可伸缩性的基础 339

12.2.1 SSIS服务的状态 340

12.2.2 确定任务的持续时间 340

12.2.3 内存的利用率 343

12.2.4 SQL操作和数据流之间的平衡 346

 12.3 数据流的优化 348

  12.3.1 管道体系结构的回顾 348

  12.3.2 普通的管道优化 351

  12.3.3 数据流的属性 355

  12.3.4 目标的优化 357

 12.4 程序包执行的原则 363

12.4.1 “程序包的存储位置”对“执行位置” 363

12.4.2 Execute SQL Task和 Bulk Insert Task Execution 364

12.4.3 程序包执行和数据流 364

12.4.4 源或目标服务器上的程序包执行 364

12.4.5 单独的SSIS服务器 366

12.4.6 分布式的程序包执行 367

 12.5 小结 369

随便看

 

霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。

 

Copyright © 2002-2024 101bt.net All Rights Reserved
更新时间:2025/4/29 17:41:10