第1章 發(fā)掘數(shù)據金礦的工具:
BI與DW、OLAP、DM 1
1.1 企業(yè)經營管理活動對
商業(yè)智能的需求 1
1.1.1 企業(yè)經營活動面臨的挑戰(zhàn) 1
1.1.2 企業(yè)決策實現(xiàn)過程的
信息需求 4
1.1.3 企業(yè)信息化系統(tǒng)的進化 5
1.2 商業(yè)智能的技術構成 7
1.2.1 什么是商業(yè)智能 7
1.2.2 商業(yè)智能的結構描述 9
1.2.3 數(shù)據挖掘和商業(yè)智能工具 11
1.2.4 商業(yè)智能工具的選擇 12
1.2.5 SQL Server 2005的
商業(yè)智能構架 13
1.3 部署商業(yè)智能 14
1.3.1 商業(yè)智能如何協(xié)助
企業(yè)管理 14
1.3.2 商業(yè)智能在各領域的應用 15
1.3.3 商業(yè)智能應用實例 17
第2章 構建簡單的BI應用:
福馬特商業(yè)智能系統(tǒng) 21
2.1 設計和創(chuàng)建數(shù)據倉庫 21
2.1.1 原始業(yè)務數(shù)據分析 21
2.1.2 設計數(shù)據倉庫邏輯模型 22
2.1.3 創(chuàng)建foodmartsaleDW
數(shù)據倉庫 23
2.2 設計和使用ETL 23
2.3 創(chuàng)建OLAP數(shù)據立方 27
2.3.1 定義數(shù)據源 27
2.3.2 定義數(shù)據源視圖 28
2.3.3 生成多維數(shù)據集 30
2.4 創(chuàng)建和使用報表 34
2.4.1 創(chuàng)建報表 35
2.4.2 使用報表 38
2.5 實現(xiàn)其他前端展現(xiàn) 39
2.6 使用數(shù)據挖掘獲取商業(yè)智能 42
2.6.1 商務需求分析 42
2.6.2 創(chuàng)建挖掘結構 43
2.6.3 從數(shù)據挖掘中獲取
有價值的信息 44
第3章 BI分析的基石:
結構良好的數(shù)據倉庫設計 47
3.1 數(shù)據的兩種組織形式:
操作數(shù)據和分析數(shù)據 47
3.1.1 操作型系統(tǒng)和分析型
系統(tǒng)的分離 47
3.1.2 事務處理和分析
處理的對比 48
3.1.3 操作型數(shù)據與分析型
數(shù)據的對比 49
3.1.4 數(shù)據倉庫的特點 50
3.2 數(shù)據倉庫設計方法論 53
3.2.1 數(shù)據庫設計與
數(shù)據倉庫設計 53
3.2.2 數(shù)據倉庫的架構方式
及其比較 55
3.2.3 宏觀上的數(shù)據倉庫設計 60
3.2.4 微觀上的數(shù)據倉庫設計 61
3.2.5 2種創(chuàng)建數(shù)據倉庫的模式 62
3.2.6 技術上需要關注的
重點步驟 63
3.3 理解歷史數(shù)據和分析需求 64
3.3.1 “數(shù)據驅動+用戶驅動”
的設計理念 64
3.3.2 理解業(yè)務數(shù)據 64
3.3.3 確定用戶對分析型
數(shù)據的需求 69
3.4 明確倉庫的對象:主題和元數(shù)據 72
3.4.1 信息打包技術 73
3.4.2 理解數(shù)據倉庫中的主題 77
3.4.3 理解數(shù)據倉庫中的元數(shù)據 80
3.5 確定分析內容的構成:
事實及其粒度 81
3.5.1 事實、度量和事實表 82
3.5.2 事實表的設計 82
3.5.3 粒度的設計 83
3.5.4 聚合的設計 89
3.5.5 數(shù)據分割 90
3.6 規(guī)劃分析的視角:維度 91
3.6.1 維度的構成 91
3.6.2 維度的特性 91
3.6.3 維度的分類 92
3.6.4 維度的層次和級別 94
3.6.5 維度的緩慢變化
特性及其處理 95
3.6.6 典型的維度設計 97
3.7 數(shù)據倉庫物理模型設計 99
3.7.1 設計存儲結構 99
3.7.2 設計索引策略 100
3.7.3 設計存儲策略 100
3.8 數(shù)據倉庫設計示例 102
3.8.1 銷售數(shù)據倉庫 102
3.8.2 保險業(yè)數(shù)據倉庫 103
3.9 數(shù)據倉庫數(shù)據庫設計的心得總結 104
3.9.1 透徹理解數(shù)據
倉庫設計過程 104
3.9.2 把握設計的關鍵環(huán)節(jié) 104
3.9.3 分離非分析數(shù)據 105
第4章 用SSIS對數(shù)據進行ETL操作 107
4.1 認識SSIS 107
4.1.1 使用SSIS的效果 107
4.1.2 SSIS的工作原理 108
4.1.3 第一個SSIS包的設計 110
4.2 SSIS關鍵元素的使用 118
4.2.1 包 118
4.2.2 容器 119
4.2.3 任務 126
4.2.4 優(yōu)先約束 136
4.2.5 源 138
4.2.6 轉換 139
4.2.7 目標 140
4.2.8 連接管理器 141
4.2.9 變量 141
4.2.10 事件處理程序 142
4.2.11 日志提供程序 143
4.3 創(chuàng)建一個完整的SSIS包 146
4.3.1 生成SSIS解決方案 147
4.3.2 設計控制流 148
4.3.3 設計數(shù)據連接 150
4.3.4 設計數(shù)據流 151
4.3.5 項目總結 155
4.4 包的調試 155
4.4.1 控制流的調試 156
4.4.2 數(shù)據流的調試 157
4.5 包的配置和部署 159
4.5.1 包的配置 159
4.5.2 包的部署 161
4.5.3 包的運行 162
4.6 SSIS的管理 164
4.6.1 管理SSIS服務 164
4.6.2 配置SSIS服務 165
第5章 SSIS在商業(yè)智能中的典型應用 167
5.1 SSIS在BI系統(tǒng)中的應用場景 167
5.1.1 合并異類數(shù)據 167
5.1.2 填充數(shù)據倉庫和數(shù)據集市 167
5.1.3 數(shù)據清洗 168
5.1.4 處理過程中加入智能轉換 168
5.1.5 自動化數(shù)據管理和加載 168
5.2 一個復雜的商務應用實例分析 169
5.2.1 包的構成 169
5.2.2 功能及其實現(xiàn)的原理分析 170
5.3 業(yè)務數(shù)據裝載 175
5.3.1 商務需求及其設計思路 175
5.3.2 設計基本的功能 177
5.3.3 用循環(huán)加載全部數(shù)據 179
5.3.4 增強數(shù)據加載的靈活性 179
5.3.5 增強包的可維護性 181
5.3.6 增強包的魯棒性 182
5.4 數(shù)據清洗 183
5.4.1 商務需求 184
5.4.2 設計思路 185
5.4.3 方案實現(xiàn) 185
5.5 SSIS商業(yè)智能應用總結 187
第6章 用SSAS進行OLAP操作 189
6.1 AS2005中OLAP的設計方法 189
6.1.1 自下而上的設計方法 189
6.1.2 自上而下的設計方法 190
6.1.3 兩種方法的使用 191
6.2 統(tǒng)一維度模型 191
6.3 OLAP的操作對象:
數(shù)據立方的創(chuàng)建 193
6.3.1 自上而下生成Cube 194
6.3.2 自下而上生成Cube 203
6.3.3 部署Cube 207
6.4 Cube的構成及其各種操作 208
6.4.1 Cube的構成 209
6.4.2 多維數(shù)據集結構 210
6.4.3 維度用法 213
6.4.4 計算 214
6.4.5 KPI 215
6.4.6 操作 216
6.4.7 分區(qū) 217
6.4.8 透視 220
6.4.9 翻譯 221
6.4.10 瀏覽器 224
6.5 通過OLAP進行數(shù)據分析 226
6.5.1 切片 226
6.5.2 切塊 227
6.5.3 鉆取 228
6.5.4 旋轉 229
第7章 數(shù)據立方的增強及其應用 231
7.1 修改Cube結構 231
7.1.1 修改度量值 231
7.1.2 修改“客戶”維度 232
7.1.3 修改“時間”維度 234
7.1.4 修改“產品”維度 236
7.2 加入分銷事實表及其維度 238
7.3 完善新增維度 239
7.3.1 父子維度的使用 239
7.3.2 分銷商維度的修改 242
7.3.3 雇員維度的修改 243
7.3.4 促銷維度的修改 244
7.3.5 維度屬性的特殊處理 244
7.4 設置維度與度量值組的關系 248
7.4.1 常規(guī)維度關系及其定義 249
7.4.2 引用維度關系及其定義 250
7.4.3 事實維度關系及其定義 252
7.4.4 多對多維度關系及其定義 254
7.5 增加計算 257
7.5.1 計算成員的創(chuàng)建 257
7.5.2 命名集的創(chuàng)建 260
7.5.3 其他腳本命令的創(chuàng)建 261
7.6 定義和使用KPI 261
7.6.1 KPI的設計 262
7.6.2 KPI的使用 265
7.7 增強操作 265
7.8 配置訪問權限 267
第8章 用MDX擴展OLAP功能 269
8.1 初識MDX 269
8.1.1 MDX在多維數(shù)據集
中的角色 269
8.1.2 使用模板創(chuàng)建
第一個MDX 270
8.1.3 MDX與SQL比較 271
8.2 MDX的構造解析 272
8.2.1 MDX語句的
基本組成部分 272
8.2.2 成員 273
8.2.3 元組 273
8.2.4 集合 274
8.2.5 區(qū)分MDX的元素 274
8.3 MDX定義語句的使用 275
8.3.1 CREATE SUBCUBE 276
8.3.2 CREATE MEMBER 276
8.4 MDX操作語句的使用 277
8.4.1 DRILLTHROUGH 277
8.4.2 SELECT 278
8.5 MDX腳本語句的使用 278
8.5.1 CALCULATE 279
8.5.2 CASE 279
8.5.3 SCOPE 280
8.6 WITH子句及其使用 281
8.6.1 用WITH創(chuàng)建命名集 281
8.6.2 用WITH創(chuàng)建計算成員 282
第9章 用SSRS處理智能報表 283
9.1 報表基本知識 283
9.1.1 報表與商業(yè)智能 283
9.1.2 SSRS的結構 284
9.1.3 SSRS報表的3種狀態(tài) 285
9.1.4 用SSRS做一個
簡單的報表 286
9.2 SSRS的配置與管理 289
9.2.1 報表管理器 290
9.2.2 Reporting Services
配置工具 291
9.2.3 SQL Server外圍
應用配置器 292
9.2.4 SQL Server Management
Studio 293
9.2.5 其他配置和管理工具 294
9.3 增強基本報表的功能 294
9.3.1 分組與排序 294
9.3.2 計算 297
9.3.3 參數(shù)化報表 297
9.3.4 復雜的參數(shù)化報表 299
9.4 報表生成器的使用 302
9.4.1 報表生成器的啟動 302
9.4.2 報表模型的創(chuàng)建 302
9.4.3 即席報表的創(chuàng)建 306
第10章 基于SSAS的商業(yè)智能分析 309
10.1 構架商業(yè)智能系統(tǒng)的生命周期 309
10.2 商業(yè)智能向導 310
10.2.1 商務系統(tǒng)需要哪些智能? 311
10.2.2 商業(yè)智能向導的
基本使用 311
10.2.3 時間智能 313
10.2.4 賬戶智能 317
10.3 KPI分析 319
10.3.1 平衡計分卡(BSC)
與KPI 319
10.3.2 KPI技術在指標
衡量中的作用 320
10.3.3 KPI分析中的關鍵問題 321
10.4 80/20法則的分析 323
10.4.1 80/20法則 323
10.4.2 計算基本百分比 323
10.4.3 創(chuàng)建百分比比較表 324
10.5 用專業(yè)前端展現(xiàn)工具
呈現(xiàn)商業(yè)信息 324
10.5.1 前端展現(xiàn)的方法 325
10.5.2 用Excel 2007展現(xiàn)數(shù)據 326
10.5.3 SharePoint與
商業(yè)智能portal 336
第11章 數(shù)據挖掘體系結構與
基本使用方法 339
11.1 數(shù)據挖掘基本知識 339
11.1.1 數(shù)據挖掘與數(shù)據倉庫
及商業(yè)智能 339
11.1.2 數(shù)據挖掘體系結構 341
11.1.3 數(shù)據挖掘的工具 341
11.1.4 數(shù)據挖掘過程模型 342
11.2 SQL Server數(shù)據挖掘
方案的構成 344
11.2.1 定義問題 344
11.2.2 準備數(shù)據 345
11.2.3 瀏覽數(shù)據 345
11.2.4 生成模型 345
11.2.5 瀏覽和驗證模型 346
11.2.6 部署和更新模型 346
11.3 一個完整的數(shù)據挖掘過程
—線性回歸算法 346
11.3.1 挖掘環(huán)境的搭建 346
11.3.2 線性回歸的基本原理 348
11.3.3 使用線性回歸挖掘數(shù)據 349
11.4 邏輯回歸算法 356
11.4.1 基本原理 356
11.4.2 使用范例 357
11.4.3 驗證數(shù)據挖掘
模型的方法 359
11.4.4 邏輯回歸的參數(shù)設置 360
11.5 決策樹算法 361
11.5.1 基本原理 361
11.5.2 使用范例 362
11.5.3 決策樹的參數(shù)設置 363
11.6 聚類分析算法 364
11.6.1 基本原理 364
11.6.2 使用范例 365
11.7 Naive Bayes算法 366
11.7.1 基本原理 366
11.7.2 使用范例 366
11.8 關聯(lián)算法 367
11.8.1 基本原理 367
11.8.2 使用范例 368
11.9 數(shù)據挖掘算法使用小結 370
第12章 用數(shù)據挖掘技術滿足
商業(yè)分析需求 371
12.1 一個美麗的愛情故事 371
12.2 商業(yè)智能應用中的數(shù)據挖掘 372
12.2.1 哪些問題可以使用
Data mining 372
12.2.2 用什么挖掘技術
解決商業(yè)問題 373
12.2.3 挖掘中的非挖掘問題 374
12.3 潛在客戶分析 375
12.3.1 商業(yè)需求 375
12.3.2 解決方案 375
12.3.3 挖掘結果 377
12.4 購物籃分析 378
12.4.1 商業(yè)需求 378
12.4.2 解決方案 379
12.4.3 挖掘結果 380
12.5 數(shù)據挖掘的前端展現(xiàn):
Excel 2007數(shù)據挖掘插件 380
12.5.1 插件的配置 380
12.5.2 基本使用方法 381
12.6 數(shù)據挖掘不是萬能的 383
參考文獻 385
An organization’s ability to learn, and translate that learning into action rapidly, is the ultimate competitive advantage.
Jack Welch
Chairman, General Electric