日韩精品 中文字幕 动漫,91亚洲午夜一区,在线不卡日本v一区v二区丶,久久九九国产精品自在现拍

注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術計算機/網(wǎng)絡數(shù)據(jù)庫數(shù)據(jù)庫挖掘/數(shù)據(jù)倉庫數(shù)據(jù)挖掘原理與應用:SQL Server 2005數(shù)據(jù)庫

數(shù)據(jù)挖掘原理與應用:SQL Server 2005數(shù)據(jù)庫

數(shù)據(jù)挖掘原理與應用:SQL Server 2005數(shù)據(jù)庫

定 價:¥46.00

作 者: (美)唐(Tang,Z.H.),(美)麥克雷南(MaccLennan,J.) 著,鄺祝芳,焦賢龍,高升 譯
出版社: 清華大學出版社
叢編項: 國外計算機科學經典教材
標 簽: 數(shù)據(jù)庫存儲與管理

ISBN: 9787302140009 出版時間: 2007-01-01 包裝: 膠版紙
開本: 185×260 頁數(shù): 407 字數(shù):  

內容簡介

  本書作為一本專家級指南,全面介紹了SQL Server 2005中數(shù)據(jù)挖掘的功能,并且對這些功能的應用作了較為詳盡的講述。書中不但講述了數(shù)據(jù)挖掘的核心概念,還講述了數(shù)據(jù)挖掘的最新發(fā)展趨勢,并給出了一些數(shù)據(jù)挖掘的最佳實踐。...

作者簡介

  本書提供作譯者介紹ZhaoHui Tang是Microsoft SQL Server數(shù)據(jù)挖掘團隊的項目經理。. Jamie MacLennan是SQL Server數(shù)據(jù)挖掘引擎開發(fā)團隊的開發(fā)組長。..ZhaoHui和Jamie是SQL Server數(shù)據(jù)挖掘組件的核心設計者,他們不僅經常在大型的數(shù)據(jù)庫和數(shù)據(jù)挖掘會議上作報告,而且還在學術和行業(yè)刊物上發(fā)表很多有關SQL Server數(shù)據(jù)挖掘方面的文章。...

圖書目錄

1.1  什么是數(shù)據(jù)挖掘    1
1.2  數(shù)據(jù)挖掘解決的商業(yè)問題    4
1.3  數(shù)據(jù)挖掘的任務    5
1.3.1  分類    5
1.3.2  聚類    5
1.3.3  關聯(lián)    6
1.3.4  回歸    6
1.3.5  預測    7
1.3.6  序列分析    7
1.3.7  偏差分析    8
1.4  數(shù)據(jù)挖掘技術    8
1.5  數(shù)據(jù)流    9
1.6  數(shù)據(jù)挖掘項目的生命周期    10
1.6.1  第1步:數(shù)據(jù)收集    10
1.6.2  第2步:數(shù)據(jù)清理和轉換    10
1.6.3  第3步:模型構建    12
1.6.4  第4步:模型評估    12
1.6.5  第5步:報告    13
1.6.6  第6步:預測(評分)    13
1.6.7  第7步:應用集成    13
1.6.8  第8步:模型管理    13
1.7  數(shù)據(jù)挖掘當前市場與主要廠商    14
1.7.1  數(shù)據(jù)挖掘市場的大小    14
1.7.2  主要生產廠商和產品    14
1.8  目前存在的問題及挑戰(zhàn)    15
1.9  數(shù)據(jù)挖掘標準    16
1.10  OLE DB for DM規(guī)范和
XML for Analysis規(guī)范    16
1.10.1  用于數(shù)據(jù)挖掘的SQL/Multimedia    17
1.10.2  Java數(shù)據(jù)挖掘API    18
1.10.3  預測模型標記語言    20
1.10.4  Crisp-DM模型    23
1.10.5  公共倉庫元數(shù)據(jù)    24
1.11  數(shù)據(jù)挖掘的新趨勢    25
1.12  本章小結    26
第2章  OLE DB for DM規(guī)范    27
2.1  OLE DB介紹    27
2.2  為什么使用OLE DB進行數(shù)據(jù)挖掘    29
2.3  OLE DB for DM規(guī)范中的基本概念    31
2.3.1  事例    31
2.3.2  事例鍵    32
2.3.3  嵌套鍵    32
2.3.4  事例表和嵌套表    33
2.3.5  標量列和表列    33
2.3.6  數(shù)據(jù)挖掘模型    33
2.3.7  模型創(chuàng)建    33
2.3.8  模型訓練    33
2.3.9  模型預測    34
2.4  DMX    34
2.4.1  數(shù)據(jù)挖掘的3個步驟    34
2.4.2  預測函數(shù)    43
2.4.3  單例查詢    50
2.4.4  僅僅使用內容進行預測    51
2.4.5  鉆取模型的內容    52
2.4.6  內容查詢    52
2.5  理解模式行集    52
2.5.1  Mining_Services模式行集    53
2.5.2  Service_Parameters模式行集    54
2.5.3  Mining_Models模式行集    54
2.5.4  Mining_Columns模式行集    55
2.5.5  Mining_Model_Content模式行集    55
2.5.6  Query_Content模式行集    58
2.5.7  Mining_Functions模式行集    59
2.5.8  Model_PMML模式行集    60
2.6  理解用于挖掘結構的DMX擴展    60
2.6.1  挖掘結構    60
2.6.2  挖掘結構的DMX擴展    61
2.6.3  Mining Structure模式行集    62
2.7  本章小結    63
第3章  實踐SQL Server數(shù)據(jù)挖掘    65
3.1  BI Dev Studio介紹    65
3.1.1  理解用戶界面    66
3.1.2  脫機模式和即時模式    68
3.2  設置數(shù)據(jù)源    72
3.2.1  數(shù)據(jù)源    72
3.2.2  使用數(shù)據(jù)源視圖    74
3.3  創(chuàng)建和編輯模型    83
3.3.1  結構和模型    83
3.3.2  使用數(shù)據(jù)挖掘向導    83
3.3.3  創(chuàng)建MovieClick挖掘結構和挖掘模型    88
3.3.4  使用數(shù)據(jù)挖掘設計器    89
3.4  處理    94
3.5  使用模型    96
3.5.1  了解模型查看器    96
3.5.2  使用挖掘準確性圖表    98
3.5.3  為MovieClick模型創(chuàng)建一個提升圖    101
3.5.4  使用挖掘模型預測    101
3.5.5  針對MovieClick模型執(zhí)行查詢    102
3.5.6  創(chuàng)建數(shù)據(jù)挖掘報表    103
3.6  使用SQL Server Management Studio    104
3.6.1  了解Management Studio用戶界面    105
3.6.2  使用對象資源管理器    106
3.6.3  使用查詢編輯器    106
3.7  本章小結    107
第4章  Microsoft貝葉斯算法    109
4.1  貝葉斯算法介紹    109
4.2  理解貝葉斯算法的基本原理    110
4.3  貝葉斯算法的參數(shù)    112
4.4  使用貝葉斯算法    113
4.4.1  DMX    114
4.4.2  理解貝葉斯模型的內容    115
4.4.3  瀏覽貝葉斯模型    117
4.5  本章小結    120
第5章  Microsoft決策樹算法    121
5.1  決策樹算法介紹    121
5.2  決策樹算法的基本原理    122
5.2.1  決策樹生成的基本思想    122
5.2.2  處理變量中的多個狀態(tài)    125
5.2.3  避免過度訓練    125
5.2.4  結合先驗知識    126
5.2.5  特征選擇    126
5.2.6  使用連續(xù)的輸入屬性    127
5.2.7  回歸    127
5.2.8  使用Microsoft決策樹算法進行關聯(lián)分析    128
5.3  理解算法參數(shù)    129
5.4  使用決策樹算法    131
5.4.1  DMX查詢    131
5.4.2  模型內容    135
5.4.3  解釋模型    136
5.5  本章小結    139
第6章  Microsoft時序算法    141
6.1  Microsoft時序算法介紹    141
6.2  Microsoft時序算法的
基本原理    142
6.2.1  自動回歸    142
6.2.2  使用多個時間序列    144
6.2.3  自動回歸樹    144
6.2.4  季節(jié)性    145
6.2.5  預測歷史    146
6.2.6  高速緩存預測    146
6.3  理解時序算法的參數(shù)    147
6.4  使用Microsoft時序算法    148
6.4.1  DMX查詢    148
6.4.2  模型內容    152
6.4.3  模型解釋    152
6.5  本章小結    155
第7章  Microsoft聚類算法    157
7.1  Microsoft聚類算法介紹    158
7.2  聚類算法的基本原理    159
7.2.1  硬聚類算法與軟聚類算法    160
7.2.2  離散聚類    161
7.2.3  可伸縮聚類    162
7.2.4  聚類預測    163
7.3  聚類算法的參數(shù)    163
7.4  使用聚類模型    166
7.4.1  將聚類作為一個分析步驟    166
7.4.2  DMX    167
7.4.3  模型內容    169
7.4.4  理解聚類模型    169
7.5  本章小結    174
第8章  Microsoft序列聚類算法    175
8.1  Microsoft序列聚類算法介紹    175
8.2  Microsoft序列聚類算法的基本原理    176
8.2.1  什么是馬爾可夫鏈    176
8.2.2  馬爾可夫鏈的階    176
8.2.3  狀態(tài)轉移矩陣    177
8.2.4  使用馬爾可夫鏈來進行聚類    178
8.2.5  聚類分解    180
8.3  序列聚類算法的參數(shù)    180
8.4  使用序列聚類算法    181
8.4.1  DMX查詢    181
8.4.2  模型內容    185
8.4.3  解釋模型    185
8.5  本章小結    189
第9章  Microsoft關聯(lián)規(guī)則算法    191
9.1  Microsoft關聯(lián)規(guī)則算法介紹    191
9.2  關聯(lián)規(guī)則算法的基本原理    192
9.2.1  理解關聯(lián)規(guī)則算法的基本概念    192
9.2.2  挖掘頻繁項集    195
9.2.3  生成關聯(lián)規(guī)則    198
9.2.4  預測    198
9.3  關聯(lián)算法的參數(shù)    199
9.4  使用關聯(lián)算法    200
9.4.1  DMX查詢    200
9.4.2  模型內容    202
9.4.3  解釋模型    203
9.5  本章小結    205
第10章  Microsoft神經網(wǎng)絡算法    207
10.1  Microsoft神經網(wǎng)絡算法的基本原理    207
10.1.1  什么是神經網(wǎng)絡    208
10.1.2  組合和激活    209
10.1.3  反向傳播、誤差函數(shù)和共軛梯度    211
10.1.4  處理神經網(wǎng)絡的簡單示例    212
10.1.5  規(guī)范化和映射    213
10.1.6  網(wǎng)絡拓撲    214
10.1.7  訓練終止條件    215
10.2  神經網(wǎng)絡算法的參數(shù)    215
10.3  DMX查詢    216
10.4  模型內容    218
10.5  解釋模型    219
10.6  本章小結    221
第11章  挖掘OLAP立方體    223
11.1  OLAP介紹    224
11.1.1  理解星型模式和雪花模式    225
11.1.2  理解維和層次    225
11.1.3  理解度量和度量組    226
11.1.4  理解立方體的處理和存儲    227
11.1.5  使用前攝緩存    228
11.1.6  查詢立方體    228
11.2  執(zhí)行計算    229
11.3  瀏覽立方體    230
11.4  理解統(tǒng)一維度模型    231
11.5  理解OLAP和數(shù)據(jù)挖掘之間的關系    234
11.5.1  OLAP在聚集數(shù)據(jù)方面給數(shù)據(jù)挖掘帶來的好處    235
11.5.2  OLAP需要數(shù)據(jù)挖掘來發(fā)現(xiàn)模式    235
11.5.3  OLAP挖掘與關系挖掘    236
11.6  使用向導和編輯器來構建OLAP挖掘模型    237
11.6.1  使用數(shù)據(jù)挖掘向導    237
11.6.2  構建客戶細分模型    237
11.6.3  創(chuàng)建購物籃模型    239
11.6.4  創(chuàng)建銷售預測模型    242
11.6.5  使用數(shù)據(jù)挖掘編輯器    245
11.7  理解數(shù)據(jù)挖掘維    246
11.8  在DMX查詢內部使用MDX    248
11.9  將AMO用于OLAP挖掘模型    249
11.10  本章小結    253
第12章  SQL Server集成服務
數(shù)據(jù)挖掘    255
12.1  SSIS介紹    255
12.1.1  理解SSIS包    257
12.1.2  任務流    257
12.1.3  數(shù)據(jù)流    259
12.2  在SSIS環(huán)境中進行數(shù)據(jù)挖掘    261
12.2.1  數(shù)據(jù)挖掘任務    262
12.2.2  數(shù)據(jù)挖掘轉換    267
12.3  本章小結    276
第13章  SQL Server數(shù)據(jù)挖掘的體系結構    277
13.1  Analysis Services體系
結構介紹    277
13.2  XML for Analysis    278
13.2.1  XMLA的API    279
13.2.2  XMLA和Analysis Services    282
13.3  處理體系結構    283
13.4  數(shù)據(jù)挖掘管理    284
13.4.1  服務器配置    284
13.4.2  數(shù)據(jù)挖掘安全    285
13.5  本章小結    287
第14章  SQL Server數(shù)據(jù)挖掘編程    289
14.1  數(shù)據(jù)挖掘API    290
14.1.1  ADO    291
14.1.2  ADO.NET    291
14.1.3  ADOMD.NET    291
14.1.4  Server ADOMD    292
14.1.5  AMO    292
14.2  使用Analysis Services的API    292
14.3  使用Microsoft.AnalysisServices
創(chuàng)建和管理挖掘模型    293
14.3.1  AMO的基本原理    294
14.3.2  AMO應用程序和安全    295
14.3.3  對象的創(chuàng)建    296
14.4  瀏覽和查詢挖掘模型    305
14.4.1  使用ADOMD.NET來預測    306
14.4.2  瀏覽模型    309
14.4.3  存儲過程    311
14.4.4  編寫存儲過程    312
14.5  本章小結    317
第15章  實現(xiàn)一個Web交叉銷售
應用程序    319
15.1  源數(shù)據(jù)描述    319
15.2  構建模型    320
15.2.1  確定數(shù)據(jù)挖掘任務    320
15.2.2  將決策樹算法應用于關聯(lián)任務    320
15.2.3  使用關聯(lián)規(guī)則算法    322
15.2.4  兩個模型的比較    324
15.3  執(zhí)行預測    325
15.3.1  批處理預測查詢    325
15.3.2  使用單例預測查詢    327
15.4  在Web應用程序中集成預測功能    327
15.4.1  理解Web應用程序的體系結構    327
15.4.2  設置權限    328
15.4.3  分析Web推薦應用程序的樣例代碼    329
15.5  本章小結    332
第16章  使用Microsoft Excel進行高級預測    333
16.1  針對會話模型來配置Analysis Services    333
16.2  使用高級預測工具    334
16.3  ExcelTimeSeries插件的體系結構    336
16.4  構建輸入數(shù)據(jù)集    336
16.5  創(chuàng)建和訓練挖掘模型    339
16.5.1  連接數(shù)據(jù)挖掘引擎    339
16.5.2  創(chuàng)建和訓練    340
16.6  預測序列    342
16.7  結合所有代碼    343
16.8  本章小結    346
第17章  擴展SQL Server數(shù)據(jù)挖掘    347
17.1  理解插件算法    347
17.1.1  插件算法的架構    348
17.1.2  插件算法的概念    348
17.1.3  模型的創(chuàng)建和處理    350
17.1.4  預測    351
17.1.5  內容導航    352
17.1.6  受托管的插件    352
17.1.7  安裝插件算法    353
17.2  使用數(shù)據(jù)挖掘查看器    353
17.3  本章小結    354
第18章  總結與其他資源    355
18.1  重新回顧SQL Server 2005
數(shù)據(jù)挖掘的亮點    355
18.1.1  最新的算法    355
18.1.2  易于使用的工具    356
18.1.3  簡單而強大的API    356
18.1.4  與同類BI技術的集成    357
18.2  探討數(shù)據(jù)挖掘的新領域及應用357
18.3  延伸閱讀    358
18.3.1  Microsoft數(shù)據(jù)挖掘的資源358
18.3.2  數(shù)據(jù)挖掘的其他資源    358
18.3.3  流行的數(shù)據(jù)挖掘Web站點359
18.3.4  流行的數(shù)據(jù)挖掘會議    359
附錄A  導入數(shù)據(jù)集    361
A.1  數(shù)據(jù)集    361
A.1.1  MovieClick數(shù)據(jù)集    361
A.1.2  Voting Records數(shù)據(jù)集    363
A.1.3  FoodMart 2000數(shù)據(jù)集    364
A.1.4  College Plans數(shù)據(jù)集    364
A.2  導入數(shù)據(jù)集    364
附錄B  支持的VBA函數(shù)和
Excel函數(shù)    369
附錄C  學習資源    373





本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) rgspecialties.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號