定 價:¥79.00
作 者: | 張良均,譚立云,劉名軍,江建明 |
出版社: | 機械工業(yè)出版社 |
叢編項: | |
標 簽: | 暫缺 |
ISBN: | 9787111640028 | 出版時間: | 2019-12-01 | 包裝: | |
開本: | 頁數(shù): | 字數(shù): |
前言
\n基礎篇
\n第1章 數(shù)據(jù)挖掘基礎 2
\n1.1 某知名連鎖餐飲企業(yè)的困惑 2
\n1.2 從餐飲服務到數(shù)據(jù)挖掘 4
\n1.3 數(shù)據(jù)挖掘的基本任務 5
\n1.4 數(shù)據(jù)挖掘建模過程 5
\n1.4.1 定義挖掘目標 6
\n1.4.2 數(shù)據(jù)取樣 6
\n1.4.3 數(shù)據(jù)探索 7
\n1.4.4 數(shù)據(jù)預處理 8
\n1.4.5 挖掘建模 8
\n1.4.6 模型評價 8
\n1.5 常用數(shù)據(jù)挖掘建模工具 9
\n1.6 小結(jié) 11
\n第2章 Python數(shù)據(jù)分析簡介 12
\n2.1 搭建Python開發(fā)平臺 14
\n2.1.1 所要考慮的問題 14
\n2.1.2 基礎平臺的搭建 14
\n2.2 Python使用入門 16
\n2.2.1 運行方式 16
\n2.2.2 基本命令 17
\n2.2.3 數(shù)據(jù)結(jié)構(gòu) 19
\n2.2.4 庫的導入與添加 24
\n2.3 Python數(shù)據(jù)分析工具 26
\n2.3.1 NumPy 27
\n2.3.2 SciPy 28
\n2.3.3 Matplotlib 29
\n2.3.4 pandas 31
\n2.3.5 StatsModels 33
\n2.3.6 scikit-learn 33
\n2.3.7 Keras 34
\n2.3.8 Gensim 36
\n2.4 配套附件使用設置 37
\n2.5 小結(jié) 38
\n第3章 數(shù)據(jù)探索 39
\n3.1 數(shù)據(jù)質(zhì)量分析 39
\n3.1.1 缺失值分析 40
\n3.1.2 異常值分析 40
\n3.1.3 一致性分析 44
\n3.2 數(shù)據(jù)特征分析 44
\n3.2.1 分布分析 44
\n3.2.2 對比分析 48
\n3.2.3 統(tǒng)計量分析 51
\n3.2.4 周期性分析 54
\n3.2.5 貢獻度分析 55
\n3.2.6 相關性分析 58
\n3.3 Python主要數(shù)據(jù)探索函數(shù) 62
\n3.3.1 基本統(tǒng)計特征函數(shù) 62
\n3.3.2 拓展統(tǒng)計特征函數(shù) 66
\n3.3.3 統(tǒng)計繪圖函數(shù) 67
\n3.4 小結(jié) 74
\n第4章 數(shù)據(jù)預處理 75
\n4.1 數(shù)據(jù)清洗 75
\n4.1.1 缺失值處理 75
\n4.1.2 異常值處理 80
\n4.2 數(shù)據(jù)集成 80
\n4.2.1 實體識別 81
\n4.2.2 冗余屬性識別 81
\n4.2.3 數(shù)據(jù)變換 81
\n4.2.4 簡單函數(shù)變換 81
\n4.2.5 規(guī)范化 82
\n4.2.6 連續(xù)屬性離散化 84
\n4.2.7 屬性構(gòu)造 87
\n4.2.8 小波變換 88
\n4.3 數(shù)據(jù)歸約 91
\n4.3.1 屬性歸約 91
\n4.3.2 數(shù)值歸約 95
\n4.4 Python主要數(shù)據(jù)預處理函數(shù) 98
\n4.5 小結(jié) 101
\n第5章 挖掘建模 102
\n5.1 分類與預測 102
\n5.1.1 實現(xiàn)過程 103
\n5.1.2 常用的分類與預測算法 103
\n5.1.3 回歸分析 104
\n5.1.4 決策樹 108
\n5.1.5 人工神經(jīng)網(wǎng)絡 115
\n5.1.6 分類與預測算法評價 120
\n5.1.7 Python分類預測模型特點 125
\n5.2 聚類分析 125
\n5.2.1 常用聚類分析算法 126
\n5.2.2 K-Means聚類算法 127
\n5.2.3 聚類分析算法評價 132
\n5.2.4 Python主要聚類分析算法 133
\n5.3 關聯(lián)規(guī)則 135
\n5.3.1 常用關聯(lián)規(guī)則算法 136
\n5.3.2 Apriori算法 136
\n5.4 時序模式 142
\n5.4.1 時間序列算法 142
\n5.4.2 時間序列的預處理 143
\n5.4.3 平穩(wěn)時間序列分析 145
\n5.4.4 非平穩(wěn)時間序列分析 148
\n5.4.5 Python主要時序模式算法 156
\n5.5 離群點檢測 159
\n5.5.1 離群點的成因及類型 160
\n5.5.2 離群點檢測方法 160
\n5.5.3 基于模型的離群點檢測方法 161
\n5.5.4 基于聚類的離群點檢測方法 164
\n5.6 小結(jié) 167
\n實戰(zhàn)篇
\n第6章 財政收入影響因素分析及預測 170
\n6.1 背景與挖掘目標 170
\n6.2 分析方法與過程 171
\n6.2.1 分析步驟與流程 172
\n6.2.2 數(shù)據(jù)探索分析 172
\n6.2.3 數(shù)據(jù)預處理 176
\n6.2.4 模型構(gòu)建 178
\n6.3 上機實驗 184
\n6.4 拓展思考 185
\n6.5 小結(jié) 186
\n第7章 航空公司客戶價值分析 187
\n7.1 背景與挖掘目標 187
\n7.2 分析方法與過程 188
\n7.2.1 分析步驟與流程 189
\n7.2.2 數(shù)據(jù)探索分析 189
\n7.2.3 數(shù)據(jù)預處理 200
\n7.2.4 模型構(gòu)建 207
\n7.2.5 模型應用 212
\n7.3 上機實驗 214
\n7.4 拓展思考 215
\n7.5 小結(jié) 216
\n第8章 商品零售購物籃分析 217
\n8.1 背景與挖掘目標 217
\n8.2 分析方法與過程 218
\n8.2.1 數(shù)據(jù)探索分析 219
\n8.2.2 數(shù)據(jù)預處理 224
\n8.2.3 模型構(gòu)建 226
\n8.3 上機實驗 232
\n8.4 拓展思考 233
\n8.5 小結(jié) 233
\n第9章 基于水色圖像的水質(zhì)評價 234
\n9.1 背景與挖掘目標 234
\n9.2 分析方法與過程 235
\n9.2.1 分析步驟與流程 236
\n9.2.2 數(shù)據(jù)預處理 236
\n9.2.3 模型構(gòu)建 240
\n9.2.4 水質(zhì)評價 241
\n9.3 上機實驗 242
\n9.4 拓展思考 242
\n9.5 小結(jié) 243
\n第10章 家用熱水器用戶行為分析與事件識別 244
\n10.1 背景與挖掘目標 244
\n10.2 分析方法與過程 245
\n10.2.1 數(shù)據(jù)探索分析 246
\n10.2.2 數(shù)據(jù)預處理 249
\n10.2.3 模型構(gòu)建 260
\n10.2.4 模型檢驗 261
\n10.3 上機實驗 262
\n10.4 拓展思考 264
\n10.5 小結(jié) 265
\n第11章 電子商務網(wǎng)站用戶行為分析及服務推薦 266
\n11.1 背景與挖掘目標 266
\n11.2 分析方法與過程 267
\n11.2.1 分析步驟與流程 267
\n11.2.2 數(shù)據(jù)抽取 269
\n11.2.3 數(shù)據(jù)探索分析 270
\n11.2.4 數(shù)據(jù)預處理 279
\n11.2.5 構(gòu)建智能推薦模型 283
\n11.3 上機實驗 291
\n11.4 拓展思考 293
\n11.5 小結(jié) 293
\n第12章 電商產(chǎn)品評論數(shù)據(jù)情感分析 294
\n12.1 背景與挖掘目標 294
\n12.2 分析方法與過程 295
\n12.2.1 評論預處理 296
\n12.2.2 評論分詞 297
\n12.2.3 構(gòu)建模型 303
\n12.3 上機實驗 315
\n12.4 拓展思考 316
\n12.5 小結(jié) 318
\n提高篇
\n第13章 基于Python引擎的開源數(shù)據(jù)挖掘建模平臺(TipDM) 320
\n13.1 平臺簡介 321
\n13.1.1 模板 321
\n13.1.2 數(shù)據(jù)源 322
\n13.1.3 工程 323
\n13.1.4 系統(tǒng)組件 324
\n13.1.5 TipDM數(shù)據(jù)挖掘建模平臺的本地化部署 326
\n13.2 快速構(gòu)建數(shù)據(jù)挖掘工程 327
\n13.2.1 導入數(shù)據(jù) 329
\n13.2.2 配置輸入源組件 331
\n13.2.3 配置缺失值處理組件 332
\n13.2.4 配置記錄選擇組件 334
\n13.2.5 配置數(shù)據(jù)標準化組件 334
\n13.2.6 配置K-Means組件 336
\n13.3 小結(jié) 339
\n