數據挖掘與機器學習:WEKA應用技術與實踐(第2版)

數據挖掘與機器學習:WEKA應用技術與實踐(第2版)
定價:474
NT $ 412
  • 作者:袁梅宇
  • 出版社:清華大學出版社
  • 出版日期:2016-08-01
  • 語言:簡體中文
  • ISBN10:7302444706
  • ISBN13:9787302444701
  • 裝訂:548頁 / 普通級 / 2-1
 

內容簡介

本書借助代表當今數據挖掘和機器學習最 高水平的著名開源軟件Weka,通過大量的實踐操作,使讀者了解並掌握數據挖掘和機器學習的相關技能,拉近理論與實踐的距離。全書共分9章,主要內容包括Weka介紹、探索者界面、知識流界面、實驗者界面、命令行界面、Weka高級應用、Weka API、學習方案源代碼分析和機器學習實戰。

本書系統講解Weka 3.7.13的操作、理論和應用,內容全面、實例豐富、可操作性強,做到理論與實踐的統一。本書適合數據挖掘和機器學習相關人員作為技術參考書使用,也適合用作計算機專業高年級本科生和研究生的教材或教學參考用書。

袁梅宇,男,工學博士,碩士導師,現在昆明理工大學計算機系任教。為本科生和研究生主講Java程序設計、Java EE技術、數據庫原理、人工智能、Dot Net技術等核心課程,參加過863 CIMS Net建設、中歐合作項目DRAGON和多項國家基金和省基金項目,第一作者公開發表論文十余篇,軟件著作權(頒證)六項。
 

目錄

第1章 Weka介紹 1
1.1 Weka簡介 2
1.1.1 Weka歷史 3
1.1.2 Weka功能簡介 3
1.2 基本概念 5
1.2.1 數據挖掘和機器學習 5
1.2.2 數據和數據集 5
1.2.3 ARFF格式 6
1.2.4 預處理 7
1.2.5 分類與回歸 10
1.2.6 聚類分析 12
1.2.7 關聯分析 12
1.3 Weka系統安裝 13
1.3.1 系統要求 13
1.3.2 安裝過程 14
1.3.3 Weka使用初步 16
1.3.4 系統運行注意事項 18
1.4 訪問數據庫 24
1.4.1 配置文件 25
1.4.2 數據庫設置 26
1.4.3 常見問題及解決辦法 27
1.5 示例數據集 28
1.5.1 天氣問題 29
1.5.2 鳶尾花 30
1.5.3 CPU 31
1.5.4 玻璃數據集 32
1.5.5 美國國會投票記錄 33
1.5.6 乳腺癌數據集 33
課后強化練習 34

第2章 探索者界面 35
2.1 圖形用戶界面 36
2.1.1 標簽頁簡介 36
2.1.2 狀態欄 37
2.1.3 圖像輸出 37
2.1.4 手把手教你用 37
2.2 預處理 40
2.2.1 加載數據 40
2.2.2 屬性處理 43
2.2.3 過濾器 44
2.2.4 過濾器算法介紹 46
2.2.5 手把手教你用 52
2.3 分類 59
2.3.1 分類器選擇 59
2.3.2 分類器訓練 61
2.3.3 分類器輸出 62
2.3.4 分類算法介紹 65
2.3.5 分類模型評估 79
2.3.6 手把手教你用 81
2.4 聚類 98
2.4.1 Cluster標簽頁的操作 98
2.4.2 聚類算法介紹 99
2.4.3 手把手教你用 101
2.5 關聯 107
2.5.1 Associate標簽頁的操作 107
2.5.2 關聯算法介紹 108
2.5.3 手把手教你用 111
2.6 選擇屬性 117
2.6.1 Select attributes標簽頁的操作 118
2.6.2 選擇屬性算法介紹 119
2.6.3 手把手教你用 120
2.7 可視化 128
2.7.1 Visualize標簽頁 128
2.7.2 邊界可視化工具 131
2.7.3 代價/收益分析可視化 133
2.7.4 手把手教你用 134
課后強化練習 140

第3章 知識流界面 143
3.1 知識流介紹 144
3.1.1 知識流特性 144
3.1.2 知識流界面布局 145
3.2 知識流組件 148
3.2.1 數據源 148
3.2.2 數據接收器 151
3.2.3 評估器 155
3.2.4 可視化器 156
3.2.5 其他工具 158
3.3 使用知識流組件 160
3.4 手把手教你用 162
課后強化練習 181

第4章 實驗者界面 183
4.1 簡介 184
4.2 標准實驗 185
4.2.1 簡單實驗 185
4.2.2 高級實驗 190
4.2.3 手把手教你用 198
4.3 遠程實驗 210
4.3.1 遠程實驗設置 210
4.3.2 手把手教你用 213
4.4 分析結果 221
4.4.1 獲取實驗結果 221
4.4.2 動作 221
4.4.3 配置測試 222
4.4.4 保存結果 225
4.4.5 手把手教你用 225
課后強化練習 229

第5章 命令行界面 231
5.1 命令行界面介紹 232
5.1.1 命令調用 233
5.1.2 命令自動完成 234
5.2 Weka結構 235
5.2.1 類實例和包 235
5.2.2 weka.core包 236
5.2.3 weka.classifiers包 237
5.2.4 其他包 238
5.3 命令行選項 238
5.3.1 常規選項 239
5.3.2 特定選項 241
5.4 過濾器和分類器選項 242
5.4.1 過濾器選項 242
5.4.2 分類器選項 245
5.4.3 手把手教你用 247
5.5 包管理器 252
5.5.1 命令行包管理器 252
5.5.2 運行安裝的算法 254
課后強化練習 255

第6章 Weka高級應用 257
6.1 貝葉斯網絡 258
6.1.1 簡介 258
6.1.2 貝葉斯網絡編輯器 261
6.1.3 在探索者界面中使用貝葉斯
網絡 269
6.1.4 結構學習 270
6.1.5 分布學習 272
6.1.6 查看貝葉斯網絡 273
6.1.7 手把手教你用 276
6.2 神經網絡 286
6.2.1 GUI使用 286
6.2.2 手把手教你用 289
6.3 文本分類 293
6.3.1 文本分類示例 294
6.3.2 分類真實文本 298
6.3.3 手把手教你用 300
6.4 時間序列分析及預測 306
6.4.1 使用時間序列環境 306
6.4.2 手把手教你用 318
課后強化練習 326

第7章 Weka API 327
7.1 加載數據 328
7.1.1 從文件加載數據 328
7.1.2 從數據庫加載數據 329
7.1.3 手把手教你用 330
7.2 保存數據 335
7.2.1 保存數據至文件 335
7.2.2 保存數據至數據庫 335
7.2.3 手把手教你用 336
7.3 處理選項 339
7.3.1 選項處理方法 339
7.3.2 手把手教你用 340
7.4 內存數據集處理 341
7.4.1 在內存中創建數據集 341
7.4.2 打亂數據順序 345
7.4.3 手把手教你用 345
7.5 過濾 349
7.5.1 批量過濾 350
7.5.2 即時過濾 351
7.5.3 手把手教你用 351
7.6 分類 355
7.6.1 分類器構建 355
7.6.2 分類器評估 356
7.6.3 實例分類 358
7.6.4 手把手教你用 359
7.7 聚類 370
7.7.1 聚類器構建 370
7.7.2 聚類器評估 371
7.7.3 實例聚類 373
7.7.4 手把手教你用 373
7.8 屬性選擇 379
7.8.1 使用元分類器 380
7.8.2 使用過濾器 380
7.8.3 使用底層API 381
7.8.4 手把手教你用 381
7.9 可視化 384
7.9.1 ROC曲線 385
7.9.2 圖 385
7.9.3 手把手教你用 386
7.10 序列化 391
7.10.1 序列化基本方法 391
7.10.2 手把手教你用 392
7.11 文本分類綜合示例 395
7.11.1 程序運行准備 395
7.11.2 源程序分析 396
7.11.3 運行說明 403
課后強化練習 404

第8章 學習方案源代碼分析 405
8.1 NaiveBayes源代碼分析 406
8.2 實現分類器的約定 427
課后強化練習 429

第9章 機器學習實戰 431
9.1 數據挖掘過程概述 432
9.1.1 CRISP-DM過程 432
9.1.2 數據預處理 433
9.1.3 挖掘項目及工具概述 434
9.2 實戰KDD Cup 1999 434
9.2.1 任務描述 435
9.2.2 數據集描述 436
9.2.3 挖掘詳細過程 438
9.3 實戰KDD Cup 2010 447
9.3.1 任務描述 447
9.3.2 數據集描述 447
9.3.3 挖掘詳細過程 450
9.3.4 更接近實際的挖掘過程 459
課后強化練習 471

附錄A 中英文術語對照 472
附錄B Weka算法介紹 476
過濾器算法介紹 476
分類算法介紹 498
聚類算法介紹 526
關聯算法介紹 530
選擇屬性算法介紹 532
參考文獻 537
網路書店 類別 折扣 價格
  1. 新書
    87
    $412