大數據分析與數據挖掘

大數據分析與數據挖掘
定價:294
NT $ 256
 

內容簡介

主要介紹數據挖掘與大數據分析的理論方法與實踐應用,並加入豐富的實務案例介紹,具體說明如何應用數據挖掘與大數據分析技術以解決真實問題,深入淺出地剖析從數據中掏金的秘訣。

全書共分為13章,內容涵蓋數據挖掘基本概念與數據准備、數據挖掘的方法與實證、數據挖掘的進階運用;書中也提供R語言與編程實例輔以說明,使讀者更能融會貫通地應用數據挖掘方法,進而提升大數據分析和數字決策能力。

簡禎富,現職:台灣新竹「清華大學」清華講座教授:工業工程與工程管理學系/EMBA/MBA,台灣「科技部」「IC產業同盟」計划暨「清華一台積電卓越制造中心」主持人,學歷與訓練:哈佛大學商學院PCMPCL結業,威斯康星大學麥迪遜分校決策科學與作業研究博士,新竹「清華大學」工業工程系暨電機工程系雙學位(斐陶斐榮譽會員)。

許嘉裕,現職:元智大學信息管理學系副教授。台灣「科技部」「IC產業同盟」計划共同主持人,學歷:新竹「清華大學」工業工程與工程管理學系博士、碩士,成功大學統計學系學士。
 

目錄

第1篇大數據分析與數據挖掘導論
第1章大數據分析與數據挖掘概論
1.1前言
1.2大數據分析的應用
1.3數據挖掘與數字決策
1.4數據挖掘和大數據分析架構與步驟
1.4.1問題定義與架構
1.4.2數據准備
1.4.3建立挖掘模式
1.4.4結果解釋與評估
1.5數據挖掘的問題類型
1.5.1分類
1.5.2預測
1.5.3聚類
1.5.4關聯規則
1.6數據挖掘模式
1.7結論
1.8本書架構
問題與討論
第2章數據與數據准備
2.1數據取得
2.2大數據分析的基礎:Hadoop
2.2.1Hadoop架構
2.2.2Hadoop分布式文件系統
2.2.3MapReduce
2.3數據類型
2.4數據尺度
2.5數據檢查
2.6數據探索與可視化
2.7數據整合與清理
2.8數據轉換
2.8.1數據數值轉換
2.8.2數據屬性轉換
2.9數據歸約
2.9.1數據維度歸約
2.9.2數據數值歸約
2.10數據分割
2.11應用實例——半導體廠制造技術員人力資源管理質量提升
2.11.1案例背景
2.11.2數據准備
2.12結論
問題與討論
第2篇數據挖掘方法與實證
第3章關聯規則
3.1關聯規則的定義與說明
3.2關聯規則的衡量指針
3.3關聯規則的類型
3.4關聯規則算法
3.4.1Apriori算法
3.4.2Partition算法
3.4.3DHP算法
3.4.4MSApriori算法
3.4.5FP—Growth算法
3.5多維度關聯規則
3.6多階層關聯規則
3.7關聯規則的應用
3.8R語言與關聯規則分析
3.9應用實例——電力公司配電事故定位的研究
3.9.1案例背景
3.9.2數據准備
3.9.3關聯規則推導
3.10結論
問題與討論
第4章決策樹分析
4.1決策樹的建構
4.1.1數據准備
4.1.2決策樹的分支准則
4.1.3決策樹修剪
4.1.4規則提取
4.2決策樹的算法
4.2.1CART
4.2.2C4.5/C5.0
4.2.3CHAID
4.3決策樹分類模型評估
4.4R語言與決策樹分析
4.4.1CART決策樹分析
4.4.2C5.0決策樹分析
4.4.3CHAID決策樹分析
4.5應用實例——建構cDNA生物芯片的數據挖掘模式
4.5.1案例背景
4.5.2數據准備
4.5.3生物芯片數據的決策樹構建
4.5.4規則解釋與評估
4.6結論
問題與討論
第5章人工神經網絡
5.1人工神經網絡的基本結構
5.2網絡學習法
5.3反向傳播人工神經網絡
5.3.1網絡架構
5.3.2學習算法
5.3.3反向傳播人工神經網絡步驟
5.3.4反向傳播人工神經網絡范例
5.4自組織映射網絡
5.4.1網絡架構
5.4.2學習算法
5.4.3SOM人工神經網絡步驟
5.4.4自組織映射圖網絡范例
5.5自適應共振理論人工神經網絡
5.5.1網絡架構
5.5.2ART1網絡算法
5.5.3適應性共振網絡范例
5.6R語言與人工神經網絡
5.6.1反向傳播人工神經網絡
5.6.2自組織映射網絡
5.6.3自適應共振理論人工神經網絡
5.7應用實例——半導體生產周期時間預測與管控
5.7.1案例簡介
5.7.2數據分群
5.7.3數據配適與預測
5.7.4信息整合與敏感度分析
5.7.5案例小結
5.8結論
問題與討論
第6章聚類分析
6.1聚類分析法簡介
6.1.1聚類分析的階段
6.1.2相似度的衡量
6.1.3聚類分析方法
6.2層次聚類分析法
6.3划分聚類分析法
6.3.1K平均法
6.3.2K中心點法
6.4以密度為基礎的分群算法
6.5以模式為基礎的分群算法
6.5.1期望最大化算法
6.5.2自組織映射圖網絡
6.6R語言與聚類分析
6.7應用實例——黃光機台聚類分析
6.7.1案例簡介
6.7.2驗證兩階段分群算法
6.7.3案例小結
6.8結論
問題與討論
第7章朴素貝葉斯分類法與貝葉斯網絡
7.1貝葉斯定理
7.2朴素貝葉斯分類法
7.3貝葉斯網絡
7.3.1貝葉斯網絡的理論基礎
7.3.2貝葉斯網絡的不一致性修正
7.4R語言與貝葉斯分類
7.5應用實例——電力公司饋線事故定位系統
7.5.1案例簡介與問題架構
7.5.2數據整理與貝葉斯網絡圖構建
7.5.3給定貝葉斯推理網絡的參數
7.5.4驗證貝葉斯推理網絡
7.5.5案例小結
7.6結論
問題與討論
第8章粗糙集理論
8.1粗糙集理論
8.2粗糙集理論基本概念
8.2.1信息系統與決策表
8.2.2等價關系
8.2.3近似空間
8.2.4近似集合的准確率
8.2.5分類的准確率與屬性相依程度
8.2.6簡化
8.3粗糙集理論產生分類規則
8.4粗糙集理論與其他分類方法的比較
8.5R語言與粗糙集理論
8.5.1決策表與等價關系
8.5.2近似空間
8.5.3簡化與規則推演
8.6應用實例——TFT—LCD數組事故診斷
8.6.1案例簡介
8.6.2分析過程
8.6.3案例小結
8.7結論
問題與討論
第9章預測與時間數據分析
9.1回歸分析
9.1.1回歸分析基本介紹
9.1.2參數估計
9.1.3回歸模型解釋與評估
9.1.4多重回歸分析
9.1.5共線性
9.2邏輯回歸
9.2.1概率與勝算
9.2.2邏輯回歸模式
9.3時間序列分析
9.4時間數據的分析步驟
9.5模式選擇與建立
9.5.1時間序列平滑法
9.5.2平穩型時間序列
9.5.3無定向型時間序列
9.5.4趨勢型、季節型與介入事件型時間序列
9.6階次選取與參數估計
9.7模式評估
9.7.1擬合優度檢定
9.7.2預測誤差衡量
9.8R語言與時間數據分析
9.9應用實例——半導體光罩需求預測
9.9.1案例簡介與問題架構
9.9.2數據准備與數據處理
9.9.3需求波動偵測分析過程
9.9.4案例小結
9.10結論
問題與討論
第10章集成學習與支持向量機
10.1集成學習
10.1.1Bagging
10.1.2Boosting
10.2支持向量機
10.2.1可區分情況(separable case)
10.2.2不可分狀況(non—separable case)
10.2.3非線性分類
10.3R語言與隨機森林集成學習模型
10.3.1利用隨機森林進行分類
10.3.2利用隨機森林評估變量重要性
10.4結論
問題與討論
……
第3篇數據挖掘進階運用
參考文獻
網路書店 類別 折扣 價格
  1. 新書
    87
    $256