簡體書 » New Internet：大數據挖掘

New Internet：大數據挖掘

定價：~~414~~ 元

NT $ 414

作者：譚磊
出版社：電子工業出版社
出版日期：2013-03-01
語言：簡體中文
ISBN10：7121196700
ISBN13：9787121196706
裝訂：353頁 / 普通級 / 1-1

內容簡介

譚磊編著的《New Interne》全面地介紹了如何使用數據挖掘技術從各種結構的（數據庫）或非結構（Web）的海量數據中提取和產生業務知識。

作者梳理了各種數據挖掘常用算法和信息采集技術，系統地描述了實際應用時如何在互聯網日志分析、電子郵件營銷、互聯網廣告和電子商務上進行數據挖掘，着重介紹了數據挖掘的原理和算法在互聯網海量數據挖掘中的應用。

《New Interne》主要特點：全面介紹了數據挖掘和大數據的基本概念和技術；大量采用了實際案例，實用性強；詳細介紹了大數據挖掘領域最新的商業應用。

《New Interne》是從事數據挖掘研究和開發，或者是互聯網相關行業從事數據運營的專業人員理想的參考書，同時也可作為了解數據挖掘應用的入門指南。

第1章緒論——從淘金客到礦山主
1.1 大數據時代的「四v」
1.2 什麼是大數據挖掘
1.2.1 從數據分析到數據挖掘
1.2.2 web挖掘
1.2.3 大數據挖掘之「大」
1.3 大數據挖掘的國內外發展
1.3.1 數據挖掘的應用發展
1.3.2 數據挖掘研究發展
1.4 本書內容
第2章一小時了解數據挖掘
2.1 數據挖掘是如何解決問題的
2.1.1 尿不濕和啤酒
2.1.2 target和懷孕預測指數
2.1.3 電子商務網站流量分析
2.2 分類：從人臉識別系統說起
2.2.1 分類算法的應用
2.2.2 數據挖掘分類技術
2.2.3 分類算法的評估
2.3 一切為了商業
2.3.1 什麼是商業智能（business intelligence）
2.3.2 數據挖掘的九大定律
2.4 數據挖掘很糾結
2.5 數據挖掘的基本流程
2.5.1 數據挖掘的一般步驟
2.5.2 幾個數據挖掘中常用的概念
2.5.3 crisp-dm
2.5.4 數據挖掘的評估
2.5.5 數據挖掘結果的知識表示
2.6 本章相關資源
第3章數據倉庫——數據挖掘的基石
3.1 存放數據的倉庫
3.1.1 數據倉庫的定義
3.1.2 數據倉庫和數據庫
3.2 傳統的數據倉庫介紹
3.3 數據倉庫基本結構
3.4 olap聯機分析處理
3.5 雲存儲上的數據倉庫
3.5.1 google公司的雲架構
3.5.2 開源的分布式系統hadoop
3.5.3 facebook的數據倉庫
3.5.4 nosql
3.6 本章相關資源
第4章數據挖掘算法及原理
4.1 數據挖掘中的算法
4.2 數據挖掘十大經典算法
4.3 分類算法（classification）
4.4 聚類算法（clustering）
4.5 關聯算法
4.5.1 關聯算法中的概念
4.5.2 關聯規則數據挖掘過程
4.5.3 關聯規則的分類
4.5.4 apriori算法的執行實例
4.5.5 關聯規則挖掘算法的研究與優化
4.6 序列挖掘（sequence mining）
4.7 數據挖掘建模語言pmml
4.8 本章相關資源
第5章在進行數據挖掘之前
5.1 數據集成
5.2 為何要做數據預處理
5.3 數據預處理
5.3.1 數據清理
5.3.2 數據轉換
5.3.3 數據規約
5.4 本章相關資源
第6章 r語言和其他數據挖掘工具
6.1 r語言的歷史
6.1.1 r語言的特點
6.1.2 r語言和數據挖掘
6.2 其他數據挖掘工具
6.2.1 matlab
6.2.2 其他商用數據挖掘工具
6.2.3 開源數據挖掘工具weka
6.3 數據挖掘和雲
6.4 本章相關資源
第7章互聯網上的日志分析
7.1 網站日志簡介
7.2 網站日志處理
7.2.1 web日志預處理
7.2.2 web日志分析和數據挖掘
7.3 郵件日志
7.4 本章相關資源
第8章數據挖掘和電子郵件
8.1 郵件營銷與垃圾郵件過濾
8.2 數據挖掘和郵件營銷
8.2.1 如何有效地進行郵件營銷
8.2.2 郵件營銷案例分享之一
8.2.3 郵件營銷案例分享之二
8.2.4 運用數據挖掘rfm模型提高郵件營銷效果
8.3 數據挖掘和垃圾郵件過濾
8.3.1 垃圾郵件
8.3.2 垃圾郵件過濾技術
8.3.3 垃圾郵件過濾案例
8.4 本章相關資源
第9章數據挖掘和互聯網廣告
9.1 互聯網廣告
9.2 廣告作弊行為
9.3 網站聯盟廣告
9.4 網站聯盟廣告上的數據挖掘
9.4.1 數據助力網盟廣告
9.4.2 如何應對網盟廣告作弊
9.5 本章相關資源
第10章數據挖掘和電子商務
10.1 中國電子商務現狀
10.2 在互聯網上賣米
10.3 用數據來掌握客戶
10.3.1 客戶何時來，從哪來
10.3.2 客戶最喜歡哪種商品
10.3.3 競爭與反競爭分析
10.3.4 客戶還會買什麼
10.3.5 哪些客戶是我們需要的
10.4 電子商務案例
10.4.1 電子商務企業案例一
10.4.2 電子商務企業案例二
10.5 本章相關資源
第11章數據挖掘和web挖掘
11.1 互聯網上的個性化–like
11.1.1 like=像
11.1.2 like=喜歡
11.2 web挖掘和sns
11.2.1 sns上的數據價值
11.2.2 sns上的數據關聯關系
11.2.3 sns上的用戶關系
11.3 數據挖掘和隱私
11.4 本章相關資源
第12章數據挖掘和移動互聯網
12.1 移動互聯網的特殊性
12.1.1 鎖定用戶的數據價值
12.1.2 移動互聯網上數據的形式
12.1.3 移動互聯網地理位置信息的價值
12.2 數據挖掘和lbs
12.2.1 用pu學習算法做文本挖掘
12.2.2 用相似匹配算法做地點挖掘
12.3 移動互聯網數據面臨的問題
12.4 本章相關資源
附錄a 技術詞匯表
附錄b 英語參考文獻表
附錄c 中文參考文獻表
附錄d 微博
附錄e 博客和其他網址

看更多