大數據挖掘:從巨量資料發現別人看不到的秘密

大數據挖掘:從巨量資料發現別人看不到的秘密
定價:360
NT $ 110 ~ 324
  • 作者:譚磊
  • 譯者:胡嘉璽
  • 出版社:上奇時代
  • 出版日期:2013-11-29
  • 語言:繁體中文
  • ISBN10:9862579064
  • ISBN13:9789862579060
  • 裝訂:平裝 / 384頁 / 17 x 23 cm / 普通級 / 單色印刷 / 初版
 

內容簡介

  美國一名男子衝入他家附近的一家美國零售連鎖超市Target 店鋪(美國第三大零售商)進行抗議:「你們竟然寄給我17 歲的女兒嬰兒尿片和嬰兒推車的優惠券?」

  一個月後,這位父親來道歉,因為這時他才知道他的女兒的確懷孕了。

  總公司寄嬰兒尿片和嬰兒推車的優惠券的行為正是執行大數據挖掘的結果!
  連鎖超市Target 比這位父親知道他女兒懷孕的時間足足早了一個月。

  問卷調查是上一個世代的做法。
  直接從顧客的行為分析出正確商業決策才是王道!
  誰是潛在的客戶?
  如何從消費者的習慣決定商品的架位。
  怎麼辨別大量的偽造資訊?

  當YB(10的24次方Bytes)等級的資料呈現在你眼前的時候,是否有能力從中擷取有意義的資訊就是現在成功的關鍵!

本書特色

  本書全面地介紹了如何使用資料挖掘技術從各種結構的(資料庫)或非結構(Web)的巨量資料中提取和產生業務知識。作者整理了各種資料挖掘常用演算法和資訊採集技術,有系統地描述如何透過網誌分析、電子郵件行銷、網路廣告和電子商務進行網際網路上的巨量資料挖掘。

名人推薦

  本書是一本極佳的教材。它從網際網路廣告的角度全面且有系統地介紹了資料採擷的基本概念、方法和技術以及資料採擷對網際網路廣告的實際意義,重點關注其可行性、有用性、有效性和可伸縮性問題。本書不僅適合作為資料採擷和知識發現課程的教材,也非常適合作為電子商務、資料採擷相關領域從業人員的參考資料。 ——復旦大學電腦學院 黃萱菁 教授

  隨著大數據時代的到來,資料科學家這一專業職位變得炙手可熱。在2012 年10 月,《哈佛商業評論》甚至宣佈「資料科學家是21 世紀最性感的職業」。在本書中,作者以大量實際專案開發和培訓經驗為基礎,借助最新的網際網路應用案例,深入淺出地介紹了資料採擷領域的基本技術和常用工具。本書是資料科學家完美的入門讀物。 ——微軟亞洲研究院主管研究員 謝幸

  大家都知道自己現在身處在一個資訊化的時代,我們每天從傳統的媒體(報紙、雜誌、電視,等等)以及新媒體(網際網路、網路論壇、Facebook⋯等等)獲取到大量資訊。在每天面對撲面而來的巨量資訊的同時,常常又有很多人在感歎對自己有用的或者能夠讓自己感興趣的東西似乎越來越少。本書也許會為你解開這種困惑。此書深入淺出的描述了時下炙手可熱的IT業界的幾個詞彙。作為一般的讀者可以把此書作為茶餘飯後的讀物,當你在同事朋友面前侃侃而談「大數據」、「資料採擷」等詞彙時,相信定能吸引周圍人的目光。當你明白資料是如何變成資訊,資訊又是怎麼再昇華為有用的資訊時,或許你的生活也會變得更加多姿多彩。此書也能幫助企業的經營人員更加深刻的理解如 何運用IT(資訊技術)提升企業的經營,讓IT 更有效的幫助企業決策千里。當然此書更能幫助我們這些IT 從業人員深入的考慮如何運用大數據挖掘技術開發出更好的產品或者解決方案,服務於各個企業,服務於我們的社會。 ——富士通(中國)公司 戰略規劃部總經理 黃邦瑜

  隨著雲端時代的來臨,大數據也吸引了越來越多的關注。之前我對大數據的瞭解還停留在概念上,讀完本書讓我有了豁然開朗的感覺,明確了自己企業在大數據方向上的目標,也瞭解了相關的理論和方法。我相信很多關心大數據的朋友都會從書中受益良多。 ——鳳凰網CTO 吳華鵬

  本書很認真實際的探討了一個說起來很容易,但是實際執行起來卻需要一個公司從上到下無縫配合才有可能完成的任務。能成功發揮大數據挖掘能力的公司/ 機構/ 政府,得到的優勢就等於在別人還在用指南針定位目標的時候,你已經裝備了衛星導航系統+ 雷達,做的決定變得更加快、狠、準。這會是一個大家都努力嘗試做大數據挖掘的時代,關鍵在於,誰能夠更瘋狂的熱愛資料,更理性的尊重數據。 ——小米科技聯合創始人,副總裁黃江吉 小米KKWong

  大數據時代的到來讓世界變得越來越透明,自由民主是資訊社會的生態,無論是生活領域還是行政領域,大眾對透明的視覺化資料呈現都有迫切的需求,在企業決策、行銷決策、醫療、教育等各個領域都需要大數據。大數據流程行伊始,技術行業和學術界都非常需要優質的學習書籍,本書作者把自己的網際網路資料工作經驗與大數據行業發展結合,深入淺出,對行業發展有重大意義,是國內少見的網際網路前沿研究的精品之作。 ——Web 2.0 研究者,西瓜世界創始人 柳華芳

  有人甚至說,「資料是新的石油」,大數據將徹底改變人類文明的發展脈絡,重塑我們對於世界、對於生活的認知。譚磊這本書很及時,很深刻的闡述大數據挖掘的各種方法,對於從事資料採擷的同行來說,是一本不可多得的好書。 ——盛大遊戲技術保障中心高級總監 陳桂新

  認識Raymond 很多年,知道他技術很強,這次倒是第一次知道他的文筆也是如此好。大數據的重要性早已不言而喻,我們對此的關注度也是非常高。Raymond 的這本書深淺適中,既符合技術人員的需求,對於非技術的電商從業人員幫助也是很大的。 ——阿里巴巴集團資深總監 陳宜

  本書是目前國內大數據挖掘類書籍中不可多得的,有理論有實戰,非常值得大數據時代的相關研究者閱讀。 ——騰訊開發高級總監 宋永柱

  本書以一位經驗豐富的資料工程師的獨特觀點,以詳實的資料和深入淺出的論述揭示了大數據概念下的實際問題,專注於大數據的實用價值和方法,使之不再是虛幻時髦的炒作概念。不同於很多注重解釋演算法的資料採擷方面的書籍,本書從「為什麼」入手,以通俗易懂的案例展示了大數據領域的全貌,並很精準的把握了在大數據領域的基本概念和前沿技術。這本書不僅為初學者揭開了大經驗這一日趨重要領域的神秘面紗,也為專業人士提供了進一步深入研究的入口。 ——微軟研究院首席研究員 周禮棟博士

  本書展示了資料採擷的基本理念和應用場景,能讓你在幾個小時內讀懂資料採擷,是進入大數據時代的一個敲門磚。 ——前騰訊產品總監,現火花無線CEO 吳國鴻

  一場長跑競賽,並不是一開始衝在最前的人就可以獲得最後的冠軍,而是取決於戰術和耐力。對於網際網路產品而言也是如此。隨著巨量資料的堆砌,其在商業上的價值已經成為企業對未來發展的巨大依託。未來的網際網路不再是速度的對決,而是深度的較量!如何正確且深度挖掘資料背後蘊藏的寶藏,這本書將會給出大家希望得到的答案。 ——車鄰會、卡內網路科技創始人兼CEO 呂筍

  幾年來大數據的運用,給商業世界帶來巨大影響。《紐約時報》報導過一個案例,美國超市Target 通過分析購買資料居然比她父親還要預先猜測出女孩懷孕的消息!而Target 正是運用資料採擷技術,有效提高了細分顧客群體的推廣行銷效果。本書涵蓋該領域相關的技術理論基礎概論,並且也提供以網際網路為主的各種商業大數據運用前沿的實例,具有很強的實際操作指導意義。對大數據趨勢感興趣的讀者,不管是技術人員,或者是管理人員,都能從這本書裡獲益。 ——前24 券團購網CTO,網際網路創業者 Bruce 黃海旻

  資料就是一座巨大而未知的礦藏,是所有公司最值錢的財富之一,也是當下所有公司都想挖掘的秘密;資料是會說話的,關鍵是我們如何讀懂和理解他,本書能引導我們大家如何讀懂他,如何用他指導我們的產品運營和產品設計,如何做精準行銷,是非常值得推薦的一本資料分析類書籍。——著名網際網路資料庫架構師 金官丁

  本書循序漸進地剖析了大數據挖掘演算法在搜索和廣告等方面的應用,理論描述深入淺出,應用案例非常精彩,網際網路專業知識豐富。本書適合作為搜索廣告等相關領域研發的參考手冊,也適合作為資料採擷及Web 應用的學習教材。 ——阿里巴巴資深技術專家 林鋒博士

  資訊時代裡,資料對人類生活的影響和社會的掌控力在不斷被放大,理解和運用龐大規模的資料成為了一項雄心勃勃的計畫。本書探討了大數據時代前沿的熱點問題,描繪了大規模資料採擷在當前環境下的典型應用。有概念分析,也有操作實例,既是一本優秀的入門讀物,又適合業內人士隨時翻閱參考。 ——優酷資深工程師 章岑

 

作者介紹

作者簡介

譚磊


  復旦大學電腦學士,美國杜克大學電腦碩士,在美國微軟服務時間超過13年,曾經擔任多家公司多個層級技術管理崗位,在搜索、網路廣告、資料挖掘、電子商務等方面有豐富的經驗,是網際網路技術領域的資深專家。
 

 

目錄

Chapter 1 緒論——從淘金客到礦山主
1.1 巨量資料時代的「四V」
1.2 什麼是巨量資料挖掘
1.3 巨量資料挖掘的國內外發展
1.4 本書內容

Chapter 2 一小時了解資料採擷
2.1 資料採擷是如何解決問題的
2.2 分類:從人臉識別系統說起
2.3 一切為了商業
2.4 資料採擷很糾結
2.5 資料採擷的基本流程
2.6 本章相關資源

Chapter 3 資料倉儲——資料採擷的基礎
3.1 儲存資料的倉庫
3.2 傳統的資料倉儲介紹
3.3 資料倉儲基本結構
3.4 OLAP 連線分析處理
3.5 雲端儲存上的資料倉儲
3.6 本章相關資源

Chapter 4 資料採擷演算法及原理
4.1 資料採擷中的演算法
4.2 資料採擷十大經典演算法
4.3 分類演算法(Classification)
4.4 集群演算法(Clustering)
4.5 連結演算法
4.6 序列挖掘(Sequence Mining)
4.7 資料採擷建模語言PMML
4.8 本章相關資源

Chapter 5 在進行資料採擷之前
5.1 資料整合
5.2 為何要做資料前置處理
5.3 資料前置處理
5.4 本章相關資源

Chapter 6 R 語言和其他資料採擷工具
6.1 R 語言的歷史
6.2 其他資料採擷工具
6.3 資料採擷和雲端
6.4 本章相關資源

Chapter 7 網際網路上的記錄檔分析
7.1 網站記錄檔簡介
7.2 網站記錄檔處理
7.3 郵件記錄檔
7.4 本章相關資源

Chapter 8 資料採擷和電子郵件
8.1 郵件行銷與垃圾郵件過濾
8.2 資料採擷和郵件行銷
8.3 資料採擷和垃圾郵件過濾
8.4 本章相關資源

Chapter 9 資料採擷和網際網路廣告
9.1 網際網路廣告
9.2 廣告作弊行為
9.3 網站聯盟廣告
9.4 網站聯盟廣告上的資料採擷
9.5 本章相關資源

Chapter 10 資料採擷和電子商務
10.1 中國大陸電子商務現狀
10.2 在網際網路上賣米
10.3 用資料來掌握客戶
10.4 電子商務案例
10.5 本章相關資源

Chapter 11 資料採擷和Web 挖掘
11.1 網際網路上的個性化–Like
11.2 Web 挖掘和SNS
11.3 資料採擷和隱私
11.4 本章相關資源

Chapter 12 資料採擷和行動網際網路
12.1 行動網際網路的特殊性
12.2 資料採擷和LBS
12.3 行動網際網路資料面臨的問題
12.4 本章相關資源

A 技術詞彙表英文參考文獻表
B 英文參考文獻表
C 中文參考文獻表
D 微博
E 部落格和其他網址
 

 

編輯推薦  

  『這可能是最通俗易懂的一本資料挖掘書籍』——互動通鄧廣檮 PPTV陶闖 聯合力薦

  本書從網際網路業者(如電信商、搜尋引擎、廣告、資訊服務…等)解讀大數據概念及挖掘原理,真實呈現大規模資料挖掘在當前環境下的典型應用,而非僅空泛的理論。

  大量網際網路應用案例,來自作者所在企業及真實發生的實際專案。

  讀了這本書,除了可以讓企業對大數據的瞭解不再停留在概念上,更可以明確企業在大數據方向上的努力目標。

  本書並不會研究高深演算法,旨在用通俗易懂的案例展示大數據全貌,釐清基本概念,把握前沿技術,為專業人士開啟深入研究的大門。

  

網路書店 類別 折扣 價格
  1. 二手書
    31
    $110
  2. 二手書
    48
    $172
  3. 二手書
    63
    $226
  4. 新書
    79
    $284
  5. 新書
    9
    $324