白話大數據與機器學習

白話大數據與機器學習
定價:480
NT $ 118 ~ 456
  • 作者:高揚衛崢尹會生
  • 繪者: 萬娟
  • 出版社:碁峰
  • 出版日期:2017-06-21
  • 語言:繁體中文
  • ISBN10:986476456X
  • ISBN13:9789864764563
  • 裝訂:平裝 / 424頁 / 17 x 23 cm / 普通級 / 單色印刷 / 初版
 

內容簡介

  本書以降低學習門檻為宗旨,解說大數據與機器學習的相關基礎知識,只要具備高中數學基礎即可看懂。內容結合大量案例與生動的插畫,將高度抽象的數學、演算法與現實生活中的事件作關聯,幫助讀者理解。

  本書精彩內容包括:
  .大數據基礎,說明大數據應該具備的基礎數學知識
  .大數據演算法,解說向量空間、回歸、聚類、分類等核心演算法
  .大數據熱門應用:介紹推薦算法、文字挖掘、人工神經網路等技術的原理
  .大數據主流框架:介紹Hadoop、Spark、Cassandra
 

目錄

Chapter 01 大數據產業
Chapter 02 步入資料之門
Chapter 03 排列組合與古典機率
Chapter 04 統計與分佈
Chapter 05 指標
Chapter 06 資訊理論
Chapter 07 多維向量空間
Chapter 08 迴歸
Chapter 09 聚類
Chapter 10 分類
Chapter 11 關聯分析
Chapter 12 使用者側寫
Chapter 13 推薦演算法
Chapter 14 文字挖掘
Chapter 15 人工神經網路
Chapter 16 大數據框架簡介
Chapter 17 系統架構和最佳化
Chapter 18 資料解讀與資料的價值

 
 



  不知從何時開始我們已周身沒入大數據時代的潮流,不知不覺被捲入了大數據時代。

  無論是每天上網看網頁、聊LINE、上FB,或者使用網路銀行、網購、買票,或者出遊、訂房,甚至是出入任何公眾場合、駕車、用水用電⋯⋯我們無時無刻不在生產著各種數據。而同時我們也在消費著其他人生產的數據,我們使用的眾多家電產品,每一個設計細節都融入了設計者對用戶體驗數據的調查與分析;我們使用的每一部手機、每一台電腦,每一個元件的產出都融入著多得無法想像的指標數據控制下的生產與監控;我們造訪的每一個網頁、每一個軟體,每一次享受到的貼心的產品改動和服務的升級,無不浸透著無數的數據彙集與精細的分析和反饋。這是一場慢慢到來的、貫穿所有產業的革命,這是一次潤物細無聲的各行業精耕細作的開端。

  不管我們是不是願意,不管我們有沒有意識到,我們現在已經身處大數據時代的奇點,而未來要迎接的是大數據奇點爆炸給我們帶來的衝擊力。我們需要力量來駕馭浪裡的航船,我們需要乘風破浪前進的動力。

  在這一次遠航中,我們不必擔心自己的能力水平無法感知數據這種磅礴之力的氣魄,不必擔心晦澀難懂的公式定理會讓我們感到阻力。

  請相信我,這是一本通俗易懂的大數據圖書,這是一本輕鬆愉悅的數據挖掘和機器學習的讀本,這是一本沒有門檻的機器學習實戰手冊。讓我們一起揚帆遠航吧!
 

內容連載

對大數據產業的認識

「大數據」這個詞彙其實很容易產生不少誤解,尤其是這個「大」字,很容易讓人感覺,資料量必須大,而且特別大,越大越能形成產業,也越有價值。其實這是「大數據」造成的誤導。大數據產業的存在,和其他產業並無二致,本身是為了服務其他產業。

做個假設,假如現在對石油產業冠以「大石油」產業的名號,會影響石油產業本身對其他行業的服務模式嗎?應該不會。

在「大石油」產業裡,同樣有人從事這些的工作內容:石油勘探、石油開採、石油運輸、石油提煉、石油產品銷售等多個細分領域和環節。

最後提供給社會的,是由大量人力和智慧凝結在石油產品上的服務,而這些服務滿足了社會各領域對於工業能源、建築材料、食品包裝、服裝布料、模型器具、日用品等多種製造與使用的需求。試想如果沒有石油,也就沒有廉價汽車與航空動力,尤其是沒有聚乙烯等重要化工原材料的來源,連塑膠這種廉價的工業製造材料都未必能生產,那麼各個產業則需要用其他造價更為高昂的材料對其進行取代,更不用提家用的天然氣和液化石油氣了,大家只能再去尋找其他能源:可能是木柴和煤炭這些不環保的燃料,或者是價格昂貴的氫氣。我們之所以選用石油作為整個產業鏈的根源,並把它發展成一個完整的產業也是由於這樣的原因。

回頭來看「大數據」產業,資料收集、資料傳輸、資料儲存、資料建模、資料分析、資料交易貫穿了大數據產業的完整產業鏈。在這個產業鏈裡同樣蘊含著和「大石油」一樣的東西,這個東西是什麼?

經由各種軟體收集資料,利用網路傳輸,儲存至雲端資料中心,透過資料科學家或者產業專家,建模、加工,最後資料分析得到的是一種知識,是一種大家透過資料洞悉世界的能力。資料之間本來彼此錯綜複雜的潛在關係,使大量獨立而多來源的資料同時出現在一個舞臺,變得更有趣,大量看似不相關的事情卻能夠在觀察與分析後告訴我們更多背後的因果。這些因果聯繫的意義會讓大家在各個方面能夠推測未來趨勢,減少犯錯的機會,降低成本跟風險,節省人力。筆者認為這才是大數據產業本身的價值與意義所在。
網路書店 類別 折扣 價格
  1. 二手書
    25
    $118
  2. 新書
    25
    $121
  3. 新書
    79
    $379
  4. 新書
    79
    $379
  5. 新書
    79
    $380
  6. 新書
    8
    $383
  7. 新書
    85
    $408
  8. 新書
    9
    $432
  9. 新書
    93
    $446
  10. 新書
    95
    $456