大數據決策分析盲點大突破10講 :我分類故我在

大數據決策分析盲點大突破10講 :我分類故我在
定價:450
NT $ 338 ~ 405
  • 作者:何宗武
  • 出版社:五南
  • 出版日期:2018-07-28
  • 語言:繁體中文
  • ISBN10:9571198064
  • ISBN13:9789571198064
  • 裝訂:平裝 / 360頁 / 17 x 23 cm / 普通級 / 單色印刷 / 初版
 

內容簡介

  ★只有這本書!教你比程式語言更重要的數據思維!

  在未來,容易上手的程式語言與免費的教材只會越來越普及,
  唯有絕佳的 資料素養 和 決策分析能力 才能真正讓你出類拔萃!

  ◎內行引入門→本書作者實力雄厚,擁有多年教學經驗,更是R語言中文版的編譯者。
  ◎功力就大增→解析型企業、時間序列、決策樹、隨機森林等十個大數據核心講題幫你全方位大提升!
  ◎思維超展開→程式語言專業講解與發人省思的分析探討同步幫你掌握關鍵。
  ◎展望大未來→每講皆以國際化的大數據時事開頭,引發學習興趣,增進視野高度!


  ※書中附贈豐富資料檔案做學習使用,請至本公司網站www.wunan.com.tw,輸入書號 RM43,即可找到下載處。
  我分類故我在!大數據也要大思維!思維革新比數據技術更重要!
  在商業分析和商業智慧的脈絡下,建構大數據,而不是從巨量資料當中大海撈針。
  如果只是把資料變大,認知學習能力的維度卻沒有變大,接下來會如何?從少量數據都學習不到的價值,大數據只是讓它更遙不可及。

  大數據時代來臨,獲取數據和資訊的技術越發精進,每天產生的數據量也越來越龐大,該如何使龐大資訊發揮影響力?在未來,容易上手的程式語言與免費的教材只會越來越普及,唯有絕佳的資料素養和決策分析能力才能真正讓你出類拔萃!

  作者鑽研R語言多年、擁有資深學界經驗,貢獻良多。本書內容豐富,以十個面向切入,探討大數據所必備的工具,例如R Commander、決策樹、隨機森林與R語言強大的視覺化功能。除了概念解析之外,作者更逐行解析專業程式語言,再加碼實際操作與應用功能說明,在每講的最後,還能領略作者獨到的觀念釐清,讓你不會迷失在大數據的眉角中。非常適合做為R語言的基礎自學書,對於初入大數據領域的讀者如同暮鼓晨鐘、醍醐灌頂。
 
 

作者介紹

作者簡介

何宗武


  現任
  國立台灣師範大學全球經營與策略研究所 教授

  經歷
  世新大學特聘教授
  世新大學財務金融學系 教授
  世新大學數量方法研究暨發展中心主任

  專長財務經濟學、金融大數據、計量經濟資料科學及程式語言等,著作多本相關書籍如:《R語言:深入淺出財經計量》、《R資料採礦與數據分析:以GUI套件Rattle結合程式語言實作》、《資料分析輕鬆學:R Commander高手捷徑》、《Eviews高手:財經計量應用手冊》
 
 

目錄

第1講 淺談解析型企業
第1節 大數據是因為他會長大
第2節 資料解析的兩個大數據環境
第3節 演算法
第4節 數據解析之資訊概論
第5節 測量的哲學──自我學習之路
第6節 本書安排

第2講 掌握資料的統計性質--分布
第1節 資料分布的前兩階動差--平均數和變異數
第2節 描述資料中央趨勢的兩組方法
第3節 資料分布的另外兩個動差
第4節 提審大數據

第3講 時間序列的分類分析
第1節 時間序列性質
第2節 時間序列分析-- 低頻
第3節 時間序列分析— 日高頻資料
第4節 時間序列分類分析— 日內高頻資料
第5節 提審大數據

第4講 線性模式的分類原理— 期望值與信賴區間
第1節 簡易統計原理
第2節 R Commander實作
第3節 R程式碼實作
第4節 提審大數據

第5講 二元模式的分類原理-Logistic迴歸
第1節 簡易廣義線性模型
第2節 R Commander的實作
第3節 R程式的實作
第4節 提審大數據

第6講 主成分的分類原理— 把資料變少了
第1節 簡易原理
第2節 R Commander的實作
第3節 R程式的實作
第4節 提審大數據

第7講 集群分析的分類原理
第1節 集群分析的基本概念
第2節 R Commander實作
第3節 R程式的實作
第4節 提審大數據

第8講 決策樹的分類原理
第1節 分類決策樹原理
第2節 用R GUI 實作
第3節 R Code
第4節 提審大數據

第9講 隨機森林
第1節 原理
第2節 R GUI實作
第3節 R Code實作
第4節 提審大數據

第10講 大數據行銷──購物籃分析
第1節 關聯的分類原理簡介
第2節 R GUI 實作
第3節 R code
第4節 提審大數據

附錄A
第1節 R 漫談和GUI簡介
第2節 R Commander的裝置
第3節 安裝與載入R commander

附錄B
附錄C
第1節 資料檔讀取
第2節 資料庫讀取
第3節 資料表處理的函數
 
 



  數位科技席捲世界帶來了大數據浪潮,但是,這三個字其實有一些誤導,讓一般人以為「大就是美」。其實在商管領域,就是以證據為基礎的決策分析。更精準地說,「大」不是指用4V來描述的資料庫特徵,而是因為數據科技(Data Technology)進步,對多樣資料的「大用」。

  在物聯網技術突飛猛進之下,數據量不可否認的遠遠大於以前。目前平常分析的資料表動輒「萬列千行」,因此如何從這些資料結構中提取資訊,「統計學(Statistics)」和「資料探勘(Data Mining)」就是關鍵技術。然而,我們不是為了大數據而大數據,大數據乃至人工智慧,都是為了支援決策。簡單的說,數據解析產生「預測」,預測解讀產生「決策」。數據解析的原理也只有兩個原則「排序和分類」,所以一言以蔽之:「以排序來分類,從預測到決策」就是大數據解析的核心。據此,本書取名「我分類,故我在」。

  妥善的分類就可以產生可靠的預測,但是,當資料結構複雜時,排序乃至分類就沒有那麼簡單,所以需要利用演算法來處理資料,本書就是依此而生。例如,由分類的角度學習統計:統計學的預測以樣本期望值或條件期望值為基準,據之將資料劃分信賴區間,分類成「內 vs. 外」兩群。重點將不再是參數估計的顯著程度,而是預測表現和誤差分析。

  全書分成10講,為筆者以大數據為名行走江湖的結晶,書內某些部份為在台師大EMBA講授「大數據決策分析」的教材。每一講開頭皆以一個特定企業應用大數據的決策故事為開場,希望讀者能夠覺得不枯燥,同時也瞭解大數據的決策端,相當實戰且關鍵,沒有預測,都是紙上談兵。結尾都附上一個數據決策思考的方塊,從問對問題開始,到最後一哩路。

  案例用R語言的GUI和程式碼實做,但是,程式語言不是重點,而是對所預測對象的行為,有深刻的認識,勿忘domain knowledge。
 

內容連載

「大數據,大思維」這六個字是筆者在 2015 年受電視訪問時所強調的標題,當時會這麼講,是因為大數據過度強調資訊技術範疇,容易和企業進步所需要的成分格格不入。如果講大數據只是一個串流數據的科技設備,那麼大數據只是讓企業糾纏於資料庫規模與形式上的資料演算。一言以蔽之,所謂的大思維,就是數據時代下的解析型企業。解析型企業做的各類決策都跟數據解析有關,例如,行銷就變成 Analytical Marketing,風險管理就是 Analytical Risk Management。
 
數據解析就是以證據為基礎的決策行為,為什麼這件事重要?想像一下,如果你胸痛去看心臟科,醫生不實際檢查你的心臟,直接就裝三支支架;想像一下,你的醫生用直覺判斷某個藥物有用,不實際做生理檢驗,就直接開給你服用;想像一下,你會用大學成績單決定交往對象嗎?這樣的決策很恐怖的。我們應該蒐集資料,研究資訊進步,有更好的分析技術就應該學習,這就是改善決策的方法。
網路書店 類別 折扣 價格
  1. 新書
    75
    $338
  2. 新書
    79
    $356
  3. 新書
    79
    $356
  4. 新書
    79
    $356
  5. 新書
    85
    $383
  6. 新書
    9
    $405
  7. 新書
    9
    $405
  8. 新書
    9
    $405