大數據時代為機器學習的應用提供了廣闊的空間,各行各業涉及數據分析的工作都需要使用機器學習算法。本書圍繞實際數據分析的流程展開,着重介紹數據探索、數據預處理和常用的機器學習算法模型。本書從解決實際問題的角度出發,介紹回歸算法、分類算法、推薦算法、排序算法和集成學習算法。在介紹每種機器學習算法模型時,書中不但闡述基本原理,而且討論模型的評價與選擇。為方便讀者學習各種算法,本書介紹了R語言中相應的軟件包並給出了示例程序。
本書的一大特色就是貼近工程實踐。首先,本書僅側重介紹當前工業界常用的機器學習算法,而不追求知識內容的覆蓋面;其次,本書在介紹每類機器學習算法時,力求通俗易懂地闡述算法思想,而不追求理論的深度,讓讀者借助代碼獲得直觀的體驗。
孫亮,*數據科學與技術研究院高級專家。曾任微軟Azure機器學習(Azure Machine Learning)部門高級數據科學家,先后畢業於南京大學計算機系(1999-2003)、中國科學院軟件研究所(2003-2006)、美國亞利桑那州立大學計算機系(2006-2011),研究興趣包括機器學習、數據挖掘及其實際應用等。近年來參加了KDD Cup、Heritage
HealthPrize等多項數據挖掘競賽並多次取得優異成績。在IEEE T-PAMI、NIPS、ICML、SIGKDD等機器學習領域的知名國際期刊和國際會議上發表論文近20篇,著有機器學習英文專著1部。
黃倩,河海大學副研究員,先后畢業於南京大學計算機系(1999-2003)、中國科學院計算技術研究所(2003-2010),研究興趣包括多媒體大數據處理、機器學習、雲計算等。參加過多個973、863、國家自然科學基金項目的研究,參與過AVS、H.265
HEVC等國內外視頻壓縮標准的制訂。現主持包括國家自然科學基金在內的多個國家、省市級項目,並獲南京市江寧區首批高層次創業人才「創聚工程」項目資助。在相關領域的知名國際期刊和國際會議上發表論文逾20篇,出版譯著4本,參編專著1部。
-
粉體製備原理與技術
$354 -
粉體技術與應用
$330 -
高超聲速飛行器的增益協調魯棒參數化控制
$512 -
機器學習基礎
$156 -
電動汽車前沿技術及應用
$313 -
TRIZ創新方法及應用案例分析
$474 -
大數據技術基礎
$251 -
自動控制原理、現代控制理論學習百問百答
$360 -
主題模型與文本知識發現應用研究
$412 -
工業機器人虛擬模擬應用教程
$235 -
測繪程序設計(上冊)
$198 -
輕鬆玩轉無人機航拍(拍攝+後期全攻略)
$412 -
大數據處理技術--R語言專利分析方法與應用
$303 -
無人駕駛:人工智慧如何顛覆汽車
$412 -
汽車自動變速器原理與檢修(第3版)
$294 -
下一站 火星:馬斯克,貝佐斯與太空爭奪戰
$308 -
狀態估計和關聯的實踐應用
$981 -
2018中國高速公路運輸量統計調查分析報告
$418 -
設計:文本與語境
$303 -
匠心設計1:跟日本設計大師學設計思維
$392













