Spark是業界公認的近幾年發展最快、最受關注度的一體化多元化的大數據計算技術,可以同時滿足不同業務場景和不同數據規模的大數據計算的需要。
本書首先通過代碼實戰的方式對學習Spark前必須掌握的Scala內容進行講解並結合Spark源碼的閱讀來幫助讀者快速學習Scala函數式編程與面向對象完美結合的編程藝術,接着對Hadoop和Spark集群安裝部署以及Spark在不同集成開發環境的開發實戰作出了詳細的講解,然后基於大量的實戰案例來講解Spark核心RDD編程並深度解密RDD的密碼,並且通過實戰的方式詳解了TopN在Spark
RDD中的實現,為了讓讀者徹底了解Spark,本書用了大量的篇幅詳細解密了Spark的高可用性、內核架構、運行機制等內容。
Spark零基礎實戰這本書定位於零基礎的學員,也可以作為有一定大數據Hadoop經驗的從業者以及對大數據非常感興趣的學生的第一本Spark入門書籍。
王家林,DT大數據夢工廠創始人和首席專家,Spark亞太研究院院長和首席專家,移動互聯網和大數據技術領域集大成者,多家著名公司的技術顧問,業界知名資深技術培訓專家。
大數據技術公益推廣人,大數據在線教育世界知名技術專家,Spark 大數據中國區最具知名度的培訓專家之一。徹底研究了Spark 從0.5.0到1.6.1中共22個版本的Spark 源碼,目前致力於開發全球最優化的Spark 中國版本。尤其擅長Spark 在生產環境下各種類型和場景故障的排除和解決,痴迷於Spark 生產環境下任意類型(例如Shuffle 和各種內存問題)的Spark
程序的深度性能優化。
從2014年6月24日起,已開啟免費的Spark 公開課《決勝大數據時代Spark100 期公益大講堂》。在2015年6月27日成立DT 大數據夢工廠,開啟IMF(Impossible Mission Force)行動,率先在全球開展以Spark 為核心的,免費為社會培養100萬企業級實戰高級大數據人才行動計划,截至目前已有數千人參與到這個行動之中。
曾負責某知名公司的類Hadoop 框架開發工作,是Hadoop 一站式解決方案的提供者,同時也是雲計算和分布式大數據處理的較早實踐者之一,在實踐中用Hadoop 解決不同領域的大數據的高效處理和存儲。致力於Android、HTML5、Hadoop 等的軟、硬、雲整合的一站式解決方案專家。
2007年國內較早從事於Android 系統移植、軟硬整合、框架修改、應用程序軟件開發以及Android 系統測試和應用軟件測試的技術專家。
2015年12月,在電視媒體錄制了《大數據的奧秘》,《大數據時代的九大神器》等視頻光盤。
2016年1月至今,直播培訓課程Hadoop,MySQL,Linux,Scala,Java,Spark零基礎到高級企業級實戰,Spark源碼解析及性能優化,JVM性能調優,機器學習從零基礎到企業級實戰持續中。
-
自動控制原理、現代控制理論學習百問百答
$360 -
智能汽車關鍵技術與設計方法
$360 -
卷積神經網路的Python實現
$256 -
工業機器人虛擬模擬應用教程
$235 -
基於聚合物的多功能納米複合材料(英文版)
$894 -
乘用車用橡膠與輕量化
$465 -
電動汽車前沿技術及應用
$313 -
TRIZ創新方法及應用案例分析
$474 -
當產品經理遇到人工智慧
$374 -
現代感測技術與應用
$239 -
汽車美容與裝飾快速入門(全彩色圖解版)
$270 -
夜景與弱光攝影:拍出好照片的50個關鍵技法
$308 -
工業分析
$239 -
感測器技術實驗教程
$146 -
粉體製備原理與技術
$354 -
下一站 火星:馬斯克,貝佐斯與太空爭奪戰
$308 -
高超聲速飛行器的增益協調魯棒參數化控制
$512 -
大數據技術基礎
$251 -
文本分析與文本挖掘
$574 -
機器學習基礎
$156







