關(guān)于我們
書單推薦
新書推薦
|
PySpark原理深入與編程實戰(zhàn)(微課視頻版)
本書系統(tǒng)講述Apache Spark/PySpark大數(shù)據(jù)計算平臺的原理,以及如果將Apache PySpark應用于大數(shù)據(jù)的實時流處理、批處理等各個場景。通過原理深入學習和實踐示例、案例的學習應用,使讀者了解并掌握Apache Spark/PySpark的基本原理和技能,接近理論與實踐的距離。
全書共分為8章,主要內(nèi)容包括:Spark架構(gòu)原理與集群搭建、開發(fā)和部署PySpark應用程序、PySpark核心編程、PySpark SQL、PySpark SQL高級分析、PySpark結(jié)構(gòu)化流、PySpark結(jié)構(gòu)化流高級處理、Spark大數(shù)據(jù)處理綜合案例。本書源碼全部在Apache Spark 3.1.2上調(diào)試成功,所有示例和案例均基于Python 3.x語言。 為降低讀者學習大數(shù)據(jù)技術(shù)的門檻,本書除了提供了豐富的上機實踐操作和范例程序詳解之外,本書作者還為購買和使用本書的讀者提供了搭建好的Hadoop、Hive數(shù)倉和PySpark大數(shù)據(jù)開發(fā)和學習環(huán)境。讀者既可以參照本書的講解自行搭建Hadoop和PySpark環(huán)境,也可直接使用作者提供的開始和學習環(huán)境,快速開始大數(shù)據(jù)和PySpark的學習。 本書系統(tǒng)講解了Apache Spark/PySpark大數(shù)據(jù)計算平臺的原理和流、批處理的開發(fā)實踐,內(nèi)容全面、實例豐富、可操作性強,做到了理論與實踐相結(jié)合。本書適合大數(shù)據(jù)學習愛好者、想要入門Apache Spark/PySpark的讀者作為入門和提高的技術(shù)參考書,也適合用作大中專院校大數(shù)據(jù)專業(yè)相關(guān)的學生和老師的教材或教學參考書。
你還可能感興趣
我要評論
|