關于我們
書單推薦
新書推薦
|
Python大數(shù)據(jù)處理庫PySpark實戰(zhàn)
我國提出新基建概念,要加快大數(shù)據(jù)中心、人工智能等新型基礎設施的建設進度,這無疑需要更多的大數(shù)據(jù)人才。PySpark可以對大數(shù)據(jù)進行分布式處理,降低大數(shù)據(jù)學習門檻,本書正是一本PySpark入門教材,適合有一定Python基礎的讀者學習使用。
本書分為7章,第1章介紹大數(shù)據(jù)的基本概念、常用的大數(shù)據(jù)分析工具;第2章介紹Spark作為大數(shù)據(jù)處理的特點和算法;第3章介紹Spark實戰(zhàn)環(huán)境的搭建,涉及Windows和Linux操作系統(tǒng);第4章介紹如何靈活應用PySpark對數(shù)據(jù)進行操作;第5章介紹PySpark ETL處理,涉及PySpark讀取數(shù)據(jù)、對數(shù)據(jù)進行統(tǒng)計分析等數(shù)據(jù)處理相關內容;第6章介紹PySpark如何利用MLlib庫進行分布式機器學習(Titanic幸存者預測);第7章介紹一個PySpark和Kafka結合的實時項目。 本書內容全面、示例豐富,可作為廣大PySpark入門讀者必備的參考書,同時能作為大中專院校師生的教學參考書,也可作為高等院校計算機及相關專業(yè)的大數(shù)據(jù)技術教材使用。
你還可能感興趣
我要評論
|