《大數(shù)據(jù)工程師面試筆試寶典》全面講解了大數(shù)據(jù)的核心技術(shù)及如何解答大數(shù)據(jù)工程師面試筆試中的常見問題,還引入了相關知識點輔以說明,讓讀者對所學知識進行查漏補缺,幫助讀者順利通過大數(shù)據(jù)工程師面試筆試!洞髷(shù)據(jù)工程師面試筆試寶典》的題目均來自一線互聯(lián)網(wǎng)公司面試筆試真題,涵蓋大數(shù)據(jù)基礎、大數(shù)據(jù)生態(tài)圈技術(shù)組件以及大數(shù)據(jù)不同崗位的面
本書以Spark大數(shù)據(jù)分析的常用技術(shù)與真實項目相結(jié)合的方式,深入淺出地介紹Spark大數(shù)據(jù)分析的重要內(nèi)容。全書共8個項目,內(nèi)容包括廣告流量檢測違規(guī)識別流程分析、Spark大數(shù)據(jù)環(huán)境安裝搭建、基于Hive實現(xiàn)廣告流量檢測數(shù)據(jù)存儲、基于SparkSQL實現(xiàn)廣告流量檢測數(shù)據(jù)探索分析、基于SparkSQL實現(xiàn)廣告流量檢測數(shù)據(jù)預
本書按照大數(shù)據(jù)分析流程,以電商產(chǎn)品數(shù)據(jù)為例,由淺入深地講解大數(shù)據(jù)分析的核心開發(fā)技術(shù),以及大數(shù)據(jù)分析工具及其組件的作用和使用方法。本書內(nèi)容系統(tǒng)、全面,可幫助讀者快速掌握大數(shù)據(jù)分析技術(shù)。本書介紹了大數(shù)據(jù)分析的概念、應用場景、分析指標、分析工具、分析組件、分布式存儲、分布式處理、數(shù)據(jù)離線分析、數(shù)據(jù)實時分析、數(shù)據(jù)挖掘,以及數(shù)據(jù)
本書按照大數(shù)據(jù)采集與預處理的實現(xiàn)流程,由淺入深地講解大數(shù)據(jù)采集與預處理的相關技術(shù),以及如何使用不同方式對大數(shù)據(jù)進行采集與預處理。本書內(nèi)容系統(tǒng)、全面,可幫助開發(fā)人員快速實現(xiàn)大量數(shù)據(jù)的采集。本書主要內(nèi)容包括大數(shù)據(jù)采集與預處理簡介、PyCharm的安裝與使用、Urllib庫數(shù)據(jù)采集、Requests庫數(shù)據(jù)采集、XPath和B
《數(shù)據(jù)分析實踐:專業(yè)知識和職場技巧》從初學者的角度出發(fā),講解了進階為高級數(shù)據(jù)分析師所需的知識和技能,其中既包括數(shù)據(jù)分析崗位的介紹、發(fā)展現(xiàn)狀及未來趨勢,也包括實際工作中各環(huán)節(jié)的方法策略、實戰(zhàn)案例,還包括職場中的困惑解答及面試指導。閱讀本書,并基于本書進一步拓展所需要的知識能,可以幫助讀者形成一套成系統(tǒng)、可實戰(zhàn)的數(shù)據(jù)分析方
本書是按照教育部“一體化設計、結(jié)構(gòu)化課程、顆粒化資源”的邏輯建設理念,由從事實踐教學的教師和企業(yè)一線工程師聯(lián)合編寫而成的。本書基于iFIX智能平臺,采用項目式結(jié)構(gòu)體系,側(cè)重實踐操作能力及綜合設計能力的培養(yǎng)。全書包括15個基礎項目和5個綜合項目,系統(tǒng)地介紹了SCADA系統(tǒng)應用相關的知識,通過項目讓學生代入SCADA工程師
本書集作者多年計算機控制技術(shù)的教學和應用實踐經(jīng)驗,且通過教材及課件、實驗指導書、教學輔助APP、思考題與習題的指導信息等資源,構(gòu)建“立體化教學平臺”。本書分為理論基礎部分、實踐部分和應用部分。理論基礎部分介紹了計算機控制系統(tǒng)。應用篇介紹了計算機控制技術(shù)在物流自動化領域應用的具體模式和實例。為方便教學和自學,所有章節(jié)都有
本書對數(shù)據(jù)湖倉的基礎知識、數(shù)據(jù)工程、商業(yè)價值、數(shù)據(jù)集成等方面進行了深入探討,同時展望了數(shù)據(jù)架構(gòu)的演化趨勢,使讀者能夠領會數(shù)據(jù)湖倉的精髓,最終輕松、全面地管理數(shù)據(jù)湖倉項目。
本書圍繞數(shù)據(jù)分析的基本概念與常用方法,提供一套適用于初學者快速入門的實踐教材。本書中以醫(yī)學數(shù)據(jù)為例,圍繞實際應用場景中最常見的五種數(shù)據(jù)形式:統(tǒng)計數(shù)據(jù)、文本數(shù)據(jù)、時序數(shù)據(jù)、圖像數(shù)據(jù)以及健康數(shù)據(jù),從基本概念、初步探索到綜合應用的全流程系統(tǒng)示范教學。本書共計五個章節(jié),分別為:統(tǒng)計數(shù)據(jù)分析、文本數(shù)據(jù)分析、時序數(shù)據(jù)分析、圖像數(shù)據(jù)
本書系統(tǒng)介紹了大數(shù)據(jù)的相關知識,全書共13章,內(nèi)容包括Hadoop大數(shù)據(jù)處理架構(gòu)、HDFS分布式文件系統(tǒng)、YARN資源管理、MapReduce分布式計算框架、HBase分布式數(shù)據(jù)庫、流數(shù)據(jù)采集、典型非關系數(shù)據(jù)庫的安裝與使用、分布式數(shù)據(jù)分析工具Pig、Spark大數(shù)據(jù)處理框架、基于Python的SparkRDD編程、基于