《數(shù)據(jù)挖掘方法與應(yīng)用》以應(yīng)用為導(dǎo)向介紹數(shù)據(jù)挖掘的相關(guān)工具、理論和方法,包括數(shù)據(jù)挖掘概述、數(shù)據(jù)挖掘工具、數(shù)據(jù)與數(shù)據(jù)平臺(tái)、數(shù)據(jù)預(yù)處理、關(guān)聯(lián)分析、決策樹(shù)、貝葉斯分類和神經(jīng)網(wǎng)絡(luò)。通過(guò)循序漸進(jìn)地講解數(shù)據(jù)挖掘可使用的工具、數(shù)據(jù)存儲(chǔ)及分析環(huán)境、原始數(shù)據(jù)可能存在的問(wèn)題及相應(yīng)的預(yù)處理方法、數(shù)據(jù)挖掘經(jīng)典算法等相關(guān)知識(shí),使讀者對(duì)數(shù)據(jù)挖掘有整
Zabbix憑借其既豐富又優(yōu)秀的特性,在國(guó)內(nèi)外的監(jiān)控市場(chǎng)蓬勃發(fā)展,投靠Zabbix陣營(yíng)的用戶不計(jì)其數(shù)。面對(duì)Zabbix的蔓延,與其逡巡觀望,不如盡早加入搶占先機(jī)!本書(shū)詳細(xì)介紹Zabbix各項(xiàng)功能,包括安裝、配置、告警、可視化、分布式監(jiān)控、自動(dòng)化等。 本書(shū)分為14章,由淺入深地對(duì)Zabbix的基礎(chǔ)和高級(jí)功能進(jìn)行細(xì)致地講
《Flink內(nèi)核原理與實(shí)現(xiàn)》既講解了Flink的入門(mén)、安裝、流計(jì)算開(kāi)發(fā)入門(mén)、類型和序列化系統(tǒng)、監(jiān)控運(yùn)維、安全管理配置等基礎(chǔ)知識(shí),又講解了Flink的時(shí)間概念、Window的實(shí)現(xiàn)原理及其代碼解析,F(xiàn)link的容錯(cuò)機(jī)制原理,F(xiàn)link容錯(cuò)的關(guān)鍵設(shè)計(jì)、代碼實(shí)現(xiàn)分析,F(xiàn)linkJob從源碼到執(zhí)行整個(gè)過(guò)程的解析,F(xiàn)linkJob
內(nèi)容簡(jiǎn)介這是一部全面講解數(shù)據(jù)產(chǎn)品經(jīng)理核心知識(shí)體系的著作。12位作者大多來(lái)自國(guó)內(nèi)的知名企業(yè),涉及不同的行業(yè),讓本書(shū)擁有了更廣泛的視角,能幫助讀者從不同的角度去了解數(shù)據(jù)產(chǎn)品經(jīng)理如何在數(shù)據(jù)、產(chǎn)品、運(yùn)營(yíng)、市場(chǎng)等多個(gè)方面產(chǎn)生價(jià)值。本書(shū)的*終目的是讓讀者全面了解數(shù)據(jù)產(chǎn)品經(jīng)理的工作內(nèi)容、系統(tǒng)掌握數(shù)據(jù)產(chǎn)品的核心知識(shí)體系,快速實(shí)現(xiàn)從入門(mén)
本書(shū)詳細(xì)闡述了培養(yǎng)復(fù)合型大數(shù)據(jù)專業(yè)人才所需要的大數(shù)據(jù)相關(guān)知識(shí)。全書(shū)共9章,內(nèi)容包括大數(shù)據(jù)概述、大數(shù)據(jù)與其他新興技術(shù)的關(guān)系、大數(shù)據(jù)基礎(chǔ)知識(shí)、大數(shù)據(jù)應(yīng)用、數(shù)據(jù)采集與預(yù)處理、數(shù)據(jù)存儲(chǔ)與管理、數(shù)據(jù)處理與分析、數(shù)據(jù)可視化、大數(shù)據(jù)分析綜合案例。在大數(shù)據(jù)基礎(chǔ)知識(shí)部分,本書(shū)詳細(xì)介紹了與培養(yǎng)學(xué)生的數(shù)據(jù)素養(yǎng)相關(guān)的知識(shí),包括大數(shù)據(jù)安全、大數(shù)
本書(shū)是高校的大數(shù)據(jù)導(dǎo)論課程教材,清楚地介紹了大數(shù)據(jù)相關(guān)的概念、理論、術(shù)語(yǔ)與基礎(chǔ)技術(shù),并使用真實(shí)連貫的商業(yè)案例以及簡(jiǎn)單的圖表,幫助讀者更清晰地理解大數(shù)據(jù)技術(shù)。本書(shū)可作為高等院校相關(guān)專業(yè)“大數(shù)據(jù)基礎(chǔ)”“大數(shù)據(jù)導(dǎo)論”等課程的教材,也可供有一定實(shí)踐經(jīng)驗(yàn)的軟件開(kāi)發(fā)人員、管理人員和所有對(duì)大數(shù)據(jù)感興趣的人士閱讀。
共分11章,第1章對(duì)大數(shù)據(jù)及Hadoop進(jìn)行總體介紹,第2章講解了如何搭建Hadoop集群。第3-5章講解了HDFS分布式文件系統(tǒng)、MapReduce分布式計(jì)算框架以及Zookeeper分布式協(xié)調(diào)服務(wù)。第6章講解Hadoop2.0的新特性。第7-10章主要講解了Hadoop生態(tài)圈中的相關(guān)輔助系統(tǒng),包括Hive、HBas
本書(shū)系統(tǒng)介紹了大數(shù)據(jù)基礎(chǔ)知識(shí)和相關(guān)技術(shù),全書(shū)分為大數(shù)據(jù)概述篇、大數(shù)據(jù)存儲(chǔ)與管理篇、大數(shù)據(jù)采集與預(yù)處理篇、大數(shù)據(jù)分析與挖掘篇、大數(shù)據(jù)平臺(tái)Hadoop實(shí)踐與案例分析篇。全書(shū)共15章,主要內(nèi)容包括大數(shù)據(jù)基本概念、大數(shù)據(jù)存儲(chǔ)與管理概念及技術(shù)、大數(shù)據(jù)采集及預(yù)處理技術(shù)、大數(shù)據(jù)計(jì)算模式、大數(shù)據(jù)分布式并行處理框架Hadoop、大數(shù)據(jù)分
本書(shū)作為Spark的入門(mén)書(shū),從Spark核心編程語(yǔ)言Scala講起,涵蓋當(dāng)前Spark主流的開(kāi)發(fā)組件。以實(shí)操為主,深入講解每一個(gè)操作步驟,包括SparkRDD離線數(shù)據(jù)處理、SparkSQL快速結(jié)構(gòu)化數(shù)據(jù)處理、SparkStreaming實(shí)時(shí)數(shù)據(jù)處理,同時(shí)包括案例講解、源碼剖析、常用Shell命令和JavaAPI詳解。即
本書(shū)系統(tǒng)地講解了大數(shù)據(jù)處理常用技術(shù),具體包括大數(shù)據(jù)處理架構(gòu)Hadoop、分布式文件系統(tǒng)HDFS、MapReduce編程模型、分布式數(shù)據(jù)庫(kù)Hbase、NoSQL數(shù)據(jù)庫(kù)、Spark分布式內(nèi)存計(jì)算、MapReduce應(yīng)用開(kāi)發(fā)、SparkSQL編程、數(shù)據(jù)可視化。本書(shū)編寫(xiě)特色理論與具體操作相結(jié)合,較低基礎(chǔ)入門(mén)大數(shù)據(jù)技術(shù)。讀者對(duì)象