本書提出采用對等計算模式組織分布式時空索引的建立,主要從節(jié)點同構(gòu)和異構(gòu)兩個角度出發(fā),并結(jié)合用戶的時空查詢類型,從面向歷史查詢、面向?qū)眍A(yù)測查詢和面向描述時空信息的數(shù)據(jù)的查詢出發(fā),研究設(shè)計查詢性能良好、更新能力穩(wěn)定、支持半結(jié)構(gòu)化描述查詢的分布式時空索引機制。
本書共8章,具體內(nèi)容包括:數(shù)據(jù)與大數(shù)據(jù)、大數(shù)據(jù)感知與獲取、大數(shù)據(jù)處理、大數(shù)據(jù)分析、大數(shù)治理、大數(shù)據(jù)安全與隱私及大數(shù)據(jù)行業(yè)應(yīng)用。本書既可共高校相關(guān)專業(yè)教學(xué)使用,也可供大數(shù)據(jù)領(lǐng)域工程師或者有志于大數(shù)據(jù)領(lǐng)域工作或研究的科技人員使用。
本書作者比爾·錢伯斯和馬太·扎哈里亞在強調(diào)Spark2.0的改進(jìn)和新功能的同時,將Spark題分為不同的部分,每個部分都有其獨特的目標(biāo)。你將探索Spark的結(jié)構(gòu)化API的基本操作和常見功能以及StructuredStreaming,后者是用于構(gòu)建端到端流應(yīng)用的一種全新的高層API。開發(fā)人員和系統(tǒng)管理員會學(xué)Spark監(jiān)控
《MATLAB語言與控制系統(tǒng)仿真》根據(jù)實際需要,系統(tǒng)地介紹數(shù)學(xué)軟件MATLAB7.0的基本功能,包括數(shù)值計算功能、符號運算功能和圖形處理功能等,在此基礎(chǔ)上精心設(shè)計了豐富的實例,并且有一些導(dǎo)入案例、知識拓展和MATLAB實驗,這樣可以更好地拓展知識,提高讀者的實踐應(yīng)用能力。MATLAB語言與控制系統(tǒng)仿真的結(jié)合,使得MAT
本書系統(tǒng)地介紹了圖對稱性基礎(chǔ)理論,包括基于圖對稱的復(fù)雜性度量模型與圖距離度量模型、復(fù)雜對稱網(wǎng)絡(luò)生成模型以及基于圖對稱的網(wǎng)絡(luò)約簡理論等,介紹了一系列基于圖對稱性的應(yīng)用方法,包括利用圖對稱實現(xiàn)社交網(wǎng)絡(luò)隱私保護(hù)、利用圖對稱實現(xiàn)高效的*短路徑索引與查詢等。
《案例驅(qū)動的大數(shù)據(jù)原理技術(shù)及應(yīng)用》從大數(shù)據(jù)的定義、特征、關(guān)鍵技術(shù)及其平臺和主要應(yīng)用出發(fā),密切結(jié)合相關(guān)案例,揭示了案例對于大數(shù)據(jù)的驅(qū)動關(guān)系。針對這一關(guān)系,書中分別介紹了Spark系統(tǒng)和編程方式,大數(shù)據(jù)分析基礎(chǔ)算法和實例,面向大數(shù)據(jù)的流數(shù)據(jù)分析算法和實例、圖算法和實例,大數(shù)據(jù)應(yīng)用編程案例,基于時間序列數(shù)據(jù)的預(yù)測等內(nèi)容!栋
非結(jié)構(gòu)化數(shù)據(jù)是與結(jié)構(gòu)化數(shù)據(jù)相對應(yīng)的概念。結(jié)構(gòu)化數(shù)據(jù)具有固定的格式,看上去非常規(guī)整。與結(jié)構(gòu)化數(shù)據(jù)相反,非結(jié)構(gòu)化數(shù)據(jù)是指無固定格式的數(shù)據(jù),例如,文本、網(wǎng)頁、圖像、視頻、數(shù)據(jù)流、序列、社交網(wǎng)絡(luò)、圖結(jié)構(gòu)等,F(xiàn)有數(shù)據(jù)中絕大多數(shù)數(shù)據(jù)都是非結(jié)構(gòu)化數(shù)據(jù)。本書介紹了四種典型非結(jié)構(gòu)化數(shù)據(jù)的分析和挖掘技術(shù),分別是:文本數(shù)據(jù)、社交網(wǎng)絡(luò)數(shù)據(jù)、數(shù)
阿布·埃拉·哈桑尼、艾哈邁德·塔赫爾·阿薩、哈維爾·斯納謝爾、亞努什·卡茨匹奇克、杰馬勒·阿巴瓦耶等編著的《復(fù)雜系統(tǒng)中大數(shù)據(jù)分析與實踐(精)》從復(fù)雜系統(tǒng)與大數(shù)據(jù)的結(jié)合點出發(fā),在基礎(chǔ)理論知識的基礎(chǔ)上,首先通過在多個應(yīng)用背景下
本書通過原理加案例的方式系統(tǒng)地講解了Hadoop大數(shù)據(jù)開發(fā),讓讀者能夠全面地了解大數(shù)據(jù)開發(fā)流程。書中精心安排了原理分析、環(huán)境搭建、案例開發(fā)等多個過程,使讀者對解決大數(shù)據(jù)問題有清晰的思路。全書共7章:前6章系統(tǒng)講解大數(shù)據(jù)Hadoop架構(gòu),包括大數(shù)據(jù)處理平臺Hadoop、分布式文件系統(tǒng)HDFS、并行計算模型MapReduc
Kibana是廣泛地應(yīng)用在數(shù)據(jù)檢索和數(shù)據(jù)可視化領(lǐng)域的ELK中的一員。本書專門介紹Kibana,通過不同的用例場景,帶領(lǐng)讀者全面體驗Kibana的可視化功能。全書共9章,主要包括數(shù)據(jù)驅(qū)動架構(gòu)簡介、安裝和配置Kibana5.0、用Kibana進(jìn)行業(yè)務(wù)分析、用Kibana進(jìn)行日志分析、用Kibana和Metricbeat進(jìn)行