數(shù)據(jù)是數(shù)智時代的關鍵生產(chǎn)要素,通過高效有序的跨域流通過程可以實現(xiàn)其價值釋放。本書圍繞跨域數(shù)據(jù)治理,提出數(shù)據(jù)驅動的社會化信息系統(tǒng)構建理論,梳理總結形成數(shù)據(jù)資源體系、服務支撐體系和業(yè)務應用體系的三層體系框架。在此基礎上,介紹跨域數(shù)據(jù)治理的三層體系框架中的關鍵技術突破,其中,數(shù)據(jù)資源體系著眼于實現(xiàn)以數(shù)據(jù)資源對象化為基礎的數(shù)據(jù)
本書以Python作為開發(fā)語言,系統(tǒng)介紹PySpark開發(fā)環(huán)境搭建流程及基于PySpark進行大數(shù)據(jù)分析的相關知識。本書條理清晰、重點突出,理論敘述循序漸進、由淺入深。本書共7章,第1?5章包括PySpark大數(shù)據(jù)分析概述、PySpark安裝配置、基于PySpark的DataFrame操作、基于PySpark的流式數(shù)據(jù)
本書的主旨是介紹如何結合Python3語言進行各類結構化和非結構化數(shù)據(jù)的采集、預處理和存儲,涉及統(tǒng)計概率、數(shù)據(jù)格式與編碼、網(wǎng)頁開發(fā)、自然語言處理、數(shù)據(jù)科學等不同領域的內(nèi)容。全書共分為11章,包括數(shù)據(jù)科學概述、Python基礎、統(tǒng)計與概率基礎、文件讀寫與操作、數(shù)據(jù)可視化、網(wǎng)絡數(shù)據(jù)爬取等多個主題。內(nèi)容覆蓋本地文件、網(wǎng)頁數(shù)據(jù)
數(shù)據(jù)治理是一門實踐中的學問。本書輕理論、重實踐,是一份實用的數(shù)據(jù)治理指南,涉及數(shù)據(jù)治理組織、管理制度、流程規(guī)范、數(shù)據(jù)標準管理、數(shù)據(jù)質(zhì)量管理、元數(shù)據(jù)管理、主數(shù)據(jù)管理、數(shù)據(jù)安全與隱私等主題。全書共分為3篇,第一篇包含第1章和第2章,介紹數(shù)據(jù)治理的理論與方法;第二篇包含第3章至第6章,介紹數(shù)據(jù)治理的平臺建設與工具;第三篇包含
本書從實用角度出發(fā),圍繞Linux操作系統(tǒng)和Hadoop集群部署,從虛擬機安裝入手,結合典型項目和案例,較為全面地介紹了大數(shù)據(jù)開發(fā)技術平臺Hadoop及其生態(tài)系統(tǒng)的相關知識。主要內(nèi)容包括大數(shù)據(jù)技術中的Hadoop集群部署、HDFS、MapReduce、Hive、HBase和Sqoop等。全書所有知識點都結合具體的編程示
本書重點介紹大數(shù)據(jù)計算分析主要算法及主流計算框架,強調(diào)“理實一體”的教學模式和方法。在講解各種計算分析技術的同時,本書對于核心技術都配以相應的實訓項目/案例,真正訓練學生解決大數(shù)據(jù)問題的實踐能力。本書內(nèi)容包括:大數(shù)據(jù)計算分析技術概述、大數(shù)據(jù)計算分析常用算法及場景、大數(shù)據(jù)離線計算分析技術、大數(shù)據(jù)流式計算分析技術、機器學習
"本教材分為理論篇和實踐篇。理論篇主要的內(nèi)容為工業(yè)網(wǎng)絡概述、通信基礎、計算機網(wǎng)絡。理論篇主要介紹工業(yè)網(wǎng)絡概念、計算機控制系統(tǒng)概念和發(fā)展、常見的工業(yè)控制網(wǎng)絡;通信概念和通信技術的基礎知識;計算機網(wǎng)絡的概念和組建基礎知識。實踐篇包括5個項目內(nèi)容,項目一串行通信應用;項目二PROFIBUS基礎與組網(wǎng)應用;項目三工業(yè)以太網(wǎng)組網(wǎng)
本書依托一個大數(shù)據(jù)綜合項目—電影市場的預測,按照大數(shù)據(jù)技術在該項目開發(fā)中的應用過程,將本書內(nèi)容分為10個工作任務,包括初識Hadoop、搭建Hadoop集群、數(shù)據(jù)上傳、配置Hadoop高可用、數(shù)據(jù)清洗、使用MapReduce統(tǒng)計電影上映情況與排序、數(shù)據(jù)建倉、數(shù)據(jù)分析、數(shù)據(jù)遷移和數(shù)據(jù)可視化。書中的具體工作任務有助于讀者綜
"本書從實用的角度出發(fā),以工程實際應用為背景,介紹現(xiàn)代測控系統(tǒng)與信息融合技術的基本特征、常用方法及典型工程應用。本書共包含7章,分別介紹現(xiàn)代檢測技術的基本特征及實現(xiàn)方法,現(xiàn)代測控系統(tǒng)的基本結構及典型測控系統(tǒng),現(xiàn)代傳感器的特性、常用信號處理技術、傳感器接口技術和通信協(xié)儀及典型應用,多傳感器信息融合的基本原理、典型算法及典
數(shù)據(jù)標注乃至人工智能行業(yè)的發(fā)展關鍵在于專業(yè)人才的培養(yǎng)。在未來幾十年,數(shù)據(jù)標注會伴隨著人工智能需求的不斷提高而不斷發(fā)展。本書對數(shù)據(jù)標注、數(shù)據(jù)處理、項目管理、問句復述標注、拼音停頓標注和3D點云標注進行逐一講解和分析,每種標注類型均配有對應的規(guī)范、舉例分析、習題與解析。本書還針對各類標注類型配套了多種子任務類型或多個領域的