這是一本將數(shù)據(jù)科學(xué)三要素商業(yè)理解、量化模型、數(shù)據(jù)技術(shù)全面打通的實(shí)戰(zhàn)性著作,是來自騰訊、滴滴、快手等一線互聯(lián)網(wǎng)企業(yè)的數(shù)據(jù)科學(xué)家、數(shù)據(jù)分析師和算法工程師的經(jīng)驗(yàn)總結(jié),得到了SQLFlow創(chuàng)始人以及騰訊、網(wǎng)易、快手、貝殼找房、谷歌等企業(yè)的專家一致好評(píng)和推薦。 全書三個(gè)部分,內(nèi)容相對(duì)獨(dú)立,既能幫助初學(xué)者建立知識(shí)體系,又能幫助從
本書將通過具有中國(guó)特色的具體案例來講授Python編程的基本語(yǔ)法規(guī)則,并通過Python語(yǔ)言來介紹數(shù)據(jù)科學(xué)的基本內(nèi)容以及數(shù)據(jù)分析方法的基本思想。內(nèi)容分為兩部分,第一部分介紹Python編程的基本概念,包括常用表達(dá)式、數(shù)據(jù)類型、表格處理、數(shù)據(jù)可視化等;第二部分結(jié)合Python語(yǔ)言介紹數(shù)據(jù)分析方法的基本思想,比如假設(shè)檢驗(yàn)、
本書詳細(xì)闡述了培養(yǎng)具有數(shù)據(jù)素養(yǎng)的技術(shù)技能型人才所需要的大數(shù)據(jù)相關(guān)基礎(chǔ)知識(shí)。本書在確定知識(shí)布局時(shí),秉持的一個(gè)基本原則是,緊緊圍繞大數(shù)據(jù)通識(shí)教育核心理念,培養(yǎng)學(xué)生的數(shù)據(jù)意識(shí)、數(shù)據(jù)思維、數(shù)據(jù)安全和數(shù)據(jù)分析能力。全書共7章,內(nèi)容包括大數(shù)據(jù)概述,大數(shù)據(jù)思維,數(shù)據(jù)庫(kù)基礎(chǔ)知識(shí),大數(shù)據(jù)分析技術(shù)及相關(guān)應(yīng)用,數(shù)據(jù)可視化概論,大數(shù)據(jù)安全,大
本書系統(tǒng)、全面地介紹大數(shù)據(jù)技術(shù)的基礎(chǔ)知識(shí)。全書共13章,首先介紹大數(shù)據(jù)行業(yè)與技術(shù)趨勢(shì);然后介紹大數(shù)據(jù)生態(tài)圈的各項(xiàng)技術(shù),包括分布式文件系統(tǒng)、Hive分布式數(shù)據(jù)倉(cāng)庫(kù)、HBase技術(shù)原理、MapReduce和YARN技術(shù)原理、Spark基于內(nèi)存的分布式計(jì)算、Flink流批一體分布式實(shí)時(shí)處理引擎、數(shù)據(jù)采集與數(shù)據(jù)裝載工具、Kaf
《大數(shù)據(jù)百科術(shù)語(yǔ)辭典》漢外對(duì)照系列叢書是全球首套系統(tǒng)研究大數(shù)據(jù)術(shù)語(yǔ)的多語(yǔ)種智能化專業(yè)辭典。本叢書對(duì)大數(shù)據(jù)知識(shí)體系進(jìn)行了全面梳理,提出了九個(gè)方面的術(shù)語(yǔ)架構(gòu),形成了統(tǒng)一規(guī)范、符合國(guó)際通用規(guī)則的多語(yǔ)種學(xué)術(shù)話語(yǔ)體系;叢書系統(tǒng)性提供漢語(yǔ)與其他二十個(gè)語(yǔ)種的術(shù)語(yǔ)規(guī)范表述,以中外文對(duì)照的形式展示;叢書開創(chuàng)性融入知識(shí)圖譜、有聲點(diǎn)讀、平臺(tái)
Hadoop是當(dāng)前熱門的大數(shù)據(jù)處理與分析平臺(tái)。《Hadoop大數(shù)據(jù)開發(fā)基礎(chǔ)項(xiàng)目化教程》將大數(shù)據(jù)平臺(tái)相關(guān)內(nèi)容劃分為8個(gè)項(xiàng)目,分別是大數(shù)據(jù)時(shí)代、Hadoop基礎(chǔ)環(huán)境、Hadoop環(huán)境搭建、分布式存儲(chǔ)HDFS、MapReduce分布式編程、Hadoop數(shù)據(jù)倉(cāng)庫(kù)Hive、Hadoop數(shù)據(jù)庫(kù)HBas、協(xié)調(diào)系統(tǒng)Zookeeper,
本書介紹數(shù)據(jù)分析的統(tǒng)計(jì)基礎(chǔ)、種類劃分,并列舉大量實(shí)例以說明數(shù)據(jù)分析方法和算法。內(nèi)容主要分為4部分,第1部分為第1章,介紹一些概念,簡(jiǎn)單描述數(shù)據(jù)分析方法和一些實(shí)例;第2部分包括第2~7章,介紹描述性分析和數(shù)據(jù)預(yù)處理的主要方法,包括描述統(tǒng)計(jì)、多元描述分析、聚類以及頻繁模式挖掘等;第3部分包括第8~12章,介紹預(yù)測(cè)性分析的主
面對(duì)日漸復(fù)雜的大數(shù)據(jù),科技工作者很難用單一的統(tǒng)計(jì)軟件高效、完美地完成從數(shù)據(jù)挖掘、數(shù)據(jù)清洗、統(tǒng)計(jì)分析到結(jié)果呈現(xiàn)的全部工作,因此需要熟悉和掌握多種統(tǒng)計(jì)工具,各取所長(zhǎng)、整合使用。本書立足于大數(shù)據(jù)研究的現(xiàn)狀,基于實(shí)際醫(yī)療案例,介紹數(shù)學(xué)基礎(chǔ)知識(shí)和統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí),SAS、R語(yǔ)言、Stata和Python這4款大數(shù)據(jù)常用分析工具的基
大數(shù)據(jù)技術(shù)凝集了多學(xué)科的研究成果,是一門多學(xué)科的交叉融合技術(shù)。隨著科學(xué)技術(shù)的發(fā)展,大數(shù)據(jù)技術(shù)發(fā)展更為迅速,應(yīng)用更為深入與廣泛,并凸顯其巨大潛力和應(yīng)用價(jià)值。“數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)導(dǎo)論”是數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)的第一門專業(yè)基礎(chǔ)課程。這門課程可以引導(dǎo)數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)的學(xué)生走進(jìn)大數(shù)據(jù)技術(shù)的大門。本書主要介紹數(shù)據(jù)科學(xué)與