本教材為新商科一流本科專業(yè)群建設(shè)“十四五”規(guī)劃教材之一,“商業(yè)大數(shù)據(jù)分析”為上海商學(xué)院本科專業(yè)核心平臺課程。全書共分11個章節(jié),圍繞開源、圖形化商業(yè)大數(shù)據(jù)分析工具為主要內(nèi)容,從大數(shù)據(jù)概述、分析工具、數(shù)據(jù)操作、機(jī)器學(xué)習(xí)基礎(chǔ)、客戶價值數(shù)據(jù)分析、零件推薦數(shù)據(jù)分析、信貸風(fēng)險數(shù)據(jù)分析、社交媒體數(shù)據(jù)分析、網(wǎng)頁瀏覽數(shù)據(jù)分析、交通出行數(shù)據(jù)分析、支付安全的數(shù)據(jù)分析等幾個方面全面講解商業(yè)大數(shù)據(jù)分析方方面面。具體目錄如下:第1章 大數(shù)據(jù)分析概述1.1數(shù)據(jù)和大數(shù)據(jù)1.2數(shù)據(jù)類型與數(shù)據(jù)格式 1.3大數(shù)據(jù)分析第2章 大數(shù)據(jù)分析工具2.1 KNIME簡介2.2 KNIME數(shù)據(jù)工作流2.3 KNIME自定義分析環(huán)境2.4 數(shù)據(jù)節(jié)點(diǎn)操作2.5 KNIME數(shù)據(jù)結(jié)構(gòu)和類型第3章 基于KNIME的數(shù)據(jù)操作3.1 讀取數(shù)據(jù)3.2 過濾數(shù)據(jù)3.3 保存數(shù)據(jù)集3.4 數(shù)據(jù)清洗第4章 機(jī)器學(xué)習(xí)基礎(chǔ)4.1 機(jī)器學(xué)習(xí)概述4.2 機(jī)器學(xué)習(xí)基本方法4.3 模型的評估與選擇4.4 數(shù)值數(shù)據(jù)的分析——房產(chǎn)價格預(yù)測4.5 文本數(shù)據(jù)的分析——關(guān)鍵詞提取4.6 圖像數(shù)據(jù)的分析——圖像識別第5章 客戶價值的數(shù)據(jù)分析5.1 客戶價值概述5.2 客戶價值數(shù)據(jù)預(yù)處理5.3 客戶價值分析的算法5.4客戶價值數(shù)據(jù)分析的實(shí)踐第6章 零售推薦的數(shù)據(jù)分析6.1 推薦系統(tǒng)概述6.2零售數(shù)據(jù)的預(yù)處理(購物)6.3 零售推薦分析的算法6.4 零售推薦數(shù)據(jù)分析的實(shí)踐第7章 信貸風(fēng)險的數(shù)據(jù)分析7.1 信貸風(fēng)險概述7.2信貸風(fēng)險數(shù)據(jù)的預(yù)處理7.3 信貸風(fēng)險分析的算法7.4 信貸風(fēng)險數(shù)據(jù)分析的實(shí)踐第8章 社交媒體的數(shù)據(jù)分析8.1 社交媒體分析概述8.2社交媒體數(shù)據(jù)的預(yù)處理8.3 社交媒體數(shù)據(jù)分析的算法8.4 社交媒體數(shù)據(jù)分析的實(shí)踐第9章 網(wǎng)頁瀏覽的數(shù)據(jù)分析9.1 網(wǎng)頁瀏覽概述9.2網(wǎng)頁瀏覽數(shù)據(jù)的預(yù)處理9.3網(wǎng)頁點(diǎn)擊數(shù)據(jù)分析的實(shí)踐第10章 交通出行的數(shù)據(jù)分析10.1 交通出行分析概述10.2交通出行數(shù)據(jù)的預(yù)處理10.3 交通出行數(shù)據(jù)分析的算法10.4 交通出行數(shù)據(jù)分析的實(shí)踐第11章 支付安全的數(shù)據(jù)分析11.1 支付安全概述11.2支付安全數(shù)據(jù)的預(yù)處理11.3 支付安全數(shù)據(jù)分析的算法11.4 支付安全數(shù)據(jù)分析的實(shí)踐
《商業(yè)大數(shù)據(jù)分析》為上海商學(xué)院核心平臺課,已配套慕課上線智慧樹在線課程平臺,并申報*精品課程。本書與在線課程互為輔助,配套視頻教學(xué),全方面解讀商業(yè)大數(shù)據(jù)的方方面面。教材由淺入深,已開源圖形化商業(yè)大數(shù)據(jù)分析工具為主要內(nèi)容,適合文科類學(xué)生學(xué)習(xí)使用,同時數(shù)據(jù)分析也適合理工類學(xué)生使用,且理論案例比較前沿,屬于國內(nèi)領(lǐng)先水平。教材配套資源豐富,包括教材相關(guān)軟件安裝包、數(shù)據(jù)模型、課件、試題庫、案例庫、MOOC視頻等資源,為教學(xué)提供全面支持。
大數(shù)據(jù)時代的到來對商業(yè)應(yīng)用型人才提出了新的要求,需要掌握大數(shù)據(jù)和人工智能主要技術(shù)和模型,結(jié)合大數(shù)據(jù)分析技能和商業(yè)領(lǐng)域知識,發(fā)現(xiàn)和解決商業(yè)問題的復(fù)合型人才。在此背景下,本書收錄了三個國家一流商科和上海一個一流商科類本科專業(yè)開設(shè)的“大數(shù)據(jù)概論”“商業(yè)大數(shù)據(jù)分析”通識必修課的教學(xué)實(shí)踐,在酒店管理、電子商務(wù)、工商管理、金融學(xué)等專業(yè)中建成了面向?qū)W習(xí)過程、由淺入深的商業(yè)大數(shù)據(jù)分析課程。
本書從掌握大數(shù)據(jù)分析系統(tǒng)知識,培養(yǎng)大數(shù)據(jù)獲取,加工、分析和展現(xiàn)能力出發(fā)﹐按照大數(shù)據(jù)分析的流程,全書分為七章:
第一章“大數(shù)據(jù)分析概述”,介紹大數(shù)據(jù)分析的生態(tài)全貌,介紹大數(shù)據(jù)分析當(dāng)前的總體狀況。
第二章“大數(shù)據(jù)基礎(chǔ)設(shè)施”,介紹大數(shù)據(jù)計算所需要的軟硬件基礎(chǔ)設(shè)施。第三章“大數(shù)據(jù)采集”,介紹大數(shù)據(jù)的來源和獲取方式,特別是網(wǎng)絡(luò)爬蟲技術(shù)。第四章“數(shù)據(jù)預(yù)處理”,介紹對原始數(shù)據(jù)的預(yù)處理方式,提高數(shù)據(jù)資源質(zhì)量。
第五章“數(shù)據(jù)存儲與管理”,介紹數(shù)據(jù)庫系統(tǒng)的相關(guān)知識和技能﹐是大數(shù)據(jù)存儲的核心部件。
第六章“大數(shù)據(jù)分析”,介紹機(jī)器學(xué)習(xí)的歷史發(fā)展,主要的12種機(jī)器學(xué)習(xí)算法,以及機(jī)器學(xué)習(xí)在商業(yè)分析中的應(yīng)用。
第七章“大數(shù)據(jù)可視化”,介紹大數(shù)據(jù)產(chǎn)品的展現(xiàn)方式。
根據(jù)章節(jié)的知識點(diǎn),以上各章都設(shè)計了相關(guān)的大數(shù)據(jù)分析進(jìn)階實(shí)驗(yàn)﹐讓讀者不僅掌握知識,更能運(yùn)用相關(guān)的商業(yè)大數(shù)據(jù)分析技能,做到學(xué)以致用;同時能加深讀者對商業(yè)大數(shù)據(jù)知識的理解,極大地提高讀者對商業(yè)大數(shù)據(jù)分析學(xué)習(xí)和使用的興趣。
在目前眾多的商業(yè)大數(shù)據(jù)分析工具中,我們選取了國際著名開放、開源的圖形化商業(yè)大數(shù)據(jù)分析工具KNIME4.1作為商業(yè)大數(shù)據(jù)分析的實(shí)踐工具。因?yàn)镵NIME完全兼容Python 3計算機(jī)編程語言,所以可以讓有一定程序設(shè)計基礎(chǔ)的讀者將Python程序直接在KNIME中運(yùn)行,進(jìn)行大數(shù)據(jù)分析。
本書作為大數(shù)據(jù)時代新型立體化教材,涵蓋了商業(yè)大數(shù)據(jù)分析知識和技能體系,其配套的教學(xué)視頻以及教學(xué)大綱、知識題庫,課程文檔等教學(xué)資源已在公開網(wǎng)站(https : / /coursehome.zhihuishu.com/ courseHome/1000008230/45672/15# teachTeam)上發(fā)布。即便是零基礎(chǔ)的讀者也可以通過本書及其配套教學(xué)資源快速地掌握商業(yè)大數(shù)據(jù)初步分析技能。本書所載的教學(xué)資源在僅僅一學(xué)年內(nèi)已有超過42所不同類型的全國高校、10000余人進(jìn)行了線上學(xué)習(xí),教學(xué)效果好,滿意度達(dá)到92.9%,推薦率更是高達(dá)93.4 %。
本書不僅適合酒店管理、電子商務(wù)、工商管理、金融學(xué),市場營銷、商務(wù)經(jīng)濟(jì)學(xué)等商科類專業(yè)的本科生或研究生作為教材使用,也適合大數(shù)據(jù)分析領(lǐng)域的初學(xué)者、從業(yè)者及科技人員作為參考。
本書的出版受益于2019年上海市高校大學(xué)計算機(jī)課程教學(xué)改革項(xiàng)目----《商業(yè)大數(shù)據(jù)分析課程群改革與實(shí)踐》。感謝姜紅,蔣傳進(jìn)等各級院系領(lǐng)導(dǎo)的學(xué)術(shù)指導(dǎo),同事許洪云、李周平和張玲玲等的支持和幫助,也要感謝我的學(xué)生蔡致禮,林哲顯、楊宇林,楊雪晴、陳夏童和王喆等提供的整理和協(xié)助,更要感謝我家人默默的奉獻(xiàn)﹐同時也很感謝華中科技大學(xué)出版社王乾編輯對本書出版提供的寶貴意見。
葉龍,現(xiàn)任上海商學(xué)院信息與計算機(jī)學(xué)院計算機(jī)系專職教師、系主任,主要研究方向?yàn)槿斯ぶ悄芗皯?yīng)用,是RedHat、Oracle認(rèn)證高級工程師。主要從事計算機(jī)系的教學(xué)、科研和日常管理工作。主講課程有《程序設(shè)計基礎(chǔ)》、《計算機(jī)組成原理》、《互聯(lián)網(wǎng)金融》及全英語課程《物聯(lián)網(wǎng)與電子標(biāo)簽》。歷年來完成校級以上重點(diǎn)課程建設(shè)項(xiàng)目3項(xiàng),教改項(xiàng)目4項(xiàng),多次指導(dǎo)學(xué)生獲得市級以上計算機(jī)類競賽獎項(xiàng)。歷年來主持、參與校級以上科研項(xiàng)目3項(xiàng),發(fā)表論文16篇,其中EI 源刊2篇、中文核心1篇,創(chuàng)新型專利2項(xiàng);參編教材3本。
第一章大數(shù)據(jù)分析概述
第一節(jié)數(shù)據(jù)與大數(shù)據(jù)/1
第二節(jié)大數(shù)據(jù)分析/7
第三節(jié)大數(shù)據(jù)分析應(yīng)用/12
第四節(jié)大數(shù)據(jù)崗位需求/15
第二章大數(shù)據(jù)基礎(chǔ)設(shè)施
第一節(jié)大數(shù)據(jù)計算部件/25
第二節(jié)云計算/28
第三節(jié)其他云技術(shù)/33
第四節(jié)大數(shù)據(jù)軟件/34
第五節(jié)大數(shù)據(jù)計算模式/39
第三章大數(shù)據(jù)采集
第一節(jié)大數(shù)據(jù)采集/50
第二節(jié)大數(shù)據(jù)來源/55
第三節(jié)網(wǎng)絡(luò)爬蟲/58
第四章數(shù)據(jù)預(yù)處理
第一節(jié)數(shù)據(jù)預(yù)處理概述/75
第二節(jié)數(shù)據(jù)質(zhì)量/77
第二節(jié)數(shù)據(jù)探索/80
第四節(jié)數(shù)據(jù)清洗/85
第五節(jié)數(shù)據(jù)集成/88
第六節(jié)數(shù)據(jù)規(guī)約/89
第七節(jié)數(shù)據(jù)變換/90
第五章數(shù)據(jù)存儲與管理
第一節(jié)―數(shù)據(jù)管理/107
第二節(jié)數(shù)據(jù)庫概述/109
第三節(jié)關(guān)系數(shù)據(jù)庫系統(tǒng)/111
第四節(jié)大數(shù)據(jù)存儲與管理/114
第六章大數(shù)據(jù)分析
第一節(jié)大數(shù)據(jù)分析概述/132
第二節(jié)機(jī)器學(xué)習(xí)/135
第三節(jié)特征工程與數(shù)據(jù)分割/154
第四節(jié)機(jī)器學(xué)習(xí)建模算法/158
第五節(jié)模型的訓(xùn)練與性能評估/167
第七章大數(shù)據(jù)可視化
第一節(jié)數(shù)據(jù)可視化/181
第二節(jié)視覺感知/189
第三節(jié)統(tǒng)計圖/193
第四節(jié)視覺可視化案例/201
參考文獻(xiàn)