企業(yè)級數(shù)據(jù)架構(gòu):核心要素、架構(gòu)模型、數(shù)據(jù)管理與平臺搭建 李楊
定 價:99 元
- 作者:李楊
- 出版時間:2024/3/1
- ISBN:9787111746829
- 出 版 社:機械工業(yè)出版社
- 中圖法分類:TP274
- 頁碼:
- 紙張:膠版紙
- 版次:
- 開本:16開
這是一部從企業(yè)架構(gòu)視角系統(tǒng)講解企業(yè)級數(shù)據(jù)架構(gòu)的著作,包含數(shù)據(jù)架構(gòu)的原理、方法和實踐。本書擬分為四個部分共17個章節(jié)來系統(tǒng)性的闡述數(shù)據(jù)架構(gòu)相關(guān)內(nèi)容;第1部分 架構(gòu)基礎(chǔ)主要包含1個章節(jié)1.數(shù)據(jù)架構(gòu)與企業(yè)架構(gòu) 其主要從宏觀的角度闡述企業(yè)架構(gòu)與數(shù)據(jù)架構(gòu)的關(guān)系以及重要性使讀者明白數(shù)據(jù)架構(gòu)并不是孤立存在的且與企業(yè)架構(gòu)息息相關(guān)第2部分 數(shù)據(jù)架構(gòu)基礎(chǔ)主要包含5個章節(jié)從理論以及工具層面闡述數(shù)據(jù)架構(gòu)的構(gòu)成2.數(shù)據(jù)架構(gòu)構(gòu)成 介紹數(shù)據(jù)架構(gòu)的主要組成以及框架3.數(shù)據(jù)存儲 數(shù)據(jù)架構(gòu)落地中常見的存儲選型以及實用場景4.數(shù)據(jù)調(diào)度與消息傳輸 數(shù)據(jù)架構(gòu)中調(diào)度服務(wù)以及消息傳輸?shù)耐ㄓ眉夹g(shù)選型以及可能出現(xiàn)的關(guān)鍵問題以及優(yōu)化手段5.Lambda架構(gòu)與Kappa架構(gòu) 系統(tǒng)性的闡述主流的兩種數(shù)據(jù)架構(gòu)以及使用場景6.輔助類組件 數(shù)據(jù)架構(gòu)中幫助測試以及運維人員精準(zhǔn)的定位問題的相關(guān)輔助組件,例如日志收集、系統(tǒng)監(jiān)控以及APM等第3部分 數(shù)據(jù)架構(gòu)實踐 基于大量的業(yè)務(wù)實踐,總結(jié)數(shù)據(jù)架構(gòu)實踐中核心組組成以及關(guān)鍵方法進(jìn)行拆解7.企業(yè)數(shù)據(jù)區(qū)域以及流向 以不同的維度去拆解企業(yè)的數(shù)據(jù),幫助讀者構(gòu)建數(shù)據(jù)架構(gòu)的落地層面的意識,知道為什么拆以及如何去拆 8.模型架構(gòu)詳解 以主流的兩種建模方法論為切入點,討論并對比優(yōu)劣并讓讀者拓展模型設(shè)計中的工具箱。9.模型設(shè)計 以維度建模為例,詳細(xì)的介紹不同數(shù)據(jù)層級、不同類型數(shù)據(jù)的建模方法,具體案例來源于大量的模型實踐10.元數(shù)據(jù) 了解什么是元數(shù)據(jù)及其重要性以及如何管理數(shù)據(jù)11.數(shù)據(jù)質(zhì)量 基于數(shù)據(jù)質(zhì)量去設(shè)計數(shù)據(jù)質(zhì)量監(jiān)控體系,做好事前防范、事后治理12.數(shù)據(jù)標(biāo)準(zhǔn) 構(gòu)建數(shù)據(jù)標(biāo)準(zhǔn)框架以及流程,挖掘具體數(shù)據(jù)標(biāo)準(zhǔn)落地在企業(yè)中的難度。第4部分 數(shù)據(jù)資產(chǎn)管理13.企業(yè)數(shù)據(jù)資產(chǎn) 企業(yè)數(shù)據(jù)資產(chǎn)的構(gòu)成以及搭建路徑以及工具等14.數(shù)據(jù)治理 結(jié)合元數(shù)據(jù)、數(shù)據(jù)質(zhì)量以及數(shù)據(jù)標(biāo)準(zhǔn)等,系統(tǒng)的闡述數(shù)據(jù)治理類型項目的落地15.大數(shù)據(jù)平臺實踐 如何一步一步搭建基于Hadoop大數(shù)據(jù)平臺16.實時數(shù)據(jù)倉庫搭建 如何構(gòu)建企業(yè)級別的實施數(shù)據(jù)倉庫17.本書總結(jié) 總結(jié)寫書的感悟以及后續(xù)的一些想法等
(1)作者經(jīng)驗豐富:頭部保險資管公司深數(shù)據(jù)架構(gòu)師,從事數(shù)據(jù)相關(guān)工作10余年,在數(shù)據(jù)架構(gòu)、數(shù)據(jù)治理、數(shù)據(jù)資產(chǎn)管理等領(lǐng)域積累了豐富的經(jīng)驗。(2)理論系統(tǒng)全面:系統(tǒng)梳理和闡述了企業(yè)架構(gòu)的基礎(chǔ)知識,以及數(shù)據(jù)架構(gòu)的組成要素、架構(gòu)模型、數(shù)據(jù)治理和數(shù)據(jù)資產(chǎn)管理的理論知識。(3)實戰(zhàn)案例豐富:用大量案例輔助理論講解,同時用離線計算和實時計算兩大場景的綜合案例進(jìn)行了詳細(xì)展示。(4)資深專家推薦:平安集團(tuán)首席架構(gòu)師與平安資管總經(jīng)理等多位專家聯(lián)袂推薦。
為何寫作本書
2017年英國《經(jīng)濟(jì)學(xué)人》雜志提出一個觀點:世界上最具價值的資源不再是石油,而是數(shù)據(jù)。有關(guān)數(shù)據(jù)的各種概念,如數(shù)據(jù)要素、數(shù)字經(jīng)濟(jì)、數(shù)字化轉(zhuǎn)型以及數(shù)據(jù)資產(chǎn)定價等不斷提出,對數(shù)據(jù)理論層面的探索從未停止過。各行各業(yè)乃至整個社會都對數(shù)據(jù)愈發(fā)重視,政府也提出建設(shè)“數(shù)字中國”的概念。上述種種無疑對數(shù)據(jù)從業(yè)者提出了更高的要求。
筆者工作這十幾年來始終在一線從事開發(fā)工作,接觸過很多企業(yè)內(nèi)部的需求。筆者清楚地感受到,企業(yè)在不同時期,對于數(shù)據(jù)平臺的定位或者期待發(fā)生了很大的變化,同時企業(yè)高層對于數(shù)據(jù)的重視程度也在持續(xù)提高。同時,企業(yè)內(nèi)部關(guān)于數(shù)據(jù)平臺建設(shè)的思路或者對于從業(yè)者技能的要求也發(fā)生了巨大的變化。
筆者花了很長時間去思考一些問題,例如:數(shù)據(jù)平臺在這些年的發(fā)展過程中,有哪些內(nèi)容是始終不變的,哪些內(nèi)容變得更加重要;從業(yè)者需要掌握哪些技能才能更好地適應(yīng)新時代的發(fā)展;谶@些思考,筆者寫了這本書,從數(shù)據(jù)架構(gòu)的角度闡述不同時期企業(yè)數(shù)據(jù)平臺的建設(shè),期望給從業(yè)者提供一些參考。
本書主要特點
這是一本偏落地實踐的書。筆者會基于自己在一線工作的經(jīng)驗,在書中詳細(xì)介紹數(shù)據(jù)架構(gòu)涉及的技術(shù)棧、技術(shù)組件以及數(shù)據(jù)架構(gòu)落地中可能遇到的問題,并提供對應(yīng)的解決方案。
這也是一本包含必要理論的書。數(shù)據(jù)架構(gòu)涉及大量的概念,不同的概念在不同的階段可能會有不同的內(nèi)涵。所以本書會針對這些概念以及不同概念之間的因果關(guān)系、邏輯關(guān)系等進(jìn)行詳細(xì)的介紹。通過這些介紹,相信讀者可以更加深入地了解數(shù)據(jù)架構(gòu)。
本書會將書介紹的組件與書中提到的理論相結(jié)合,并一步步地帶領(lǐng)讀者搭建自己的迷你版數(shù)據(jù)平臺,以加深讀者對于數(shù)據(jù)架構(gòu)的理解。
本書讀者對象
本書是一本企業(yè)數(shù)據(jù)架構(gòu)相關(guān)的書,比較全面地介紹了企業(yè)數(shù)據(jù)架構(gòu)在企業(yè)架構(gòu)中的位置以及數(shù)據(jù)架構(gòu)的構(gòu)成等。從內(nèi)容來看,本書比較適合以下讀者閱讀:
對數(shù)據(jù)感興趣的相關(guān)行業(yè)從業(yè)者。
想了解企業(yè)數(shù)字化轉(zhuǎn)型內(nèi)涵的相關(guān)人員。
期望從事數(shù)據(jù)相關(guān)工作的初學(xué)者。
想提升自身能力的數(shù)據(jù)相關(guān)從業(yè)者。
想拓展自己的技術(shù)領(lǐng)域的應(yīng)用開發(fā)人員。
正在或者將要進(jìn)行數(shù)據(jù)治理或者數(shù)據(jù)資產(chǎn)建設(shè)的相關(guān)人員。
在建設(shè)企業(yè)數(shù)據(jù)平臺時遇到困難的一線人員。
如何閱讀本書
本書共17章,分為五部分。
第一部分為架構(gòu)基礎(chǔ)(第1章),將會總覽性地介紹企業(yè)架構(gòu)及數(shù)據(jù)架構(gòu)的內(nèi)容。
第1章主要介紹企業(yè)架構(gòu)的組成,例如業(yè)務(wù)架構(gòu)、數(shù)據(jù)架構(gòu)及應(yīng)用架構(gòu)等,從不同角度解析兩個主要企業(yè)架構(gòu)—Zachman框架及TOGAF,并對比不同組織或者機構(gòu)對于數(shù)據(jù)架構(gòu)的理解。
第二部分為數(shù)據(jù)架構(gòu)基礎(chǔ)(第2~6章),從不同方面闡述數(shù)據(jù)架構(gòu)的組成。
第2章主要介紹數(shù)據(jù)架構(gòu)的構(gòu)成,例如數(shù)據(jù)模型、元數(shù)據(jù)、數(shù)據(jù)質(zhì)量、數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)治理、數(shù)據(jù)資產(chǎn)、數(shù)據(jù)生命周期、數(shù)據(jù)分布、常見數(shù)據(jù)架構(gòu)技術(shù)選型、數(shù)據(jù)調(diào)度等。如果想知道數(shù)據(jù)架構(gòu)的核心組成,建議仔細(xì)閱讀這一章。
第3章主要介紹數(shù)據(jù)架構(gòu)中數(shù)據(jù)存儲的發(fā)展以及不同類型數(shù)據(jù)存儲的特點,然后分別從集中式數(shù)據(jù)庫、分布式數(shù)據(jù)庫、大數(shù)據(jù)存儲、特定領(lǐng)域存儲、實時計算階段等方面進(jìn)行詳細(xì)闡述。如果對于不同類型的數(shù)據(jù)存儲都非常了解的話,這一章可以選擇性閱讀。
第4章主要介紹數(shù)據(jù)存儲中數(shù)據(jù)調(diào)度與消息傳輸?shù)南嚓P(guān)內(nèi)容,對比了不同類型的商業(yè)ETL軟件的區(qū)別,之后分別介紹了開源調(diào)度平臺(Airflow)、ETL工具(DataX)、消息中間件(Kafka)的架構(gòu)及核心概念等。讀者可以根據(jù)自己對這些內(nèi)容的了解程度有選擇地閱讀這一章。
第5章主要介紹數(shù)據(jù)架構(gòu)的演進(jìn),引出Lambda架構(gòu)和Kappa架構(gòu),并詳細(xì)介紹這兩種架構(gòu)的組成及區(qū)別,最后簡單介紹流批一體化的優(yōu)劣勢。
第6章主要介紹數(shù)據(jù)架構(gòu)落地中可能涉及的各種輔助類應(yīng)用,例如資源管理、資源及組件監(jiān)控、應(yīng)用監(jiān)控以及日志監(jiān)控等。如果企業(yè)內(nèi)部已經(jīng)有比較成熟的解決方案,這一章可以作為拓展閱讀內(nèi)容。
第三部分為數(shù)據(jù)架構(gòu)模型實踐(第7~9章),詳細(xì)介紹了數(shù)據(jù)架構(gòu)涉及的數(shù)據(jù)模型的部分。
第7章主要介紹企業(yè)內(nèi)部數(shù)據(jù)區(qū)的劃分以及企業(yè)內(nèi)部數(shù)據(jù)的流向等內(nèi)容,包括大多數(shù)企業(yè)內(nèi)部數(shù)據(jù)區(qū)層級的劃分以及每一層級的作用,并介紹互聯(lián)網(wǎng)公司的集成型數(shù)據(jù)區(qū)分層特點等。
第8章主要介紹數(shù)據(jù)模型架構(gòu)的內(nèi)容,包括建模策略、建模步驟、建模方法論以及常見模型概述等。對于數(shù)據(jù)建模比較感興趣的讀者可以仔細(xì)閱讀這一章內(nèi)容。
第9章主要介紹維度建模的內(nèi)容,包括維度建模概述、維度建?偩結(jié)構(gòu)、維度詳解、緩慢變化維度、事實表詳解、事務(wù)型事實表等。對于維度建模的各種概念不是很理解的讀者可以仔細(xì)閱讀這一章內(nèi)容。
第四部分為數(shù)據(jù)資產(chǎn)管理(第10~14章),第10~12章介紹數(shù)據(jù)架構(gòu)的核心內(nèi)容,第
13章及第14章介紹企業(yè)如何開展數(shù)據(jù)治理以及數(shù)據(jù)資產(chǎn)相關(guān)工作。
第10章主要介紹元數(shù)據(jù)管理,包括元數(shù)據(jù)的產(chǎn)生、分類及價值等,同時介紹元數(shù)據(jù)的應(yīng)用及生命周期等,最后闡述如何構(gòu)建元數(shù)據(jù)管理體系。
第11章主要介紹數(shù)據(jù)質(zhì)量管理,主要內(nèi)容包括數(shù)據(jù)質(zhì)量的管理框架、核心維度及規(guī)則體系等,同時介紹企業(yè)如何進(jìn)行數(shù)據(jù)質(zhì)量評估。
第12章主要介紹數(shù)據(jù)標(biāo)準(zhǔn)管理,詳細(xì)闡述了數(shù)據(jù)標(biāo)準(zhǔn)的內(nèi)涵、體系設(shè)計框架、管理流程以及面臨的挑戰(zhàn),最后系統(tǒng)闡述數(shù)據(jù)標(biāo)準(zhǔn)與數(shù)據(jù)質(zhì)量的關(guān)系。如果想系統(tǒng)了解不同概念之間的關(guān)系,需要花點時間閱讀這一章內(nèi)容。
第13章主要介紹數(shù)據(jù)治理的相關(guān)內(nèi)容,就數(shù)據(jù)治理的產(chǎn)生原因、內(nèi)涵、核心準(zhǔn)則、通用流程等內(nèi)容進(jìn)行闡述,最后列舉數(shù)據(jù)治理面臨的挑戰(zhàn)以及相應(yīng)的應(yīng)對方式。推薦將要或者正在進(jìn)行數(shù)據(jù)治理的讀者仔細(xì)閱讀這一章內(nèi)容。
第14章主要介紹數(shù)據(jù)資產(chǎn)管理相關(guān)的內(nèi)容,包括數(shù)據(jù)資產(chǎn)的現(xiàn)狀以及當(dāng)前企業(yè)可以進(jìn)行的數(shù)據(jù)資產(chǎn)管理內(nèi)容,梳理數(shù)據(jù)資產(chǎn)與其他概念之間的關(guān)系,同時詳細(xì)介紹如何展開數(shù)據(jù)資產(chǎn)目錄構(gòu)建工作。
第五部分為數(shù)據(jù)架構(gòu)實踐(第15~17章),從實踐的角度對前面的內(nèi)容進(jìn)行了介紹。
第15章主要介紹離線計算的相關(guān)實踐,并以某個具體的場景為例展開介紹,包括架構(gòu)設(shè)計、軟件部署、模型設(shè)計、數(shù)據(jù)處理及離線計算數(shù)據(jù)應(yīng)用等。
第16章主要介紹實時計算的相關(guān)實踐,同樣以某個具體的場景為例展開深入介紹,包括架構(gòu)設(shè)計、軟件部署、連通性配置、實時計算層等。
第17章主要結(jié)合筆者自身的理解以及在行業(yè)內(nèi)的多年觀察對數(shù)字未來進(jìn)行展望,希望可以給讀者帶來一些啟發(fā)。
由于水平有限,書中可能存在一些描述不準(zhǔn)確或者錯誤的地方,懇請讀者多多包涵。同時期待本書可以對讀者的工作提供一些幫助。
李楊
資深數(shù)據(jù)架構(gòu)師,在數(shù)據(jù)相關(guān)領(lǐng)域有10年以上工作經(jīng)驗。頭部保險資管公司科技平臺交易系統(tǒng)團(tuán)隊開發(fā)組負(fù)責(zé)人,負(fù)責(zé)多個應(yīng)用以及數(shù)據(jù)平臺的建設(shè)、優(yōu)化以及遷移工作。曾擔(dān)任某數(shù)據(jù)公司技術(shù)合伙人,負(fù)責(zé)多個金融機構(gòu)的數(shù)據(jù)倉庫或數(shù)據(jù)平臺相關(guān)的工作。
在數(shù)據(jù)質(zhì)量管理、數(shù)據(jù)治理等領(lǐng)域有著非常深厚的積累,熟悉不同行業(yè)的數(shù)字化轉(zhuǎn)型。此外,他還是一名經(jīng)驗豐富的應(yīng)用工程師,對大數(shù)據(jù)、數(shù)據(jù)庫以及主流的技術(shù)棧有著非常深入的了解。
2022年被集團(tuán)評為“優(yōu)秀架構(gòu)師”,積極參與行業(yè)內(nèi)部的相關(guān)課題研究,是《保險問道
之保險資管數(shù)字化探索》一書的執(zhí)筆人之一,是中資協(xié)《金融科技賦能保險資管風(fēng)險管控的研究》課題核心組成員之一。
序
自序
前言
第一部分 架構(gòu)基礎(chǔ)
第1章 企業(yè)架構(gòu)概述3
1.1 企業(yè)架構(gòu)4
1.2 Zachman框架4
1.2.1 Zachman框架的維度4
1.2.2 Zachman框架的特點5
1.2.3 Zachman框架的使用6
1.3 TOGAF6
1.3.1 TOGAF完善架構(gòu)過程7
1.3.2 框架核心:ADM8
1.4 業(yè)務(wù)架構(gòu)9
1.4.1 業(yè)務(wù)架構(gòu)的價值9
1.4.2 業(yè)務(wù)架構(gòu)的關(guān)鍵點10
1.5 數(shù)據(jù)架構(gòu)11
1.5.1 數(shù)據(jù)架構(gòu)設(shè)計12
1.5.2 數(shù)據(jù)架構(gòu)核心組成12
1.6 總結(jié)13
第二部分 數(shù)據(jù)架構(gòu)基礎(chǔ)
第2章 數(shù)據(jù)架構(gòu)構(gòu)成18
2.1 數(shù)據(jù)模型18
2.2 元數(shù)據(jù)19
2.3 數(shù)據(jù)質(zhì)量20
2.4 數(shù)據(jù)標(biāo)準(zhǔn)21
2.5 數(shù)據(jù)治理21
2.6 數(shù)據(jù)資產(chǎn)22
2.6.1 數(shù)據(jù)管理22
2.6.2 數(shù)據(jù)倉庫22
2.6.3 數(shù)據(jù)湖23
2.6.4 數(shù)據(jù)資產(chǎn)內(nèi)涵23
2.7 數(shù)據(jù)生命周期24
2.7.1 數(shù)據(jù)創(chuàng)建25
2.7.2 數(shù)據(jù)使用25
2.7.3 數(shù)據(jù)歸檔26
2.7.4 數(shù)據(jù)銷毀26
2.8 數(shù)據(jù)分布27
2.8.1 數(shù)據(jù)存儲27
2.8.2 數(shù)據(jù)訪問27
2.9 常見數(shù)據(jù)架構(gòu)技術(shù)選型28
2.9.1 Lambda28
2.9.2 Kappa29
2.10 數(shù)據(jù)調(diào)度30
2.11 總結(jié)30
第3章 數(shù)據(jù)存儲31
3.1 數(shù)據(jù)存儲基礎(chǔ)32
3.1.1 計算機組成基礎(chǔ)結(jié)構(gòu)32
3.1.2 數(shù)據(jù)存儲核心概念35
3.1.3 OLTP與OLAP場景37
3.2 集中式數(shù)據(jù)庫38
3.2.1 常見關(guān)系型數(shù)據(jù)庫38
3.2.2 分庫分表39
3.3 分布式數(shù)據(jù)庫40
3.3.1 大規(guī)模并行處理技術(shù)40
3.3.2 分布式事務(wù)41
3.4 大數(shù)據(jù)存儲43
3.4.1 HDFS43
3.4.2 Yarn44
3.4.3 Hive44
3.4.4 HBase45
3.4.5 Spark及Spark Streaming46
3.5 特定領(lǐng)域存儲46
3.5.1 ClickHouse46
3.5.2 Elasticsearch48
3.6 實時計算階段49
3.7 總結(jié)49
第4章 數(shù)據(jù)調(diào)度與消息傳輸50
4.1 通用技術(shù)選型50
4.2 Airflow調(diào)度平臺52
4.2.1 Airflow基礎(chǔ)概念52
4.2.2 Airflow架構(gòu)54
4.2.3 Airflow與其他調(diào)度平臺對比55
4.3 DataX數(shù)據(jù)同步工具56
4.3.1 DataX基礎(chǔ)概念56
4.3.2 DataX數(shù)據(jù)同步57
4.3.3 DataX優(yōu)化59
4.3.4 DataX與其他數(shù)據(jù)同步工具對比60
4.4 Kafka消息中間件62
4.4.1 Kafka基礎(chǔ)概念62
4.4.2 Kafka架構(gòu)概述63
4.4.3 Kafka高性能原理63
4.4.4 Kafka與其他中間件對比67
4.5 總結(jié)68
第5章 Lambda架構(gòu)與Kappa架構(gòu)69
5.1 架構(gòu)演進(jìn)69
5.1.1 傳統(tǒng)數(shù)據(jù)倉庫架構(gòu)70
5.1.2 傳統(tǒng)大數(shù)據(jù)架構(gòu)71
5.1.3 流式計算架構(gòu)72
5.1.4 Lambda架構(gòu)73
5.1.5 Kappa架構(gòu)74
5.2 Lambda架構(gòu)詳解75
5.2.1 架構(gòu)解析76
5.2.2 核心組件78
5.2.3 數(shù)據(jù)流向81
5.3 Kappa架構(gòu)詳解82
5.3.1 架構(gòu)解析82
5.3.2 核心組件85
5.3.3 數(shù)據(jù)流向87
5.4 Lambda與Kappa對比 87
5.5 流批一體化89
5.6 總結(jié)90
第6章 輔助類應(yīng)用體系介紹91
6.1 資源管理91
6.1.1 開源堡壘機JumpServer92
6.1.2 部署與負(fù)載均衡92
6.1.3 核心概念94
6.1.4 最佳實踐95
6.2 資源及組件監(jiān)控95
6.2.1 開源監(jiān)控系統(tǒng)Prometheus 96
6.2.2 可視化系統(tǒng)Grafana98
6.2.3 告警模塊AlertManager100
6.2.4 小結(jié)101
6.3 應(yīng)用監(jiān)控102
6.3.1 應(yīng)用鏈路監(jiān)控Pinpoint102
6.3.2 原理與組件介紹103
6.3.3 最佳實踐104
6.3.4 小結(jié)106
6.4 日志監(jiān)控107
6.4.1 ELK107
6.4.2 直連式日志收集架構(gòu)107
6.4.3 高并發(fā)日志收集架構(gòu)108
6.5 總結(jié)109
第三部分 數(shù)據(jù)架構(gòu)模型實踐
第7章 企業(yè)數(shù)據(jù)區(qū)與數(shù)據(jù)流向113
7.1 數(shù)據(jù)區(qū)概述113
7.2 數(shù)據(jù)區(qū)詳解115
7.2.1 操作型數(shù)據(jù)區(qū)115
7.2.2 集成型數(shù)據(jù)區(qū)116
7.2.3 分析型數(shù)據(jù)區(qū)117
7.2.4 歷史數(shù)據(jù)區(qū)118
7.3 企業(yè)數(shù)據(jù)流向119
7.3.1 操作型數(shù)據(jù)區(qū)數(shù)據(jù)流向119
7.3.2 集成型數(shù)據(jù)區(qū)數(shù)據(jù)流向120
7.3.3 分析型數(shù)據(jù)區(qū)數(shù)據(jù)流向121
7.3.4 歷史數(shù)據(jù)區(qū)數(shù)據(jù)流向122
7.4 企業(yè)數(shù)據(jù)分層123
7.5 企業(yè)集成型數(shù)據(jù)區(qū)層級124
7.5.1 數(shù)據(jù)緩沖層 125
7.5.2 數(shù)據(jù)貼源層126
7.5.3 標(biāo)準(zhǔn)模型層127
7.5.4 整合模型層127
7.5.5 數(shù)據(jù)集市層128
7.6 互聯(lián)網(wǎng)公司的集成型數(shù)據(jù)區(qū)分層特點129
7.7 總結(jié)130
第8章 數(shù)據(jù)模型架構(gòu)詳解131
8.1 為什么要建模132
8.2 建模策略134
8.2.1 數(shù)據(jù)緩沖層建模策略135
8.2.2 數(shù)據(jù)貼源層建模策略135
8.2.3 標(biāo)準(zhǔn)模型層建模策略136