本書從數(shù)學(xué)優(yōu)化的角度對目前人工智能的代表技術(shù)機(jī)器學(xué)習(xí)進(jìn)行分析,解決了目前這一領(lǐng)域偏向應(yīng)用,數(shù)學(xué)理論較弱的問題,從原理、數(shù)學(xué)解析兩個方面對特征提取、分類、聚類、神經(jīng)網(wǎng)絡(luò)等進(jìn)行了全面系統(tǒng)的剖析。解決了目前人工智能領(lǐng)域偏向應(yīng)用,數(shù)學(xué)理論較弱的問題,從原理解析、數(shù)學(xué)解析兩個方面對機(jī)器學(xué)習(xí)進(jìn)行剖析。
本書嘗試從計算流和信息流相結(jié)合的角度,從自組織網(wǎng)絡(luò)的角度,對計算科學(xué)與信息科學(xué)結(jié)合的原理、方法和意義進(jìn)行闡述,從而形成一套融合數(shù)學(xué)思維和信息思維的理論體系。
人類對世界的認(rèn)識是理論來源于實踐又服務(wù)于實踐的過程。作為對人類認(rèn)知行為的近似,機(jī)器學(xué)習(xí)、深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)的過程也是認(rèn)知來源于世界又服務(wù)于世界的過程。當(dāng)離開人類的參與,這一行為完全由計算機(jī)自主實現(xiàn)時,這一過程表現(xiàn)為建立在機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)(為表達(dá)方便,除非特別指出,采用機(jī)器學(xué)習(xí)代表三種學(xué)習(xí)形式,下同)基礎(chǔ)之上的自組織過程。
交換是經(jīng)濟(jì)社會中一種常見的基本的經(jīng)濟(jì)形式,F(xiàn)代交換經(jīng)濟(jì)中,物理世界的產(chǎn)品流通過與信息流結(jié)合,將現(xiàn)實世界映射到數(shù)字的世界。機(jī)器學(xué)習(xí)又將這個數(shù)字的世界映射到有限維或無限維的空間中,局部的或整體的空間中,呈現(xiàn)出結(jié)構(gòu)與結(jié)構(gòu)之間的關(guān)系。
人類最重要的兩個智能行為是學(xué)習(xí)和解決問題的能力。機(jī)器學(xué)習(xí)是讓計算機(jī)模擬和實現(xiàn)人類的學(xué)習(xí),以獲取解決問題的知識。專家系統(tǒng)是基于經(jīng)驗的學(xué)習(xí),也是機(jī)器學(xué)習(xí)的初級方式。專家系統(tǒng)利用專家的知識來解決實際問題,解決問題的能力達(dá)到了專家水平。但是專家系統(tǒng)在發(fā)展過程中遇到了不少的困難。一方面,從專家那里獲取知識是一項既費(fèi)時又費(fèi)力的困難工作。專家能在實際中有效地解決問題,但要專家整理出自己的知識和經(jīng)驗,他往往無從下手。這為知識獲取帶來了困難,形成了知識獲取的瓶頸現(xiàn)象。另一方面,基于經(jīng)驗的學(xué)習(xí)雖然在解決問題上具有一定功效,但是卻難以反映問題以及解決方法的本質(zhì)特征。機(jī)器學(xué)習(xí)是基于數(shù)據(jù)或樣本的學(xué)習(xí),為解決知識獲取的問題提供了有效的途徑。它使得計算機(jī)可以從大量實例中自動歸納,產(chǎn)生描述和抽象這些實例的一般規(guī)則知識,從而在反復(fù)學(xué)習(xí)中不斷逼近問題以及解決方案的本質(zhì)。
機(jī)器學(xué)習(xí)被列為人工智能的核心技術(shù),它以知識處理為主體,利用知識進(jìn)行推理,完成人類定性分析的部分智能行為。人工智能技術(shù)融入決策支持系統(tǒng)后,使決策支持系統(tǒng)在模型技術(shù)和數(shù)據(jù)處理技術(shù)的基礎(chǔ)上,增加了知識推理技術(shù),使決策支持系統(tǒng)的定量分析和AI的定性分析結(jié)合起來,從而提高輔助決策和支持決策的能力。
林強(qiáng),北京信息科技大學(xué)教師,副研究員。在人工智能領(lǐng)域有著多年的實踐和教學(xué)經(jīng)驗,以第一作者身份發(fā)表科研論文15篇,其中SCI1篇,EI9篇,ISTP2篇;以第一發(fā)明人身份申請國內(nèi)外專利15項;其中13項已獲得授權(quán),包括中國專利7項,美國專利4項,歐洲專利2項。
第一章
數(shù)據(jù)、數(shù)學(xué)與機(jī)器學(xué)習(xí)001
1.1 概述 / 003
1.2 數(shù)學(xué)與機(jī)器學(xué)習(xí) / 005
1.3 數(shù)據(jù)與機(jī)器學(xué)習(xí) / 008
1.4 深度學(xué)習(xí)與強(qiáng)化學(xué)習(xí) / 014
1.5 本章小結(jié) / 019
第二章
分類與回歸021
2.1 常用的分類方法 / 024
2.2 分類的數(shù)學(xué)解釋 / 032
2.3 回歸分析 / 038
2.4 回歸分析的數(shù)學(xué)解釋 / 041
2.5 本章小結(jié) / 046
第三章
特征選取047
3.1 數(shù)據(jù)預(yù)處理的步驟 / 050
3.2 數(shù)據(jù)預(yù)處理與特征提取 / 057
3.3 主成分分析 / 059
3.4 因子分析 / 063
3.5 特征提取問題的數(shù)學(xué)解析 / 067
3.6 本章小結(jié) / 072
第四章
聚 類075
4.1 基本概念 / 078
4.2 聚類的過程 / 082
4.3 分析方法 / 083
4.4 基于K-means算法的聚類規(guī)則 / 088
4.5 聚類問題的數(shù)學(xué)解釋 / 091
4.6 本章小結(jié) / 094
第五章
深度學(xué)習(xí)097
5.1 概述 / 099
5.2 神經(jīng)網(wǎng)絡(luò)模型 / 101
5.3 神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)方法 / 103
5.4 神經(jīng)網(wǎng)絡(luò)的數(shù)學(xué)解釋 / 106
5.5 本章小結(jié) / 111
第六章
強(qiáng)化學(xué)習(xí)113
6.1 樸素貝葉斯 / 115
6.2 貝葉斯信念網(wǎng) / 118
6.3 動態(tài)貝葉斯網(wǎng)絡(luò) / 120
6.4 一般時序模型 / 121
6.5 馬爾可夫模型 / 131
6.6 本章小結(jié) / 138
第七章
計算流與自組織141
7.1 信息流與計算流的結(jié)合 / 143
7.2 學(xué)習(xí)中的自組織行為 / 144
7.3 神經(jīng)動力學(xué)與自組織 / 153
參考文獻(xiàn)157卷