前 言
Lifelong Machine Learning,Second Edition
編寫第2版的目的是擴(kuò)展終身學(xué)習(xí)的定義,更新部分章節(jié)的內(nèi)容,并添加一個(gè)新的章節(jié)來(lái)介紹深度神經(jīng)網(wǎng)絡(luò)中的持續(xù)學(xué)習(xí)(continual learning in deep neural networks),這部分內(nèi)容在過(guò)去的兩三年里一直被積極研究。另外,還重新組織了部分章節(jié),使得內(nèi)容更有條理。
編寫本書的工作始于我們?cè)?015年第24屆國(guó)際人工智能聯(lián)合會(huì)議(IJCAI)上關(guān)于終身機(jī)器學(xué)習(xí)(lifelong machine learning)的教程。當(dāng)時(shí),我們已經(jīng)對(duì)終身機(jī)器學(xué)習(xí)這個(gè)主題做了一段時(shí)間的研究,并在ICML、KDD和ACL上發(fā)表了幾篇文章。當(dāng)Morgan & Claypool出版社聯(lián)系我們要出版關(guān)于該主題的圖書時(shí),我們很興奮。我們堅(jiān)信終身機(jī)器學(xué)習(xí)(或簡(jiǎn)稱終身學(xué)習(xí))對(duì)未來(lái)的機(jī)器學(xué)習(xí)和人工智能(AI)至關(guān)重要。值得注意的是,終身學(xué)習(xí)有時(shí)在文獻(xiàn)中也被稱為持續(xù)學(xué)習(xí)(continual
learning)或連續(xù)學(xué)習(xí)(continuous learning)。我們對(duì)該主題的最初研究興趣源于幾年前在一個(gè)初創(chuàng)公司所做的關(guān)于情感分析(SA)的工作中所積累的廣泛應(yīng)用經(jīng)驗(yàn)。(典型的SA項(xiàng)目始于客戶在社交媒體中對(duì)他們自己或競(jìng)爭(zhēng)對(duì)手的產(chǎn)品或服務(wù)發(fā)表的消費(fèi)者意見(jiàn)。)SA系統(tǒng)包含兩個(gè)主要的分析任務(wù):(1)發(fā)現(xiàn)人們?cè)谠u(píng)論文檔(如在線評(píng)論)中談到的實(shí)體(例如,iPhone)和實(shí)體屬性/特征(例如,電池壽命);(2)確定關(guān)于每個(gè)實(shí)體或?qū)嶓w屬性的評(píng)論是正面的、負(fù)面的或中立的[Liu,2012,2015]。例如,從iPhone真的很酷,但它的電池壽命很糟糕這句話中,SA系統(tǒng)應(yīng)該發(fā)現(xiàn):(1)作者對(duì)iPhone的評(píng)論是正面的;(2)作者對(duì)iPhone的電池續(xù)航時(shí)間的評(píng)論是負(fù)面的。
在參與許多領(lǐng)域(產(chǎn)品或服務(wù)的類型)的許多項(xiàng)目之后,我們意識(shí)到跨領(lǐng)域和跨項(xiàng)目之間存在著大量可共享的信息。隨著我們經(jīng)歷的項(xiàng)目越來(lái)越多,遇到的新事物卻越來(lái)越少。很容易看出,情感詞和短語(yǔ)(如好的、壞的、差的、糟糕的和昂貴的)是跨領(lǐng)域共享的,大量的實(shí)體和屬性也是共享的。例如,每個(gè)產(chǎn)品都有價(jià)格屬性,大量電子產(chǎn)品有電池,大多數(shù)還有屏幕。如果不使用這些可共享的信息來(lái)大幅度提高SA的準(zhǔn)確度,而是單獨(dú)處理每個(gè)項(xiàng)目及其數(shù)據(jù),是比較愚蠢的做法。經(jīng)典的機(jī)器學(xué)習(xí)范式完全孤立地學(xué)習(xí)。在這種范式下,給定一個(gè)數(shù)據(jù)集,學(xué)習(xí)算法在這個(gè)數(shù)據(jù)集上運(yùn)行并生成模型,算法沒(méi)有記憶,因此無(wú)法使用先前學(xué)習(xí)的知識(shí)。為了利用知識(shí)共享,SA系統(tǒng)必須保留和積累過(guò)去學(xué)到的知識(shí),并將其用于未來(lái)的學(xué)習(xí)和問(wèn)題的解決,這正是終身學(xué)習(xí)(lifelong
learning)的目標(biāo)。
不難想象,這種跨領(lǐng)域和跨任務(wù)的信息或知識(shí)共享在每個(gè)領(lǐng)域都是正確的。在自然語(yǔ)言處理中尤為明顯,因?yàn)閱卧~和短語(yǔ)的含義在不同領(lǐng)域和任務(wù)之間基本相同,句子語(yǔ)法也是如此。無(wú)論我們談?wù)撌裁粗黝},都使用相同的語(yǔ)言,盡管每個(gè)主題可能只使用一種語(yǔ)言中的一小部分單詞和短語(yǔ)。如果情況并非如此,那么人類也不會(huì)形成自然語(yǔ)言。因此,終身學(xué)習(xí)可以廣泛應(yīng)用,而不僅僅局限于情感分析。
本書的目的是提出這種新興的機(jī)器學(xué)習(xí)范式,并對(duì)該領(lǐng)域的重要研究成果和新想法進(jìn)行全面的回顧。我們還想為該研究領(lǐng)域提出一個(gè)統(tǒng)一的框架。目前,機(jī)器學(xué)習(xí)中有幾個(gè)與終身學(xué)習(xí)密切相關(guān)的研究課題,特別值得注意的是多任務(wù)學(xué)習(xí)和遷移學(xué)習(xí),因?yàn)樗鼈円膊捎昧酥R(shí)共享和知識(shí)遷移的思想。本書將集中介紹這些主題,并討論它們之間的相同和差異。我們將終身學(xué)習(xí)視為這些相關(guān)范式的擴(kuò)展。通過(guò)本書,我們還想激勵(lì)研究人員開(kāi)展終身學(xué)習(xí)的研究。我們相信終身學(xué)習(xí)代表了未來(lái)幾年機(jī)器學(xué)習(xí)和人工智能的主要研究方向。如果不能保留和積累過(guò)去學(xué)到的知識(shí),對(duì)知識(shí)進(jìn)行推理,并利用已學(xué)到的知識(shí)幫助未來(lái)的學(xué)習(xí)和解決問(wèn)題,那么實(shí)現(xiàn)通用人工智能(Artificial General Intelligence, AGI)是不可能的。
編寫本書遵循了兩個(gè)主要指導(dǎo)原則。首先,它應(yīng)該包含開(kāi)展終身學(xué)習(xí)研究的強(qiáng)大動(dòng)機(jī),以便鼓勵(lì)研究生和研究人員致力于研究終身學(xué)習(xí)的問(wèn)題。其次,它的內(nèi)容對(duì)于具有機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘基礎(chǔ)知識(shí)的從業(yè)者和高年級(jí)本科生應(yīng)該是易于理解的。但是,對(duì)于計(jì)劃攻讀機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘領(lǐng)域博士學(xué)位的研究生來(lái)說(shuō),應(yīng)該學(xué)習(xí)更加詳盡的資料。
因此,本書適用于對(duì)機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘、自然語(yǔ)言處理或模式識(shí)別感興趣的學(xué)生、研究人員和從業(yè)人員。
陳志源和劉兵
2018年8月
譯者序
前 言
致 謝
第1章 引言1
1.1 傳統(tǒng)機(jī)器學(xué)習(xí)范式1
1.2 案例3
1.3 終身學(xué)習(xí)簡(jiǎn)史7
1.4 終身學(xué)習(xí)的定義9
1.5 知識(shí)類型和關(guān)鍵挑戰(zhàn)14
1.6 評(píng)估方法和大數(shù)據(jù)的角色17
1.7 本書大綱18
第2章 相關(guān)學(xué)習(xí)范式20
2.1 遷移學(xué)習(xí)20
2.1.1 結(jié)構(gòu)對(duì)應(yīng)學(xué)習(xí)21
2.1.2 樸素貝葉斯遷移分類器22
2.1.3 遷移學(xué)習(xí)中的深度學(xué)習(xí)23
2.1.4 遷移學(xué)習(xí)與終身學(xué)習(xí)的區(qū)別24
2.2 多任務(wù)學(xué)習(xí)25
2.2.1 多任務(wù)學(xué)習(xí)中的任務(wù)相關(guān)性25
2.2.2 GO-MTL:使用潛在基礎(chǔ)任務(wù)的多任務(wù)學(xué)習(xí)26
2.2.3 多任務(wù)學(xué)習(xí)中的深度學(xué)習(xí)28
2.2.4 多任務(wù)學(xué)習(xí)與終身學(xué)習(xí)的區(qū)別30
2.3 在線學(xué)習(xí)30
2.4 強(qiáng)化學(xué)習(xí)31
2.5 元學(xué)習(xí)32
2.6 小結(jié)34
第3章 終身監(jiān)督學(xué)習(xí)35
3.1 定義和概述36
3.2 基于記憶的終身學(xué)習(xí)37
3.2.1 兩個(gè)基于記憶的學(xué)習(xí)方法37
3.2.2 終身學(xué)習(xí)的新表達(dá)37
3.3 終身神經(jīng)網(wǎng)絡(luò)39
3.3.1 MTL網(wǎng)絡(luò)39
3.3.2 終身EBNN40
3.4 ELLA:高效終身學(xué)習(xí)算法41
3.4.1 問(wèn)題設(shè)定41
3.4.2 目標(biāo)函數(shù)42
3.4.3 解決第一個(gè)低效問(wèn)題43
3.4.4 解決第二個(gè)低效問(wèn)題45
3.4.5 主動(dòng)的任務(wù)選擇46
3.5 終身樸素貝葉斯分類47
3.5.1 樸素貝葉斯文本分類47
3.5.2 LSC的基本思想49
3.5.3 LSC技術(shù)50
3.5.4 討論52
3.6 基于元學(xué)習(xí)的領(lǐng)域詞嵌入52
3.7 小結(jié)和評(píng)估數(shù)據(jù)集54
第4章 持續(xù)學(xué)習(xí)與災(zāi)難性遺忘56
4.1 災(zāi)難性遺忘56
4.2 神經(jīng)網(wǎng)絡(luò)中的持續(xù)學(xué)習(xí)58
4.3 無(wú)遺忘學(xué)習(xí)61
4.4 漸進(jìn)式神經(jīng)網(wǎng)絡(luò)62
4.5 彈性權(quán)重合并63
4.6 iCaRL:增量分類器與表示學(xué)習(xí)65
4.6.1 增量訓(xùn)練66
4.6.2 更新特征表示67
4.6.3 為新類構(gòu)建范例集68
4.6.4 在iCaRL中完成分類68
4.7 專家網(wǎng)關(guān)69
4.7.1 自動(dòng)編碼網(wǎng)關(guān)69
4.7.2 測(cè)量訓(xùn)練的任務(wù)相關(guān)性70
4.7.3 為測(cè)試選擇最相關(guān)的專家71
4.7.4 基于編碼器的終身學(xué)習(xí)71
4.8 生成式重放的持續(xù)學(xué)習(xí)72
4.8.1 生成式對(duì)抗網(wǎng)絡(luò)72
4.8.2 生成式重放73
4.9 評(píng)估災(zāi)難性遺忘74
4.10 小結(jié)和評(píng)估數(shù)據(jù)集75
第5章 開(kāi)放式學(xué)習(xí)79
5.1 問(wèn)題定義和應(yīng)用80
5.2 基于中心的相似空間學(xué)習(xí)81
5.2.1 逐步更新CBS學(xué)習(xí)模型82
5.2.2 測(cè)試CBS學(xué)習(xí)模型84
5.2.3 用于未知類檢測(cè)的CBS學(xué)習(xí)84
5.3 DOC:深度開(kāi)放式分類87
5.3.1 前饋層和一對(duì)其余層87
5.3.2 降低開(kāi)放空間風(fēng)險(xiǎn)89
5.3.3 DOC用于圖像分類90
5.3.4 發(fā)現(xiàn)未知類90
5.4 小結(jié)和評(píng)估數(shù)據(jù)集91
第6章 終身主題建模93
6.1 終身主題建模的主要思想93
6.2 LTM:終身主題模型97
6.2.1 LTM模型97
6.2.2 主題知識(shí)挖掘99
6.2.3 融合過(guò)去的知識(shí)100
6.2.4 Gibbs采樣器的條件分布102
6.3 AMC:少量數(shù)據(jù)的終身主題模型102
6.3.1 AMC整體算法103
6.3.2 挖掘must-link知識(shí)104
6.3.3 挖掘cannot-link知識(shí)107
6.3.4 擴(kuò)展的Pólya甕模型108
6.3.5 Gibbs采樣器的采樣分布110
6.4 小結(jié)和評(píng)估數(shù)據(jù)集112
第7章 終身信息提取114
7.1 NELL:永不停止語(yǔ)言學(xué)習(xí)器114
7.1.1 NELL結(jié)構(gòu)117
7.1.2 NELL中的提取器與學(xué)習(xí)118
7.1.3 NELL中的耦合約束120
7.2 終身評(píng)價(jià)目標(biāo)提取121
7.2.1 基于推薦的終身學(xué)習(xí)122
7.2.2 AER算法123
7.2.3 知識(shí)學(xué)習(xí)124
7.2.4 使用過(guò)去知識(shí)推薦125
7.3 在工作中學(xué)習(xí)126
7.3.1 條件隨機(jī)場(chǎng)127
7.3.2 一般依賴特征128
7.3.3 L-CRF算法130
7.4 Lifelong-RL:終身松弛標(biāo)記法131
7.4.1 松弛標(biāo)記法132
7.4.2 終身松弛標(biāo)記法133
7.5 小結(jié)和評(píng)估數(shù)據(jù)集133
第8章 聊天機(jī)器人的持續(xù)知識(shí)學(xué)習(xí)135
8.1 LiLi:終身交互學(xué)習(xí)與推理136
8.2 LiLi的基本思想139
8.3 LiLi的組件141
8.4 運(yùn)行示例142
8.5 小結(jié)和評(píng)估數(shù)據(jù)集142
第9章 終身強(qiáng)化學(xué)習(xí)144
9.1 基于多環(huán)境的終身強(qiáng)化學(xué)習(xí)146
9.2 層次貝葉斯終身強(qiáng)化學(xué)習(xí)147
9.2.1 動(dòng)機(jī)147
9.2.2 層次貝葉斯方法148
9.2.3 MTRL算法149
9.2.4 更新層次模型參數(shù)150
9.2.5 對(duì)MDP進(jìn)行采樣151
9.3 PG-ELLA:終身策略梯度強(qiáng)化學(xué)習(xí)152
9.3.1 策略梯度強(qiáng)化學(xué)習(xí)152
9.3.2 策略梯度終身學(xué)習(xí)設(shè)置154
9.3.3 目標(biāo)函數(shù)和優(yōu)化154
9.3.4 終身學(xué)習(xí)的安全策略搜索156
9.3.5 跨領(lǐng)域終身強(qiáng)化學(xué)習(xí)156
9.4 小結(jié)和評(píng)估數(shù)據(jù)集157
第10章 結(jié)論及未來(lái)方向159
參考文獻(xiàn)164