本書主要從自然語言處理的角度全面地介紹情感分析這個主題先進的研究技術和實用算法,以幫助讀者了解通常用于表達觀點和情感的問題和語言結構的基本結構。它涵蓋了情感分析的所有核心領域,包括許多新興的主題,如辯論分析、意圖挖掘、假民意檢測,并提出了可用來分析和總結觀點的計算方法。
目 錄
Sentiment Analysis:Mining Opinions,Sentiments,and Emotions
譯者序
前言
致謝
第1章 引言1
1.1 情感分析應用3
1.2 情感分析研究6
1.2.1 針對不同文本顆粒度的情感分析研究7
1.2.2 情感詞典及其問題8
1.2.3 辯論與評論分析9
1.2.4 意圖挖掘9
1.2.5 垃圾觀點檢測與評論質(zhì)量10
1.3 情感分析是個迷你自然語言處理任務11
1.4 本書撰寫方式11
第2章 什么是情感分析13
2.1 觀點定義14
2.1.1 觀點的定義14
2.1.2 情感對象15
2.1.3 觀點中的情感16
2.1.4 簡化的觀點定義17
2.1.5 觀點的理由和限定條件19
2.1.6 情感分析的目標和任務20
2.2 觀點摘要定義23
2.3 感情、情緒與心情24
2.3.1 心理學中的感情、情緒與心情25
2.3.2 情感分析中的感情、情緒與心情28
2.4 觀點的不同類型30
2.4.1 常規(guī)型觀點和比較型觀點31
2.4.2 主觀的和隱含在事實中的觀點31
2.4.3 第一人稱和非第一人稱觀點34
2.4.4 元觀點35
2.5 作者和讀者視角35
2.6 小結36
第3章 文檔級情感分類37
3.1 基于監(jiān)督的情感分類38
3.1.1 基于機器學習算法的情感分類38
3.1.2 使用自定義打分函數(shù)的情感分類44
3.2 基于無監(jiān)督的情感分類45
3.2.1 使用句法模板和網(wǎng)頁檢索的情感分類45
3.2.2 使用情感詞典的情感分類46
3.3 情感評分預測48
3.4 跨領域情感分類49
3.5 跨語言情感分類51
3.6 文檔的情緒分類52
3.7 小結53
第4章 句子級主客觀和情感分類54
4.1 主觀性55
4.2 句子級主客觀分類56
4.3 句子級情感分類59
4.3.1 句子級情感分類的前提假設59
4.3.2 分類方法60
4.4 處理條件句61
4.5 處理諷刺句62
4.6 跨語言主客觀分類和情感分類64
4.7 在情感分類中使用語篇信息65
4.8 句子級情緒分類66
4.9 討論67
第5章 屬性級情感分類68
5.1 屬性級情感分類方法69
5.1.1 基于監(jiān)督學習的方法69
5.1.2 基于詞典的方法70
5.1.3 兩種方法的優(yōu)缺點72
5.2 情感組合規(guī)則73
5.2.1 情感組合規(guī)則概述74
5.2.2 情感減弱和情感增強表達81
5.2.3 SMALL_OR_LESS和LARGE_OR_MORE表達83
5.2.4 情緒和情感強度86
5.2.5 情感詞的含義86
5.2.6 其他方法概述88
5.3 否定和情感89
5.3.1 否定詞89
5.3.2 never92
5.3.3 其他常用的情感轉(zhuǎn)換詞94
5.3.4 否定詞移動現(xiàn)象94
5.3.5 否定范圍95
5.4 情態(tài)和情感96
5.5 并列連詞but100
5.6 非觀點內(nèi)容的情感詞102
5.7 規(guī)則表示103
5.8 詞義消歧和指代消解105
5.9 小結106
第6章 屬性和實體抽取108
6.1 基于頻率的屬性抽取109
6.2 利用句法關系110
6.2.1 利用觀點和觀點評價對象間的評價關系111
6.2.2 利用部分整體和屬性關系116
6.3 基于監(jiān)督學習的屬性抽取118
6.3.1 隱馬爾可夫模型118
6.3.2 條件隨機場119
6.4 隱含屬性的映射121
6.4.1 基于語料庫的方法121
6.4.2 基于詞典的方法122
6.5 屬性聚類124
6.6 基于主題模型的屬性抽取126
6.6.1 隱狄利克雷分配127
6.6.2 基于無監(jiān)督主題模型進行觀點屬性抽取129
6.6.3 在主題模型中加入領域先驗知識133
6.6.4 基于終身學習的主題模型:像人類一樣學習135
6.6.5 使用短語作為主題詞138
6.7 實體抽取與消解141
6.7.1 實體抽取與消解的問題定義142
6.7.2 實體抽取144
6.7.3 實體鏈接145
6.7.4 實體搜索和鏈接147
6.8 觀點持有者和觀點時間抽取147
6.9 小結148
第7章 情感詞典構建149
7.1 基于詞典的方法149
7.2 基于語料庫的方法152
7.2.1 從語料庫中識別情感詞152
7.2.2 處理上下文相關的情感詞153
7.2.3 詞典自適應155
7.2.4 其他相關工作156
7.3 隱含了情感信息(期望或者不期望)的事實型描述156
7.4 小結158
第8章 比較型觀點分析159
8.1 問題定義159
8.2 比較句識別162
8.3 比較句中的優(yōu)選實體集識別163
8.4 特殊類型的比較句164
8.4.1 非標準型比較164
8.4.2 交叉類型的比較166
8.4.3 單實體比較167
8.4.4 帶有compare和comparison的句子168
8.5 實體與屬性抽取169
8.6 小結170
第9章 觀點摘要和檢索172
9.1 基于屬性的觀點摘要172
9.2 基于屬性的觀點摘要進階175
9.3 可對照的觀點摘要176
9.4 傳統(tǒng)摘要177
9.5 比較型觀點摘要177
9.6 觀點檢索177
9.7 現(xiàn)有觀點檢索技術178
9.8 小結180
第10章 辯論與評論分析181
10.1 辯論中的立場識別181
10.2 對辯論、討論進行建模184
10.2.1 JTE模型185
10.2.2 JTE-R模型:對回復關系進行建模188
10.2.3 JTE-P模型:考慮作者之間的交互關