第1章走近知識圖譜1
1.1基本概念1
1.1.1源自搜索引擎1
1.1.2知識圖譜的定義2
1.1.3知識表示3
1.1.4操作和存儲5
1.2構建流程7
1.2.1數據獲取8
1.2.2信息抽取9
1.2.3知識融合11
1.2.4知識加工13
1.3知識圖譜應用15
1.3.1知識圖譜分類15
1.3.2通用知識圖譜應用16
1.3.3領域知識圖譜應用18
1.3.4面臨的技術挑戰(zhàn)22
1.4本書實戰(zhàn)知識點23
第2章企業(yè)信息知識圖譜25
2.1項目設計25
2.1.1需求分析25
2.1.2工作流程25
2.1.3技術選型26
2.1.4開發(fā)準備27
2.2數據準備和預處理28
2.2.1數據獲取28
2.2.2數據的預處理30
2.3知識建模和存儲31
2.3.1企業(yè)主要屬性31
2.3.2企業(yè)數據源形成31
2.3.3知識圖譜主體構建35
2.3.4企業(yè)信息三元組形成36
2.3.5數據存儲 37
2.4圖譜可視化和知識應用38
2.4.1查詢企業(yè)全貌39
2.4.2企業(yè)關系維度分析41
2.4.3司法維度分析41
2.5小結和擴展42
〖1〗〖2〗實戰(zhàn)知識圖譜〖1〗目錄第3章醫(yī)藥疾病知識圖譜44
3.1項目設計44
3.1.1需求分析44
3.1.2工作流程44
3.1.3技術選型45
3.1.4開發(fā)準備47
3.2數據準備和預處理47
3.2.1數據描述47
3.2.2數據獲取48
3.2.3數據預處理50
3.3知識建模和存儲51
3.3.1實體抽取51
3.3.2三元組的抽取53
3.3.3數據存儲55
3.4圖譜可視化和知識應用56
3.4.1數據查詢57
3.4.2膳食維度分析58
3.4.3用藥維度分析60
3.5小結和擴展60
第4章銀行審計知識圖譜61
4.1項目設計61
4.1.1需求分析61
4.1.2工作流程61
4.1.3技術選型62
4.1.4開發(fā)準備62
4.2數據準備和預處理63
4.2.1數據獲取63
4.2.2數據預處理66
4.3知識建模和存儲67
4.3.1構建賬戶數據模型 67
4.3.2抽取三元組并存儲68
4.4圖譜可視化和知識應用70
4.4.1客戶的所有賬戶70
4.4.2賬戶的全部交易記錄71
4.4.3某時間段內賬戶的交易記錄71
4.4.4賬戶相關的全部對方賬戶73
4.4.5客戶的異常交易行為73
4.4.6下一步改進工作74
4.5小結和擴展77
第5章人物關系智能問答78
5.1項目設計78
5.1.1需求分析78
5.1.2工作流程79
5.1.3技術選型79
5.1.4開發(fā)準備81
5.2數據準備和預處理82
5.2.1數據準備82
5.2.2數據預處理82
5.3知識建模和存儲83
5.3.1知識建模及描述83
5.3.2數據存儲84
5.4圖譜可視化和知識應用88
5.4.1問題模板定義89
5.4.2樸素貝葉斯問題分類90
5.4.3意圖識別與槽位填充91
5.4.4問答展示93
5.5小結和擴展96
第6章基于知識庫的實體鏈接系統(tǒng)98
6.1項目設計98
6.1.1需求分析98
6.1.2工作流程98
6.1.3技術選型99
6.1.4開發(fā)準備100
6.2數據準備和預處理101
6.2.1數據獲取101
6.2.2數據預處理101
6.2.3自定義詞典104
6.3知識建模和存儲104
6.3.1候選實體生成104
6.3.2候選實體消歧108
6.4知識應用111
6.4.1功能實現(xiàn)111
6.4.2應用場景112
6.5小結和擴展113
第7章交通出行科研文獻研究114
7.1項目設計114
7.1.1需求分析114
7.1.2工作流程114
7.1.3技術選型115
7.1.4開發(fā)準備116
7.2數據準備和預處理117
7.2.1文獻數據下載117
7.2.2文獻數據導入117
7.2.3數據轉換處理118
7.2.4CNKI引文數據獲取119
7.3圖譜可視化和知識應用121
7.3.1共現(xiàn)和聚類分析122
7.3.2突現(xiàn)分析126
7.3.3共被引分析127
7.3.4合作網絡分析128
7.4小結和擴展129
第8章微博輿情知識圖譜130
8.1項目設計130
8.1.1需求分析130
8.1.2工作流程130
8.1.3技術選型132
8.1.4開發(fā)準備133
8.2數據準備和預處理133
8.2.1采集話題帖子133
8.2.2解析關鍵數據134
8.2.3情感傾向分析142
8.3知識建模和存儲143
8.4圖譜可視化和知識應用146
8.4.1圖譜可視化146
8.4.2展示性分析147
8.5小結和擴展149
第9章基于法規(guī)知識圖譜的搜索系統(tǒng)150
9.1項目設計150
9.1.1需求分析150
9.1.2工作流程151
9.1.3技術選型152
9.1.4開發(fā)準備154
9.2數據準備和預處理155
9.2.1獲取法規(guī)列表155
9.2.2獲得法律內容詳情156
9.2.3法規(guī)實體抽取158
9.3知識建模和存儲160
9.3.1法規(guī)采集記錄160
9.3.2法規(guī)詳情信息161
9.3.3法規(guī)關系數據163
9.4圖譜可視化和知識應用165
9.4.1可視化實現(xiàn)過程165
9.4.2法規(guī)數據圖譜展示170
9.4.3法律法規(guī)Web搜索171
9.5小結和擴展173
第10章基于裁判文書的司法知識圖譜174
10.1項目設計174
10.1.1需求分析174
10.1.2工作流程175
10.1.3技術選型175
10.1.4開發(fā)準備177
10.2數據準備和預處理177
10.2.1數據獲取177
10.2.2獲取裁判文書數據178
10.2.3獲取關鍵字典數據179
10.2.4序列標注180
10.2.5特征提取182
10.3知識建模和存儲183
10.3.1基于BiLSTM CRF模型的命名實體識別183
10.3.2實體關系抽取186
10.4圖譜可視化和知識應用187
10.4.1繪制知識圖譜187
10.4.2知識圖譜展示188
10.4.3知識圖譜應用188
10.5小結和擴展189
第11章政府信箱知識服務190
11.1項目設計190
11.1.1需求分析190
11.1.2工作流程191
11.1.3技術選型192
11.1.4開發(fā)準備193
11.2數據準備和預處理194
11.2.1源網站分析195
11.2.2URL信息獲取195
11.2.3信息預處理196
11.2.4關系數據庫表存儲197
11.3知識建模和存儲198
11.3.1知識表示和建模198
11.3.2知識抽取199
11.3.3圖數據庫存儲203
11.4圖譜可視化和知識應用204
11.4.1民生關注點詞云204
11.4.2政府信箱智能問答206
11.5小結和擴展210
第12章新聞推薦系統(tǒng)211
12.1項目設計211
12.1.1需求分析211
12.1.2工作流程211
12.1.3技術選型212
12.1.4開發(fā)準備212
12.2知識圖譜構建213
12.2.1數據準備213
12.2.2數據處理213
12.2.3知識圖譜構建214
12.3推薦模型構建216
12.3.1數據集生成216
12.3.2模型訓練217
12.3.3模型訓練總結220
12.4可視化應用220
12.4.1框架搭建220
12.4.2用戶行為收集221
12.4.3實時新聞數據更新222
12.4.4個性化推薦224
12.5小結和擴展227