機器視覺入門與實戰(zhàn):人臉識別與人體識別
定 價:89 元
叢書名:智能系統(tǒng)與技術(shù)叢書
- 作者:夏東周波著
- 出版時間:2023/3/1
- ISBN:9787111721475
- 出 版 社:機械工業(yè)出版社
- 中圖法分類:TP302.7
- 頁碼:
- 紙張:膠版紙
- 版次:
- 開本:32開
這是一本系統(tǒng)講解人臉識別和人體姿態(tài)識別技術(shù)、算法和應(yīng)用的實戰(zhàn)性著作,是作者團隊多年研究成果和實踐經(jīng)驗的總結(jié)。既有業(yè)界成熟的技術(shù)和算法,又有行業(yè)的新熱點和新趨勢。
通過本書,讀者將能輕松掌握如下知識:
機器視覺的概念以及索引技術(shù),包括向量空間索引和度量空間索引;
人臉識別技術(shù),以及人臉檢測算法、人臉對齊算法、人臉特征提取算法;
面向人臉檢索的高維空間快速索引技術(shù);
人體姿態(tài)識別技術(shù)、目標檢測算法以及算法的性能評測;
面向嵌入式設(shè)備的人臉識別技術(shù)與算法,輕量級的人臉識別技術(shù)與算法,以及面向ARM設(shè)備的人臉精準識別方法VMFace;
人臉識別、人體姿態(tài)識別相關(guān)技術(shù)和算法在門禁、安防和運動訓練等場景的應(yīng)用。
(1)作者經(jīng)驗豐富:作者在機器視覺領(lǐng)域有豐富的實踐經(jīng)驗,獲得了大量專利,而且創(chuàng)辦了專門的機器視覺公司,將理論成果轉(zhuǎn)化為商業(yè)產(chǎn)品。
(2)零基礎(chǔ)快入門:本書面向沒有機器視覺基礎(chǔ)的讀者,指導他們快速掌握人臉識別、人體動作識別的技術(shù)、算法和應(yīng)用。
(3)結(jié)合行業(yè)熱點:除了成熟的人臉識別和人體動作識別的技術(shù)和算法外,本書還講解了行業(yè)里最新的、關(guān)注度極高的嵌入式設(shè)備、輕量級的人臉識別技術(shù)。
Preface
前 言
為什么要寫這本書
隨著人們在日常生活中對智能化、便捷化、自動化的需求日益提升,越來越多的人利用機器視覺技術(shù)對人臉、人體姿態(tài)進行自動化識別、判定。人臉識別技術(shù)可以用于快速確定用戶的身份,省去了很多人工處理的時間。人體姿態(tài)識別技術(shù)可以用于智能檢測人體骨架、姿態(tài)甚至動作,目前廣泛應(yīng)用于姿態(tài)判斷、動作糾正等
場景。
本書以人體自動化、智能化識別為切入點,講述機器視覺在應(yīng)用中的若干技術(shù),包括索引技術(shù)、人臉識別技術(shù)、人體姿態(tài)識別技術(shù),并結(jié)合實際應(yīng)用場景介紹這些技術(shù)的應(yīng)用案例。
人臉識別技術(shù)發(fā)展較早,是初級機器學習時代的產(chǎn)物,隨著深度學習技術(shù)的不斷深入,人臉識別技術(shù)迎來了發(fā)展機遇期,識別的精準度顯著提升。當前小型化、嵌入式人臉識別技術(shù)受到越來越多的關(guān)注。本書從小型化人臉識別技術(shù)出發(fā),由淺入深地闡述人臉識別技術(shù)。
人體姿態(tài)識別是近年來熱門的技術(shù),應(yīng)用較廣泛?v觀技術(shù)現(xiàn)狀,人體姿態(tài)識別的精準度還不夠高。本書所述技術(shù)為作者團隊在實際研發(fā)中的經(jīng)驗總結(jié),在應(yīng)用效果上優(yōu)于現(xiàn)有的大多數(shù)技術(shù)。
讀者對象
本書適合如下讀者閱讀。
機器視覺技術(shù)入門級讀者。
人臉識別技術(shù)研究和應(yīng)用的愛好者和開發(fā)者。
高維索引技術(shù)研究和應(yīng)用的愛好者和開發(fā)者。
人體姿態(tài)識別技術(shù)研究和應(yīng)用的愛好者和開發(fā)者。
開設(shè)相關(guān)課程的大專院校的師生。
本書特色
市面上介紹人臉識別技術(shù)的圖書較多,但沒有面向小型化設(shè)備的,并且大多數(shù)針對的是人臉識別技術(shù),介紹人體其他部位識別的有限。目前,人體識別技術(shù)的應(yīng)用場景日益增多,本書可以滿足一部分想了解人體識別技術(shù)的讀者的需求。
本書以作者所在技術(shù)團隊在實際工作中的研發(fā)為基礎(chǔ),不僅講述人體智能識別的原理,還結(jié)合團隊研發(fā)成果進行深度剖析,并且結(jié)合不同應(yīng)用場景進行人體智能識別的深入介紹。
如何閱讀本書
本書分為10章。
第1章主要介紹機器視覺的概念及其在人體識別中的相關(guān)應(yīng)用。
第2章主要介紹機器視覺中的索引技術(shù),包括概念與作用、向量空間索引技術(shù)和度量空間索引技術(shù)。
第3章主要介紹人臉識別技術(shù)、人臉檢測算法、人臉對齊算法、人臉特征提取算法的概念與分類。
第4章主要介紹人體姿態(tài)識別技術(shù),包括自上而下的人體姿態(tài)識別技術(shù)和自下而上的人體姿態(tài)識別技術(shù)。
第5章主要介紹度量空間索引、相似性檢索、高維空間快速索引方法及高維空間快速索引實驗。
第6章主要介紹嵌入式人臉識別裝置、輕量級人臉識別算法、嵌入式人臉識別應(yīng)用以及面向ARM的人臉精準識別方法VMFace。
第7章主要介紹兩階段目標檢測算法、一階段目標檢測算法和算法性能測評。
第8章通過門禁場景和安防場景介紹嵌入式人臉設(shè)備的應(yīng)用。
第9章主要介紹人體姿態(tài)識別技術(shù)的應(yīng)用,包括運動訓練場景、姿態(tài)糾正、安防、虛擬現(xiàn)實等。
第10章主要對機器視覺在人體識別領(lǐng)域中的關(guān)鍵問題和挑戰(zhàn)進行總結(jié),并展望未來發(fā)展。
勘誤和支持
由于作者的水平有限,書中難免會出現(xiàn)一些錯誤或者不準確的地方,懇請讀者批評指正。如果你有更多的寶貴意見,也歡迎發(fā)送郵件至郵箱vm-info@visionmiracle.cn。期待能夠得到你們的真摯反饋。
致謝
著名劇作家蕭伯納曾說:人生最大的快樂是致力于一個自己認為偉大的目標。我熱衷于人工智能技術(shù),并將學習和實踐作為自己的目標,進而從中獲得快樂。從我讀大學時首次接觸機器視覺技術(shù),到我將自己的認知及實踐記錄成書,十年間經(jīng)歷良多,姑且把本書看作自己這些年來在機器視覺領(lǐng)域的記錄和總結(jié)吧!
首先要感謝Geoffrey Hinton,他為我打開了深度學習的一道門。
感謝肖思思和譚志鵬對本書整理和校對工作的支持。
感謝我的愛人胡艷艷及“崽崽”夏予、夏添,你們是我在面對困難時昂首向前的動力。
感謝周波及視覺偉業(yè)的同事們,陪我一起推石頭上山般一點點地實踐人工智能。
感謝我的朋友們,你們總能給我提供建議、觀念以及建設(shè)性的意見。
謹以此書獻給眾多熱愛人工智能的朋友!
夏 東
夏 東
國防科技大學通信與信息系統(tǒng)博士、控制科學與工程博士后。長期從事人工智能和自動目標識別領(lǐng)域的研究工作,主持完成國家“863計劃”項目等多個重大項目的研究,發(fā)明專利60余項。在機器智能視覺、大數(shù)據(jù)等領(lǐng)域有豐富的實戰(zhàn)經(jīng)驗與深入的商業(yè)化理解。將機器智能視覺理論付諸實踐創(chuàng)立了湖南視覺偉業(yè)智能科技有限公司。作為湖南省科技創(chuàng)業(yè)領(lǐng)軍人才,帶領(lǐng)團隊研發(fā)了人臉識別、行為分析等多款款業(yè)內(nèi)領(lǐng)先AI軟硬件產(chǎn)品,并在多個省份和城市得到應(yīng)用。
周 波
長期從事計算機視覺、人工智能研究工作,發(fā)明專利40余項,獲得“安防工匠人物”稱號,創(chuàng)立深圳市海清視訊科技有限公司,獲得國家級專精特新“小巨人”企業(yè)稱號。
CONTENTS
目 錄
前言
第1章 機器視覺概述 1
1.1 機器視覺簡介 1
1.1.1 什么是機器視覺 2
1.1.2 機器視覺的技術(shù)分類 4
1.1.3 機器視覺技術(shù)的應(yīng)用與價值 14
1.2 機器視覺在人體識別中的相關(guān)應(yīng)用 19
1.2.1 人臉識別 19
1.2.2 人體姿態(tài)識別與估計 20
1.2.3 計算視覺小型化 22
1.2.4 意義與價值 23
1.3 本章小結(jié) 24
第2章 機器視覺中的索引技術(shù) 25
2.1 索引技術(shù)概述 25
2.1.1 索引的概念 26
2.1.2 索引的作用 27
2.2 向量空間索引技術(shù) 29
2.2.1 向量空間索引技術(shù)概述 29
2.2.2 分類介紹 30
2.2.3 向量空間索引的應(yīng)用 42
2.3 度量空間索引技術(shù) 43
2.3.1 度量空間索引技術(shù)概述 43
2.3.2 分類介紹 44
2.3.3 度量空間索引的應(yīng)用 49
2.4 本章小結(jié) 51
第3章 機器視覺中的人臉識別技術(shù) 52
3.1 人臉識別技術(shù) 52
3.1.1 概念與定義 52
3.1.2 人臉識別技術(shù)的分類 57
3.2 人臉檢測算法 57
3.2.1 概念與定義 58
3.2.2 Adaboost 59
3.2.3 Cascade CNN 59
3.2.4 DenseBox 62
3.2.5 Faceness-Net 65
3.2.6 MTCNN 67
3.3 人臉對齊算法 69
3.3.1 概念與定義 69
3.3.2 DCNN 70
3.3.3 TCNN 72
3.3.4 LAB 73
3.4 人臉特征提取算法 74
3.4.1 概念與定義 75
3.4.2 DeepID 77
3.4.3 InsightFace 79
3.4.4 MobileFaceNet 80
3.5 本章小結(jié) 81
第4章 機器視覺中的人體姿態(tài)識別技術(shù) 82
4.1 人體姿態(tài)識別技術(shù)概述 82
4.1.1 概念與定義 83
4.1.2 人體姿態(tài)識別技術(shù)的特點 84
4.1.3 人體骨架關(guān)鍵點提取技術(shù) 85
4.1.4 人體姿態(tài)識別算法 87
4.2 自上而下的人體姿態(tài)識別技術(shù) 88
4.2.1 Mask R-CNN 88
4.2.2 RMPE 92
4.2.3 DeepCut 95
4.3 自下而上的人體姿態(tài)識別技術(shù) 97
4.3.1 PAF 97
4.3.2 Associative Embedding 99
4.4 本章小結(jié) 102
第5章 面向人臉檢索的高維空間快速索引技術(shù) 103
5.1 度量空間索引和相似性檢索 103
5.1.1 度量空間索引 104
5.1.2 相似性檢索 106
5.2 高維空間快速索引方法 109
5.2.1 度量空間索引快速查詢方法 109
5.2.2 度量空間索引KNN查詢方法 113
5.3 高維空間快速索引實驗 117
5.3.1 實驗環(huán)境 117
5.3.2 實驗結(jié)果 117
5.3.3 分析比較 118
5.4 本章小結(jié) 119
第6章 嵌入式設(shè)備中的人臉精準識別技術(shù) 120
6.1 嵌入式設(shè)備概述 120
6.1.1 嵌入式設(shè)備的由來 121
6.1.2 嵌入式設(shè)備的分類 122
6.2 輕量級人臉識別算法與嵌入式人臉識別應(yīng)用 125
6.2.1 輕量級人臉識別算法 125
6.2.2 嵌入式人臉識別應(yīng)用 133
6.3 面向ARM的人臉精準識別方法VMFace 135
6.3.1 VMFace神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu) 135
6.3.2 VMFace在ARM環(huán)境的應(yīng)用與性能分析 136
6.4 本章小結(jié) 139
第7章 面向姿態(tài)識別的目標檢測算法與性能測評 140
7.1 兩階段目標檢測算法 140
7.1.1 R-CNN模型 141
7.1.2 SPP-Net模型 148
7.1.3 Fast R-CNN模型 153
7.1.4 Faster R-CNN模型 157
7.2 一階段目標檢測算法 160
7.2.1 YOLO模型 160
7.2.2 YOLO 2模型 162
7.2.3 SSD模型 165
7.3 算法性能測評 167
7.3.1 實驗環(huán)境與參數(shù)設(shè)置 167
7.3.2 性能測試結(jié)果對比 169
7.4 本章小結(jié) 172
第8章 嵌入式人臉設(shè)備的應(yīng)用 173
8.1 門禁場景應(yīng)用 174
8.1.1 門禁場景應(yīng)用簡介 175
8.1.2 人臉識別門禁場景體系設(shè)計 177
8.1.3 算法分析 178
8.1.4 案例介紹 179
8.2 安防場景應(yīng)用 182
8.2.1 人臉識別安防場景應(yīng)用簡介 183
8.2.2 安防場景應(yīng)用結(jié)構(gòu) 184
8.2.3 案例介紹 187
8.3 本章小結(jié) 188
第9章 人體姿態(tài)識別技術(shù)的應(yīng)用 189
9.1 運動訓練場景應(yīng)用 189
9.1.1 算法分析 190
9.1.2 案例介紹 191
9.2 姿態(tài)糾正應(yīng)用 193
9.2.1 坐姿糾正應(yīng)用 193
9.2.2 演講姿態(tài)糾正應(yīng)用 194
9.3 安防應(yīng)用 196
9.3.1 安防應(yīng)用背景 197
9.3.2 算法分析 197
9.4 虛擬現(xiàn)實應(yīng)用 198
9.4.1 虛擬現(xiàn)實應(yīng)用背景 198
9.4.2 算法分析 199
9.5 其他應(yīng)用場景 201
9.6 本章小結(jié) 202
第10章 問題、挑戰(zhàn)與發(fā)展 203
10.1 問題和挑戰(zhàn) 203
10.1.1 基礎(chǔ)性問題和挑戰(zhàn) 203
10.1.2 技術(shù)挑戰(zhàn) 204
10.1.3 用戶隱私挑戰(zhàn) 205
10.2 未來發(fā)展 207
10.2.1 人臉識別技術(shù)的未來 208
10.2.2 人體姿態(tài)識別技術(shù)的未來 209
10.3 本章小結(jié) 210