欧美一级高清片欧美国产欧美,亚洲无码1区2区

隨著語音算法技術(shù)的不斷發(fā)展與完善，如何進(jìn)行工程落地成為語音商業(yè)應(yīng)用中普遍面臨的問題。工程落地不僅要考慮模型效果，還要考慮資源占用、模塊聯(lián)調(diào)且整個架構(gòu)要具有可靠性、可擴展性和可維護(hù)性。

本書圍繞如何從零構(gòu)建一個完整的語音識別系統(tǒng)，深入淺出地介紹了語音識別前端算法、語音識別算法及說話人日志算法原理；基于Kaldi的模型訓(xùn)練；語音識別工程落地和服務(wù)搭建。

本書適合作為語音技術(shù)研究人員及對語音技術(shù)感興趣的開發(fā)人員的參考用書。

前言

近年來，隨著深度學(xué)習(xí)技術(shù)的不斷發(fā)展，語音識別準(zhǔn)確率得到了大幅提升，由此帶來了基于語音交互應(yīng)用的豐富想象力，這些技術(shù)越來越多地影響著人們生產(chǎn)和生活的方方面面。其中，消費級應(yīng)用包括智能音箱、手機語音助理、車載智能座艙、語音輸入法與翻譯機等；企業(yè)級應(yīng)用包括智能客服、語音質(zhì)檢、智慧教育、智慧醫(yī)療等。各類智能語音應(yīng)用的蓬勃發(fā)展使得越來越多的人加入語音領(lǐng)域的研究和落地，共同推動整個語音產(chǎn)業(yè)的發(fā)展。

得益于語音識別技術(shù)的蓬勃發(fā)展和識別率的節(jié)節(jié)攀升，業(yè)界涌現(xiàn)出眾多優(yōu)秀的端到端語音工具包，如Wenet，ESPNet，SpeechBrain等。盡管如此，2009年約翰霍普金斯大學(xué)夏季研討會孵化出的Kaldi工具箱，以其穩(wěn)定的算法效果，活躍的社區(qū)氛圍，得到了廣泛應(yīng)用，極大地降低了語音識別的上手門檻，也培養(yǎng)了大量的相關(guān)人才。目前，仍然有很多公司在使用基于Kaldi的工程方案。

由于語音交互技術(shù)涉及的算法與技術(shù)鏈條較長，因此已有的語音算法相關(guān)圖書主要集中在各類語音算法的原理與訓(xùn)練上，缺乏從語音交互角度出發(fā)，介紹語音交互所需的語音前后端各項算法和整體解決方案的相關(guān)圖書。在語音應(yīng)用的落地上，學(xué)術(shù)界也缺乏產(chǎn)業(yè)界的工程應(yīng)用落地經(jīng)驗。本書將致力于拉進(jìn)學(xué)術(shù)界與產(chǎn)業(yè)界的距離，在系統(tǒng)地介紹語音交互流程中涉及的語音前端處理、語音識別和說話人日志等算法原理的同時，詳細(xì)介紹如何基于WebRTC，Kaldi和gRPC，從零構(gòu)建產(chǎn)業(yè)界穩(wěn)定、高性能、可商用的語音服務(wù)。

在前端算法的相關(guān)章節(jié)中，本書系統(tǒng)地介紹了語音活動檢測、語音降噪、回聲消除、波束形成等常用的語音前端處理算法的原理，還針對各種算法在實際場景中的工程實現(xiàn)方法，提供了大量的經(jīng)驗總結(jié)。除了介紹傳統(tǒng)信號的處理方法，本書還介紹了深度學(xué)習(xí)方法在語音前端領(lǐng)域中的發(fā)展和應(yīng)用現(xiàn)狀。

在語音后端算法方面，本書詳細(xì)介紹了語音識別中的特征提取、聲學(xué)模型、語言模型、解碼器和端到端語音識別，以及說話人日志中的聲紋Embedding提取和聚類算法。同時，還介紹了如何基于Kaldi訓(xùn)練語音識別及說話人日志模型。針對訓(xùn)練模型時的很多細(xì)節(jié)問題，提供了詳細(xì)的解釋。

在語音算法工程化方面，本書介紹了如何利用WebRTC和Kaldi優(yōu)化處理流程，形成語音算法SDK�；诹餍械挠糜谖⒎⻊�(wù)構(gòu)建的RPC遠(yuǎn)程調(diào)用框架和SDK，進(jìn)一步介紹了如何實現(xiàn)一套方便用戶快捷接入的語音算法的微服務(wù)。

本書由楊學(xué)銳、晏超、劉雪松合作撰寫。三位作者長期在一線從事語音算法工作，書中內(nèi)容匯集了他們在產(chǎn)業(yè)界模型訓(xùn)練和應(yīng)用落地的思考與經(jīng)驗總結(jié)，希望能給學(xué)術(shù)界的研究人員與產(chǎn)業(yè)界的從業(yè)人員帶來一絲啟發(fā)和幫助。其中楊學(xué)銳負(fù)責(zé)第1、4、5章的撰寫及全書內(nèi)容的審核校對，晏超負(fù)責(zé)第6、7、8章的撰寫及工程代碼的實現(xiàn)調(diào)試，劉雪松負(fù)責(zé)第2、3章及第1章部分內(nèi)容的撰寫和校對。

最后，感謝電子工業(yè)出版社李淑麗老師的辛苦工作，感謝吳伯庸和王金超對本書的貢獻(xiàn)，感謝陳勇的審稿與校對，感謝成書過程中給予過幫助的所有相關(guān)人士。

由于作者水平有限，書中如有任何錯誤與不足，懇請廣大讀者批評指正并提出寶貴意見。

作者

2021年11日于上海

你還可能感興趣

我要評論