国产无码h在线播放,亚洲成片在线观看12345ba

《解析深度學習：語音識別實踐》是首部介紹語音識別中深度學習技術(shù)細節(jié)的專著。全書首先概要介紹了傳統(tǒng)語音識別理論和經(jīng)典的深度神經(jīng)網(wǎng)絡(luò)核心算法。接著全面而深入地介紹了深度學習在語音識別中的應(yīng)用，包括“深度神經(jīng)網(wǎng)絡(luò)-隱馬爾可夫混合模型”的訓練和優(yōu)化，特征表示學習、模型融合、自適應(yīng)，以及以循環(huán)神經(jīng)網(wǎng)絡(luò)為代表的若干先進深度學習技術(shù)。
《解析深度學習：語音識別實踐》適合有一定機器學習或語音識別基礎(chǔ)的學生、研究者或從業(yè)者閱讀，所有的算法及技術(shù)細節(jié)都提供了詳盡的參考文獻，給出了深度學習在語音識別中應(yīng)用的全景。

俞棟
1998 年加入微軟公司，現(xiàn)任微軟研究院首席研究員、浙江大學兼職教授和中科大客座教授。他是語音識別和深度學習方向的資深專家，出版了兩本專著，發(fā)表了150 多篇論文，是近60 項專利的發(fā)明人及有廣泛影響力的深度學習開源軟件CNTK 的發(fā)起人和主要作者之一。他在基于深度學習的語音識別技術(shù)上的工作帶來了語音識別研究方向的轉(zhuǎn)變，極大地推動了語音識別領(lǐng)域的發(fā)展，并獲得2013 年IEEE 信號處理協(xié)會佳論文獎。俞棟博士現(xiàn)擔任IEEE 語音語言處理專業(yè)委員會委員，曾擔任IEEE/ACM音頻、語音及語言處理匯刊、IEEE 信號處理雜志等期刊的編委。
鄧力
世界著名人工智能、機器學習和語音語言信號處理專家，現(xiàn)任微軟首席人工智能科學家和深度學習技術(shù)中心研究經(jīng)理。他在美國威斯康星大學先后獲碩士和博士學位，然后在加拿大滑鐵盧大學任教獲得終身正教授。其間，他還任麻省理工學院研究職位。1999 年加入微軟研究院歷任數(shù)職，并在2014 年初創(chuàng)辦深度學習技術(shù)中心，主持微軟公司和研究院的人工智能和深度學習領(lǐng)域的技術(shù)創(chuàng)新。鄧立博士的研究方向包括自動語音與說話者識別、口語識別與理解、語音–語音翻譯、機器翻譯、語言模式、統(tǒng)計方法與機器學習、聽覺和其他生物信息處理、深層結(jié)構(gòu)學習、類腦機器智能、圖像語言多模態(tài)深度學習，商業(yè)大數(shù)據(jù)深度分析等。他在上述領(lǐng)域做出了重大貢獻，是ASA（美國聲學學會）會士、IEEE（美國電氣和電子工程師協(xié)會）會士和理事、ISCA（國際語音通信協(xié)會）會士，并憑借在深度學習與自動語音識別方向做出的杰出貢獻榮獲2015年度IEEE 信號處理技術(shù)成就獎。同時，他也曾在高端雜志和會議上發(fā)表過與上述領(lǐng)域相關(guān)的300 余篇學術(shù)論文，出版過5 部著作，發(fā)明及合作發(fā)明了超過70 多項專利。鄧立博士還擔任過IEEE 信號處理雜志和《音頻、語音與語言處理學報》（IEEE/ACMTransactions on Audio, Speech & anguage Processing）的主編。
俞凱
IEEE 高級會員，上海交通大學計算機科學與工程系特別研究員。清華大學本科、碩士，英國劍橋大學工程系博士。長期從事智能語音及語言處理、人機交互、模式識別及機器學習的研究和產(chǎn)業(yè)化工作。他是中組部“千人計劃”（青年項目）獲得者，國家自然科學基金委優(yōu)秀青年科學基金獲得者，上海市“東方學者”特聘教授；作為共同創(chuàng)始人和首席科學家創(chuàng)立“蘇州思必馳信息科技有限公司”�，F(xiàn)任中國聲學學會語音語言、聽覺及音樂分會執(zhí)委會委員，中國計算機學會人機交互專委會委員，中國語音產(chǎn)業(yè)聯(lián)盟技術(shù)工作組副組長。他的研究興趣涉及語音識別、語音合成、口語理解、對話系統(tǒng)、認知型人機交互等智能語音語言處理技術(shù)的多個核心技術(shù)領(lǐng)域，在本領(lǐng)域的一流國際期刊和會議上發(fā)表論文80 余篇，申請專利10 余項，取得了一系列研究、工程和產(chǎn)業(yè)化成果。在InterSpeech 及IEEE Spoken Language Processing 等國際會議上獲得3 篇國際會議優(yōu)秀論文獎，獲得國際語音通信聯(lián)盟（ISCA）2013 年頒發(fā)的2008—2012 Computer Speech and Language 優(yōu)論文獎。受邀擔任InterSpeech 2009 語音識別領(lǐng)域主席、EUSIPCO 2011/EUSIPCO 2014 語音處理領(lǐng)域主席、InterSpeech 2014 口語對話系統(tǒng)領(lǐng)域主席等。他負責搭建或參與搭建的大規(guī)模連續(xù)語音識別系統(tǒng)，曾獲得美國國家標準局（NIST）和美國國防部內(nèi)部評測冠軍；作為核心技術(shù)人員，負責設(shè)計并實現(xiàn)的認知型統(tǒng)計對話系統(tǒng)原型，在CMU 組織的2010 年對話系統(tǒng)國際挑戰(zhàn)賽上獲得了可控測試的冠軍。作為項目負責人或Co-PI，他主持了歐盟第7 框架PARLANCE、國家自然科學基金委、上海市教委、經(jīng)信委，以及美國通用公司、蘇州思必馳信息科技有限公司的一系列科研及產(chǎn)業(yè)化項目。2014 年，因在智能語音技術(shù)產(chǎn)業(yè)化方面的貢獻，獲得中國人工智能學會頒發(fā)的“吳文俊人工智能科學技術(shù)獎”。
錢彥旻
上海交通大學計算機科學與工程系助理研究員，博士。分別在2007 年6 月和2013 年1 月于華中科技大學和清華大學獲得工學學士和工學博士學位。2013 年4 月起，任上海交通大學計算機科與工程系理研究員。同時從2015 年1 月至2015 年12 月，在英國劍橋大學工程系機器智能實驗室語音組進行訪問，作為項目研究員與語音識別領(lǐng)域的著名科學家Phil Woodland 教授和Mark Gales 教授開展合作研究。現(xiàn)為IEEE、ISCA 會員，同時也是國際開源項目Kaldi 語音識別工具包開發(fā)的項目組創(chuàng)始成員之一。此外，擔任IEEE Transactions on Audio, Speech, and Language Processing、SpeechCommunication、ICASSP、Interspeech、ASRU 等國際期刊和會議的審稿人。目前在國內(nèi)外學術(shù)刊物和會議上發(fā)表學術(shù)論文50 余篇，Google Scholar 總引用數(shù)近1000 次。其中包括在語音識別領(lǐng)域優(yōu)秀國際會議ICASSP、InterSpeech 和ASRU 上發(fā)表論文30 余篇，申請國家專利共3 項，已授權(quán)1 項。2008 年獲科技奧運先進集體獎，2014 年獲中國人工智能學會頒發(fā)的“吳文俊人工智能科學技術(shù)獎進步獎”。曾作為負責人和主要參與者參加了包括英國EPSRC、國家自然科學基金、國家863 等多個項目。目前的研究領(lǐng)域包括：語音識別、說話人和語種識別、自然語言理解、深度學習建模、多媒體信號處理等。

你還可能感興趣

我要評論