關(guān)于我們
書單推薦
新書推薦
|
高效深度學(xué)習(xí) 讀者對象:機(jī)器學(xué)習(xí)堵
在生成式人工智能的時(shí)代,我們見證了模型推理對存儲(chǔ)空間和計(jì)算能力的巨大需求,這對大語言模型和視覺生成模型的實(shí)際應(yīng)用提出了前所未有的挑戰(zhàn)。在這樣的背景下,高效模型壓縮和模型設(shè)計(jì)技術(shù)顯得尤為重要,它們是降低模型計(jì)算和存儲(chǔ)需求的關(guān)鍵,使得模型的快速部署和高效運(yùn)行成為可能。本書系統(tǒng)地介紹了高效模型壓縮和模型設(shè)計(jì)的方法,在編寫上兼顧理論和實(shí)踐。本書主體部分詳細(xì)介紹了模型壓縮的方法論,包括高效模塊設(shè)計(jì)、模型剪枝、模型量化、模型二值化、神經(jīng)網(wǎng)絡(luò)架構(gòu)搜索、知識(shí)蒸餾幾大部分。另外,簡要介紹了定制化硬件加速器的設(shè)計(jì)及大語言模型的加速和壓縮。
你還可能感興趣
我要評論
|