關于我們
書單推薦
新書推薦
|
紙上的想象 讀者對象:本書可供從事信息技術相關研究和工程技術人員閱讀參考
本書專注于研究文本到圖像生成任務,該任務旨在通過自然語言描述生成逼真且語義一致的圖片。第1章簡要概述基于語言描述的圖像合成研究。在第2章中,提出了一種名為“雙注意力生成對抗網(wǎng)絡(DTGAN)”的方法,該方法能夠僅用單個生成器/判別器生成與給定自然語言描述相符的高質(zhì)量圖片。第3章致力于解決當前單階段文本到圖像生成模型中存在的生成圖像缺乏多樣性的問題。第4章創(chuàng)建了兩個新的Good&Bad數(shù)據(jù)集,包含成功與失敗的合成樣本,并訓練了對應的分類器,以確保生成的圖片自然、逼真可信。第5章和第6章分別探討基于條件生成對抗網(wǎng)絡的文本到圖像模型的潛空間和語言空間,以提升可解釋性。通過獨立成分分析算法對生成器的預訓練權重值進行研究,揭示潛空間與圖像變化之間的關系。此外,通過關鍵詞之間的線性插值在合成圖像語義空間中進行定性分析,揭示“語言”嵌入的作用。第7章總結本書的主要貢獻并回答了研究問題。本書可供從事信息技術相關研究和工程技術人員閱讀參考。
你還可能感興趣
我要評論
|