《比較》系列由著名經(jīng)濟學(xué)家吳敬璉主編,為讀者提供國際經(jīng)驗和經(jīng)濟學(xué)前沿知識的比較!侗容^第119輯》緊貼當(dāng)下經(jīng)濟選題。隨著新經(jīng)濟的發(fā)展,針對之前市場經(jīng)濟的監(jiān)管工具和方法,有些跟不上時代的發(fā)展,其他方面的規(guī)則也有類似的問題。本輯比較圍繞這一主題選取稿子,從金融、土地政策、綠色發(fā)展(碳轉(zhuǎn)型)等角度選取了文章,為讀者提供了新的視角。
適讀人群 :政策制定者/學(xué)者/投資人士/研究者/學(xué)生
1.經(jīng)濟學(xué)前沿理論和趨勢
2.貼近當(dāng)下經(jīng)濟熱點話題
3.大牌經(jīng)濟學(xué)作者
吳敬璉,著名經(jīng)濟學(xué)家,國務(wù)院發(fā)展研究中心研究員,是中國經(jīng)濟學(xué)界的泰斗,當(dāng)代中國杰出經(jīng)濟學(xué)家、著名市場經(jīng)濟學(xué)者。
金融網(wǎng)絡(luò)中的系統(tǒng)性風(fēng)險:一份綜述 馬修·杰克遜 阿加特·佩爾努
經(jīng)濟學(xué)家應(yīng)該了解的機器學(xué)習(xí)方法 蘇珊·阿西 吉多·因本斯
國家紀(jì)律的來源:1948—1973年以色列國家發(fā)展的經(jīng)驗教訓(xùn) 埃雷斯·馬戈爾
貨幣的時間價值:現(xiàn)代中央銀行存在性的一個理論視角 陸磊
被遺忘的市場:典當(dāng)行的重要作用 瑪里科·博斯 蘇珊·卡特 佩奇·斯奇巴
土地發(fā)展權(quán)與主體功能區(qū)規(guī)劃實施研究 田莉 夏菁 杜一凡
地方政府生產(chǎn)性投資的邏輯:政治經(jīng)濟學(xué)視角 吳延兵
民粹主義的經(jīng)濟危害:國際視角 紀(jì)敏
濟學(xué)家應(yīng)該了解的機器學(xué)習(xí)方法
伯克利加州大學(xué)的統(tǒng)計學(xué)家布雷曼在2001年的《統(tǒng)計科學(xué)》上發(fā)表了一篇頗有挑釁性的論文,談及統(tǒng)計學(xué)中以模型為基礎(chǔ)的方法和以算法為基礎(chǔ)的方法的區(qū)別:利用統(tǒng)計建模從數(shù)據(jù)中得出結(jié)論,這里有兩種文化:一種假設(shè)數(shù)據(jù)從給定的隨機模型中產(chǎn)生;另一種則利用算法模型,把數(shù)據(jù)機制作為未知來考慮。布雷曼接著指出:過去,統(tǒng)計學(xué)界基本上只使用數(shù)據(jù)模型,這種偏執(zhí)導(dǎo)致了無效的理論和受質(zhì)疑的結(jié)論,并讓統(tǒng)計學(xué)家們難以處理各種有趣的現(xiàn)實問題。而算法模型從理論和實踐看都在統(tǒng)計學(xué)領(lǐng)域之外獲得了飛速發(fā)展,既能用于復(fù)雜的大數(shù)據(jù)庫,也能給較小的數(shù)據(jù)庫提供不同于數(shù)據(jù)模型的更為精確和有效的分析工具。如果統(tǒng)計學(xué)界把利用數(shù)據(jù)解決問題作為自己的目標(biāo),那我們就應(yīng)該超越對數(shù)據(jù)模型的單純依賴,接受更加豐富多樣的研究工具。布雷曼當(dāng)時的總結(jié)已不再適用于如今的統(tǒng)計學(xué)界。這個領(lǐng)域已廣泛接受了機器學(xué)習(xí)(ML)的革命方法,即他所說的算法模型文化,并且許多教科書把機器學(xué)習(xí)方法同更加傳統(tǒng)的統(tǒng)計學(xué)方法放在一起討論。雖然這些方法在經(jīng)濟學(xué)中的應(yīng)用要慢一些,但如今也開始在實證分析中廣泛出現(xiàn),成為快速增加的方法論研究文獻(xiàn)的主題之一。我們希望在這篇評論文章中指出,正如布雷曼對統(tǒng)計學(xué)界的評論那樣,經(jīng)濟學(xué)家和計量經(jīng)濟學(xué)家也“應(yīng)該超越對數(shù)據(jù)模型的單純依賴,接受更加豐富多樣的研究工具”。我們將介紹對實證研究者有用的某些工具,并認(rèn)為這些工具應(yīng)該成為計量經(jīng)濟學(xué)標(biāo)準(zhǔn)研究生課程的組成部分,因為我們贊同布雷曼的看法“把利用數(shù)據(jù)解決問題作為自己的目標(biāo)”,同時我們認(rèn)為計量經(jīng)濟學(xué)的本質(zhì)就是在不確定情況下的決策,而且希望學(xué)生們能夠同經(jīng)常采用算法模型等方法的其他領(lǐng)域的學(xué)者有效開展交流。機器學(xué)習(xí)研究文獻(xiàn)中發(fā)展出來的方法具有普遍適用價值,尤其擅長處理大數(shù)據(jù)的情形:我們在大量單元上觀測到信息,或者每個單元上包含許多條信息,而且經(jīng)常超出單一橫截面數(shù)據(jù)的簡單情形。對于此類情形,機器學(xué)習(xí)正在成為各類學(xué)科共同采用的標(biāo)準(zhǔn)研究方法。因此,經(jīng)濟學(xué)家的工具庫在保留傳統(tǒng)應(yīng)用計量方法的優(yōu)勢之外,也需要相應(yīng)地與時俱進(jìn)。
相比更廣泛的統(tǒng)計學(xué)界,經(jīng)濟學(xué)領(lǐng)域?qū)C器學(xué)習(xí)方法的采用為什么慢很多?很大一部分原因或許來自布雷曼所說的文化。經(jīng)濟學(xué)期刊看重的研究方法帶有某些規(guī)范特性,是許多機器學(xué)習(xí)方法本身不能提供的,包括估計量和檢驗的大樣本特征,如一致性、正態(tài)性和有效性等。與之相比,機器學(xué)習(xí)類文獻(xiàn)的關(guān)注點往往是算法在特定場景下的實用特性,其規(guī)范結(jié)果屬于另一種類型,例如對誤差率的保證等。對計量經(jīng)濟學(xué)論文傳統(tǒng)上報告的那類理論結(jié)果,機器學(xué)習(xí)文獻(xiàn)通常較少涉及,當(dāng)然近期有了某些重要突破。目前沒有規(guī)范的研究結(jié)論表明,對于監(jiān)督學(xué)習(xí)問題,深度學(xué)習(xí)或神經(jīng)網(wǎng)絡(luò)方法普遍優(yōu)于回歸樹或隨機森林方法。而且至少從短期看,這方面的比較不太可能得出一般性結(jié)論。
在許多情形下,構(gòu)建有效的大樣本置信區(qū)間的能力是重要的,但我們不應(yīng)該輕易排除無法(或暫時無法)提供此類結(jié)果卻具有其他優(yōu)勢的分析方法。這些方法在特定數(shù)據(jù)庫中展示的超越其他方法的樣本外預(yù)測能力在實踐中極具價值,然而在計量經(jīng)濟學(xué)中還很少被列為目標(biāo)或受到重視。有學(xué)者指出,某些實質(zhì)性問題被很自然地歸入預(yù)測問題,就此類情形的研究目的而言,評估測試組的擬合效果往往已經(jīng)足夠。而在其他一些情形下,一個預(yù)測問題的結(jié)果是對主要分析對象的一個輸入,不需要對超出收斂速率的預(yù)測成分做統(tǒng)計分析?墒沁有許多情形,我們有必要為感興趣的參數(shù)提供有效置信區(qū)間,例如對于平均干預(yù)效應(yīng)。此時,標(biāo)準(zhǔn)差或置信區(qū)間反映的不確定程度可能成為是否實施干預(yù)決策的重要參考內(nèi)容。因此我們認(rèn)為,隨著機器學(xué)習(xí)工具在未來被更加廣泛地采用,學(xué)者們需要明確闡述自己的研究目標(biāo),以及自己采用的算法或估計量的某些特性為什么是重要的。
本文的一個主題是,雖然在某些情形下簡單地從機器學(xué)習(xí)研究文獻(xiàn)中借鑒算法可以取得效果,但在其他許多時候未必能適用。機器學(xué)習(xí)技術(shù)通常要求細(xì)致的調(diào)適,才能有效處理經(jīng)濟學(xué)家感興趣的特定問題。或許最重要的調(diào)適類型是探討問題的結(jié)構(gòu),例如許多估計對象的因果關(guān)系性質(zhì)、變量的內(nèi)生性、數(shù)據(jù)的構(gòu)造(如面板數(shù)據(jù))、在可替代產(chǎn)品集合中做離散選擇的性質(zhì),以及經(jīng)濟學(xué)理論施加的可信約束(例如需求在價格上表現(xiàn)出來的單調(diào)性)或其他形狀約束等(Matzkin,1994,2007)。統(tǒng)計學(xué)和計量經(jīng)濟學(xué)在傳統(tǒng)上非常強調(diào)這些結(jié)構(gòu)特征,并發(fā)展出了許多可加以利用的思想,而機器學(xué)習(xí)方法對此往往不重視。從實質(zhì)內(nèi)容和統(tǒng)計方法上利用好這些思想,將能夠極大地改善機器學(xué)習(xí)的效果,這跟圖像識別等特定問題中采用的機器學(xué)習(xí)的精心調(diào)適手段是相似的。還有一類調(diào)適是改變機器學(xué)習(xí)算法的最優(yōu)化標(biāo)準(zhǔn),把因果推斷放到優(yōu)先考慮中,例如控制混雜因子,或者發(fā)現(xiàn)治療效果的異質(zhì)性等。最后,我們可以采用樣本分割方法,利用不同數(shù)據(jù)選擇模型而非估計參數(shù),或者采用正交化方法等技術(shù)改善機器學(xué)習(xí)的估計量的表現(xiàn),這在某些情形下可以帶來估計量的漸進(jìn)式正態(tài)性等理想特征。
本文將介紹一系列工具,我們認(rèn)為它們應(yīng)該成為實證經(jīng)濟學(xué)家工具庫的組成部分,并納入計量經(jīng)濟學(xué)研究生課程。這當(dāng)然來自主觀選擇,而且鑒于此類研究文獻(xiàn)的發(fā)展速度,相應(yīng)工具清單會快速變化。另外,我們對相關(guān)議題的討論并不很完備,只是著眼于對傳遞重要思想和見地的相關(guān)方法的簡介,并提及更全面的其他參考資料。排在我們清單上第一位的是非參數(shù)回歸,在機器學(xué)習(xí)研究文獻(xiàn)中的術(shù)語則是用監(jiān)督學(xué)習(xí)解決回歸問題。排在第二位的是介紹用于分類問題的監(jiān)督學(xué)習(xí),與離散反應(yīng)模型中的非參數(shù)回歸密切相關(guān),但不完全相同,可以說這是機器學(xué)習(xí)方法取得最大成功的領(lǐng)域。排在第三位的是非監(jiān)督學(xué)習(xí),或者說聚類分析和密度估計。排在第四位的是對異質(zhì)性干預(yù)效應(yīng)的估計,以及從個體觀測特征對應(yīng)于干預(yù)方案的最優(yōu)政策選擇。排在第五位的是實驗設(shè)計中的機器學(xué)習(xí)方法,目前老虎機方法正在帶來革命性影響,特別是在網(wǎng)絡(luò)場景中。排在第六位的是矩陣填充問題,包括在因果面板數(shù)據(jù)模型和消費者離散產(chǎn)品集合選擇問題中的應(yīng)用。最后我們還將討論文本數(shù)據(jù)分析。
我們注意到,近期還有幾篇為經(jīng)濟學(xué)家而寫的關(guān)于機器學(xué)習(xí)方法的文獻(xiàn)綜述,普遍涉及比本文內(nèi)容更多的實證案例和應(yīng)用參考。例如,范里安(Varian,2014)對若干重要的機器學(xué)習(xí)方法做了高水平的討論。穆萊納森和施皮斯(Mullainathan and Spiess,2017)重點分析了監(jiān)督學(xué)習(xí)方法用于回歸分析的好處,以及經(jīng)濟學(xué)領(lǐng)域中適用預(yù)測方法的各種問題。阿西等人(Athey,2017)提供了廣泛的研究視角,并重點介紹了近期采用機器學(xué)習(xí)方法開展因果分析的進(jìn)展及其對經(jīng)濟學(xué)研究的普遍意義。根茨科等人(Gentzkow et al.,2017)出色地介紹了近期采用的文本分析方法,并側(cè)重于在經(jīng)濟學(xué)中的應(yīng)用。另外在計算機科學(xué)與統(tǒng)計學(xué)研究文獻(xiàn)中還有幾本優(yōu)秀的教科書,適合不同層次的社會科學(xué)背景的研究者參考,其中包括黑斯蒂等人從統(tǒng)計學(xué)角度提供了較為全面的參考,布爾科夫有非常易讀的入門介紹,以及阿爾佩丁和諾克斯的著作。當(dāng)然這些著作都更多地采用了計算機科學(xué)的視角。