新書|《拯救經濟計量學:由概率論方法轉向概率近似正確學習》
點擊封面即可購買
《拯救經濟計量學:由概率論方法轉向概率近似正確學習 》
ISBN 978-7-301-34977-9
秦朵 著
內容簡介
經濟計量學是建立在經典統計學框架內的學科,其數理分析的規範性、嚴謹性和可靠性毋庸置疑,但在模型的實踐應用方面卻一直成效欠佳。而近年來出現的人工智能、機器學習技術已被大量運用於經濟計量研究,在實踐應用方面的成效已明顯超越經典統計學,併爲系統解決經濟計量學的問題提供了成熟的理論框架 。
本書以傳統經濟計量學的奠基之作——哈維爾莫的《經濟計量學的概率論方法》的主要論點爲出發點,對經濟計量學的研究方法進行了批判性的分析,並通過案例展示了經濟計量模型研究如何受益於機器學習。通過以上分析,本書揭示了經濟計量學科在方法論上的缺陷,並指出機器學習是系統矯正該缺陷的途徑。
本書適合從事經濟計量學、應用經濟學、經濟思想史等領域研究的學者,以及碩士、博士研究生閱讀。
作者簡介
秦朵,倫敦大學亞非學院榮休教授。1981年畢業於北京第二外國語學院;1984年畢業於中國社會科學院;1986-1989年在英國牛津大學Nuffield學院攻讀經濟學博士;1992年進入倫敦瑪麗女王大學經濟系執教,2012年轉到倫敦大學亞非學院。研究和教學領域爲經濟計量學史和方法論、應用經濟計量學。
目 錄
序言
第1章 現實經濟的模型抽象
第2章 經濟關係式的可學性
第3章 經濟計量學中概率論的基本功能
第4章 假設檢驗的用處與經濟假說的模型構述
第5章 估計方法的問題與潛能
第6 章 預測的認知問題
結束語
參考文獻
主題詞索引
序 言
本書質疑由哈維爾莫 (Haavelmo) 1944年專著《經濟計量學的概率論方法》構建起來的經濟計量學的方法論基礎,呼籲並闡明瞭對該基礎進行徹底革新並向機器學習方法論靠攏的必要性。經濟計量學是以分析從開放世界被動觀測到的數據爲主的學科。機器學習的處境相當,不過其數據來源往往比經濟計量學的數據來源要更加廣泛且異質。雖然機器學習是比經濟計量學更爲年輕的學科,但當前它對於各個學科的滲透之快、之廣是有目共睹的。對比兩個學科不難發現,機器學習教科書中的數學內容要比經濟計量學的數學內容淺顯容易得多,但在實際應用功效方面卻明顯是後來居上,機器學習使得經濟計量學的應用效果相形見絀。按照經濟學的基本評判尺度,經濟計量學一定存在效率低下問題。
近年來,經濟計量應用研究中引入機器學習技術的案例與日俱增,英文文獻中介紹和推薦機器學習的綜述也層出不窮。遺憾的是,經濟計量學界對機器學習的理論基礎卻存在一大盲點,即普遍把機器學習表述爲數據分析的工具箱。“坐井觀天”“管窺蠡測”“只見樹木不見森林”這幾個詞恐怕是最能貼切形容這種情形的了。
在Breiman (2001) 對機器學習主旨的精闢綜述中,他將機器學習與經典統計學方法論上的分歧概述爲“兩種文化”的分歧。經濟計量學是堅實奠定在經典統計學框架中的學科。哈維爾莫專著對概率方法論的雄辯以及後來的美國考爾斯經濟研究會(The Cowles Commission)專著系列第10部對經濟計量學的嚴格正規表述(Koopmans ,1950)是公認的經濟計量學科的奠基史源。這兩部里程碑式的專著爲日後經濟計量學者大量拓展統計數學工具開闢了一片新天地。然而,自學科正式形成以來,經濟計量學理論在應用建模方面卻不斷遇到各種難題。爲了克服這些難題,名目繁多的計量學估計和檢驗工具不斷因應而生。不過,儘管這些工具在數學方面的複雜性和精妙性大大提高,它們在實踐中的成效卻一直不盡如人意。這種科研效率欠佳的情形意味着,經濟計量學在方法論上存在基礎缺陷。其實,Judge et al.(1980)在其結論中早就把這些缺陷歸咎於計量學過窄的關注點,即對“已知的抽樣模型”的統計推斷問題的集中關注。他們還指出:“針對有誤模型做統計推斷的理論框架尚待開發出來。我們若要爲學習被動觀測的經濟數據的有限樣本開發出更爲有效的分析手段,就必須在將來的研究中正視並且解決這一問題。” (第778頁)如今,機器學習已爲系統解決這一問題提供了成熟的理論框架。
無須贅言,當今機器學習的成功離不開一個堅實的基礎理論後盾。機器學習算法工具箱的後盾是嚴謹的、以概率近似正確(probably approximately correct,PAC)學習概念爲核心的可學性(learnability)理論。PAC學習爲如何設計算法系統以學習到儘可能最優的經驗模型奠定了基礎,併爲學習過程制定了以無分佈假定爲主的方略。機器學習還與人工智能的發展相互促進,相得益彰。人工智能的突出成就,是建立了對人腦知識在充滿不確定性的現實中的邏輯推理和決策過程的規範化表述體系,這爲機器學習提供了清晰的模型表述基礎。
PAC學習的視角和分析思路啓發了我——經濟計量學科效率欠佳的根源其實在於它早已過時的概率論基礎。要拯救經濟計量學,就需要對其方法論基礎做一個全面徹底的反思和檢修。這項研究工作必然會涉及經濟學說史和科學方法論方面的諸多問題。不過,本書的主要目標讀者還是使用經濟計量學的經濟學家。畢竟有培根的名言——“歷史使人明智”。只有徹底擺脫經濟計量學教科書框架的束縛,接受PAC學習理念,經濟學家纔可能充分發揮出他們綜合利用理論與經驗知識、有效分析現實經濟問題的潛能。Sloman and Fernbach (2017,第 255頁) 寫道:“當學者面臨一個與其先前預想截然不同的觀點時,他們的反應過程往往呈三步:首先是不予考慮,然後是抵制拒絕,最後稱該觀點不過是顯而易見的。” 但願我此次的探索之旅能夠使經濟計量學界儘快踏入第三步,頓悟出大道至簡的真諦。
爲了從根基上闡明現行經濟計量學研究模式的方法論問題,本書的結構效仿哈維爾莫原著的結構。在全書的六章中,每章都以哈維爾莫相應章中的主要論點爲出發點,根據經濟計量學的研究現狀來分析其功過。分析的關注點是針對時序數據的宏觀應用模型研究與針對橫截面數據的微觀應用模型研究中暴露出的共性問題。分析的焦點是這些問題的方法論根源:經典統計學的分析視角是不足以協助經濟計量學實現連接經濟理論與數據信息的建模目標的。同時,不少章節還列舉了經濟計量模型研究如何得益於機器學習的案例。簡言之,本書揭示了經濟計量學科現存的基礎缺陷,並指出機器學習是目前系統矯正缺陷的唯一途徑。
本書的主要論點大致如下:
● 模型構述的不確定性是經濟計量研究最需要面對和處理的不確定因素。哈維爾莫倡導的概率論思路,即以將模型所涉變量設爲一個聯合概率分佈空間的數學表達爲出發點的思路,並不能有效地處理該因素。
● 哈維爾莫倡導的經濟學內的分工是:經濟學家擔負先驗演繹建模的任務,經濟計量學家擔負模型估計和檢驗的任務。實踐證明,這一分工過於簡單極端。實踐中可用的計量模型只能通過先驗邏輯演繹和後驗歸納推理的交替使用過程學習而來。機器學習中的PAC學習理論爲這種學習鋪墊了一條系統路徑。
● 根據機器學習的方法論,上述學習過程無須對所涉變量的統計分佈做假定,概率的主要作用是協助建模學習所涉及的各種決策步驟。另外,人工智能中的邏輯命題表述法爲模型構述基於常識性的經濟學法則展示了一條更爲準確、更易於連接數據信息的新路徑。
● 一般來說,經驗證實經濟理論的研究任務明顯超出了經典統計學假設檢驗的狹窄框架。這類任務的模型構述需要經過細緻的模型設計和數據歸納學習過程纔可能實現。
● 鑑於此,針對經驗證實經濟理論的任務,將注意力集中在對先驗模型中給定的參數做統計最優估計之上,是經濟計量學研究的嚴重策略性失誤。內生有偏性陷阱便是這一失誤最經典的縮影。
● 一旦學界公開認同了建模的不確定性,模型的預測亦即泛化性能(generalisability)便成爲經濟計量模型學習過程中一個必不可少的主要標準。衍生於經典統計學的經濟計量學在現行框架內沒有測試模型泛化性的系統方略,實爲學科處於亟須拯救之窘境的主要原因。
在我的專業生涯中,本書是最艱鉅的一項研究課題了。爲了更好地完成任務和儘量明確分析思路,我採用了交替使用中文和英文的寫作方式,寫作過程長達三年半之久。但本項研究的醞釀期更長,可追溯到2012年我在倫敦大學亞非學院首次執教研究生的微觀經濟計量學課程之時。此前,我的教學與應用性研究課題都限於分析時序樣本的宏觀計量學的範圍之內。在微觀經濟計量學課程的講授摸索階段,爲了更明確清晰地向學生解釋教科書中爲何通用工具變量手段來處理遺漏變量有偏性及選擇有偏性等問題,我的研究便轉向專門考察工具變量估計的方法論形成史的課題。繼而,我又對工具變量方法背後的內生有偏性這一經濟計量學基礎概念的實質做了追述式考察。與此同時,爲了尋找既簡潔易懂又可提高微觀數據信息利用率的應用建模手段,我接觸到機器學習的方法,這又促使我走上自修機器學習課程之旅。
在本書的寫作過程中,我受益於不少友人的熱情支持、鼎力幫助和寶貴建議。這裡我要衷心致謝的有:焦兮彧、劉學林、盧珊、王慶超、宋麗娜、徐強、張維迎、鄒麗峰、Ruben Lee、Sophie van Huellen和Chris Watkins,以及已故的Olav Bjerkholt。不過,我最爲感激的是我媽媽朱哈娜。四年多前她雖已年邁多病,但當聽到我想寫書又心存顧慮時,馬上熱情鼓勵並全心支持。她的讚許和興奮之情我至今記憶猶新。如今在她辭世兩年多後,書稿終於完成了。我這才恍悟,原來我對機器學習原理的好奇和對寫書的執迷,是傳承了她的敬業精神。在微機時代到來前的20世紀80年代初,她在山東一所普通中學的教書生涯接近尾端時,曾自發地去學習計算機編程語言,並且興致勃勃地給中學生們開設了計算機編程選修課,還爲他們編寫了一本BASIC習題集。
鑑於本書議題的性質,我的寫作難免會存在不足。文責自負,我僅希望本書可以起到拋磚引玉的作用。
秦朵
2023年於英國倫敦
點擊封面即可購買