1. 程式人生 > >如何正確使用計量經濟學方法評估公共政策

如何正確使用計量經濟學方法評估公共政策

近年來,計量經濟學方法被廣泛應用於公共政策效果評估,但時常被誤用,這會得出錯誤的政策評估結論,進而誤導政策制定者。為了避免這一問題,研究者需要準確把握各類公共政策評估方法的使用前提和技術要點。賽魯利(Cerulli,2015)的《社會經濟政策的計量經濟學評估:理論與應用》一書系統介紹了公共政策效果評估的各種計量經濟學方法的適用前提和範圍,可為研究者提供相關知識補充和應用參考。本文基於這一著作,對常見的公共政策評估方法進行了對比和歸納,期望對相關政策評估研究有所裨益。

 

一、引言

 

(一)運用計量經濟學方法評估公共政策效果的重要意義

 

科學施政是政府行政的基本需求。公共政策的實施直接影響千家萬戶,錯誤或有偏差的公共政策輕則浪費鉅額財政資金,重則造成產業停滯、大量失業甚至系統性金融風險等。要避免這種災難性後果,要求公共政策的制定、實施、評價和調整,都需要科學依據。

 

制定公共政策需要科學依據,這需要運用科學有效的方法,評估出已實施的同類政策的效果,包括國內外各種政策實踐的各種短期和長期效果。傳統的公共政策評估運用定性和簡單的定量分析方法,這些方法的科學性不足。現代常見的公共政策評估的科學方法有模擬模擬法、實驗法和計量經濟學方法。模擬模擬法在巨集觀經濟模型中運用較多,實驗法的應用範圍極小,只有計量經濟學方法運用最廣。

 

計量經濟學方法成為主流的公共政策評估方法,為科學施政做出了重大貢獻。但是,如果不正確地使用計量經濟學方法進行評估,往往易誤解公共政策的效果,可能會把一些本來不屬於公共政策的缺陷或作用強加於之,從而使研究者和政府部門對公共政策的認識更加偏離其真實面目(賈文,2003)。因此,正確使用評估公共政策效果的計量經濟學方法對科學施政具有重要意義。

 

值得強調的是,我國尤其需要運用計量經濟學方法來評估公共政策。原因在於,改革已經進入深水區,我們不斷出臺一系列推進改革的公共政策,例如“營改增”、國有企業混合所有制改革、精準扶貧等。這些政策效果如何?哪些政策條款發揮作用了?對哪些企業和地區發揮作用了?回答這些問題才能夠根據政策效果不斷調整政策來推動改革的深化。過往的不少研究對這些問題的回答很容易流於泛泛之談,缺乏足夠的科學依據,亟須依據科學的方法來評估政策效果,為制定深化改革政策提供依據。

 

(二)目前公共政策評估計量方法運用方面存在的問題

 

當前部分研究者關於計量經濟學方法運用的恰當性和有效性方面存在著較嚴重的問題。具體而言,主要表現在兩個方面:

 

一是計量經濟學方法的濫用。計量經濟方法的運用主要目的在於利用計量經濟學模型對經濟現象和規律進行描述和分析,通過實證迴歸來驗證或反駁某種觀點或理論假設。如果計量經濟學偏離這一目的,即為濫用。目前,計量經濟方法濫用主要表現為兩種情況:一是簡單問題複雜化。在一些期刊發表的文章中,一些僅涉及較為淺顯的經濟現象,但研究者卻費盡心思構建複雜的計量經濟模型和運用所謂“前沿”計量經濟方法來分析,以此來展示研究水平和吸引眼球。二是模型設定隨意化。在公共政策的評估中,計量經濟學模型要基於一定的經濟學理論(理論機制)來設定,即放入計量經濟模型中的解釋變數,不管是主要解釋變數還是控制變數均應具有相應的現實經濟含義。相反,如果在設定計量經濟學模型時隨意加入變數,變數選擇缺乏充分的經濟含義,將導致計量經濟學方法的濫用。

 

二是不考慮計量經濟學方法適用前提的誤用。任何計量經濟方法的運用均具有一定的前提假設和適用範圍。例如,普通最小二乘法(OLS)要嚴格滿足線性模型、隨機抽樣、條件均值為0和誤差同方差等前提假設(Greene,2012);針對違反普通最小二乘法(OLS)估計方法運用前提的內生性問題,研究者通常使用工具變數法(IV)解決。這種方法的運用前提是需要找到一個或者多個工具變數與內生解釋變數相關而與因變數無關;這裡面尤其要注意弱工具變數問題,即工具變數與內生解釋變數弱相關。這是因為,弱工具變數導致區域性平均處理效應(LATE,Local Average Treatment Effect),進而有可能會使工具變數法估計的係數被擴大。姜緯(Jiang,2017)認為,在弱工具變數的情況下,工具變數的採用有可能造成只衡量了處理組一部分個體的平均處理效應(ATE,AverageTreatmentEffect),而非處理組的平均處理效應;相比於OLS迴歸,弱工具變數的運用會使得估計引數平均擴大了九倍,這一發現是針對三大金融學頂級期刊中255篇運用工具變數進行迴歸估計的論文進行的研究。

 

雙重差分法(DID)在公共政策評估中運用最多,這種方法的適用前提是實驗組和對照組具有相同時間趨勢。如果兩組不具有相同時間趨勢,就難以分清實驗組在政策實施前後變化的原因究竟是政策作用還是自身趨勢。只有在滿足這些條件和範圍時,運用相應的計量經濟學方法才能進行正確的係數估計,得出的公共政策評估結果才正確。否則,得出的評估結果要麼高估、要麼低估政策效果,進而導致政策力度錯誤的加大和降低,從而造成政策的誤用。正如王美今和林建浩(2012)所言,“不顧計量經濟學方法的假設前提和適用範圍而機械套用或隨意適用,均可能會導致‘無知者無畏’的計量方法的錯用和誤用”。

 

總之,無論是計量經濟學方法的濫用還是誤用,均會導致公共政策評估的偏差,進而可能對現實公共政策制定產生不良影響或者誤導。為了避免上述問題,需要研究者認真學習公共政策效果評估的計量經濟學方法,通曉這些方法的前提假設、適用範圍和技術要點。義大利計量經濟學家吉奧範尼·賽魯利(Giovanni Cerulli)2015年出版的著作《社會經濟政策的計量經濟學評估:理論與應用》(《Econometric Evaluation of Socio-Economic Programs: Theory and Application》,以下簡稱《計量經濟學評估》)可作為眾多研究者正確使用政策評估的計量經濟學方法的重要參考資料和系統學習手冊。

 

二、《計量經濟學評估》一書簡介

 

(一)本書背景和內容簡介

 

《計量經濟學評估》一書作為國際計量經濟學大師巴蒂·巴爾塔基(Badi Baltagi)和洪永淼、加里·庫普(Gary Koop)等主編《理論和應用計量經濟學前沿研究》的第49緝,由斯普林格出版集團(Springer)於2015年出版發行。這本書不僅涉及公共政策評估計量方法的理論探討,而且還給出了基於當前最為流行軟體包STATA的具體應用。

 

《計量經濟學評估》全書共分為四章:第一章主要介紹公共政策評估計量經濟學方法的統計學基礎和基本假設,提出與處理效應相關的樣本選擇偏差的概念和分類,並對不同選擇偏差給出校正方法。第二章主要介紹在可觀測變數選擇(Selection on Observables)或可見偏差(Overt Bias)假設下平均處理效應的估計方法,並對這一假設在公共政策評估分析中的意義和適用範圍做出了系統性說明;在這一章還具體介紹了迴歸校正法(Regression-adjustment)、匹配法(Matching)、復權法(Reweighting)等政策評估的常用方法。

 

第三章介紹了不可觀測變數選擇(Selection on Unobservables)或不可見偏差(Hidden Bias)假設下的平均處理效應的估計方法。這一章具體介紹了工具變數法(Instrumental Variables)、模型選擇法(Selection Models)和雙重差分法(DID,Difference-in-Difference)等三種適用不可見偏差假設的計量經濟學方法。第四章主要介紹了局部平均處理效應(LATE)和斷點回歸法(RDD,Regression Discontinuity Design)兩種關係緊密的近似準實驗估計法(Nearly Quasi-experimental Methods)。其中,將後者分為清晰斷點回歸(Sharp RDD)和模糊斷點回歸(Fuzzy RDD)。兩類方法的區分取決於公共政策的斷點劃分對個體影響的確定性差異,政策對個體有確定性影響的是清晰斷點回歸,對個體有不確定影響的叫模糊斷點回歸。

 

(二)總體評價

 

《計量經濟學評估》一書儘管只分了四章內容,但其整體邏輯結構清晰,系統性強,幾乎集合了公共政策效果評價所需用的所有常用方法。這本書內容豐富,知識層次性強,其具體內容通常基於某一基本假設展開,層層推進。不僅側重公共政策計量評估模型構建的理論探討,而且也特別注重這些計量方法的應用與實現。與很多傳統微觀計量經濟學教材相比,《計量經濟學評估》一書具有較強的政策研究針對性和可操作性,可作為研究者正確利用現代微觀計量經濟學技術進行公共政策評估的指導手冊。

 

此外,《計量經濟學評估》一書還具有相當的前沿性。當前的經濟學經驗研究正在從基本的統計上的假設檢驗轉向因果推斷,這種轉變甚至被稱為“以實驗設計為基礎的計量經濟學”或計量經濟學的“實驗學派”(Angrist等,2017)。社會科學研究進行因果推斷的最大難題是非隨機抽樣。公共政策所運用的群體通常也非隨機抽樣,群體特徵與其他群體明顯不同。如何有效地區分政策效應和自選擇效應,成為公共政策評估面臨的最大難題之一。這也就要求評估公共政策效果所用的計量經濟學方法與其他一般性地分析個人和企業問題所用方法之間的較大差異。這本書前瞻性地為公共政策評估提供了計量經濟學知識框架,彌補了一般計量經濟學教材在公共政策評估領域敘述不夠的不足。

 

三、《計量經濟學評估》一書的啟示:各種計量經濟學方法選擇與運用場景

 

(一)公共政策評估應準確把握計量經濟學方法選擇要點

 

公共政策種類多種多樣,且每種公共政策的實施環境,如時間、地點、人群等也不盡相同。這就要求研究者在對公共政策效果進行評估時,需要準確地把握每種計量經濟學評估方法的特徵和適用前提,以儘可能準確地評估出公共政策效果,不高估不低估,更要避免犯謬誤相關這樣的統計學錯誤。進行政策效果的評估以及政策產生作用的機制分析,對於政策的調整和推廣具有重要的現實意義。《計量經濟學評估》一書為選擇合適的公共政策計量經濟學評估方法,得出正確的評估結論提供了全面的指導。

 

賽魯利(Cerulli,2015)認為,要選擇一個合適公共政策計量經濟學評估方法,通常主要把握三個方面:第一,弄清公共政策實施的制度背景和政策內容,再與相應計量經濟學評估方法的標準要求相對比或匹配;第二,弄清公共政策實施對相關利益主體的影響機制,構建具有實際經濟含義的計量經濟學模型;第三,將公共政策的影響效應區分為直接效應和潛在間接效應。此外,對於有限的計量經濟學評估方法和模型,還有一些更為嚴格的要求,比如,要基於公共政策的預定目標設計模型,要有詳細或有效的可用資料,要對廣泛的受益和非受益群體做對比等等。

 

公共政策效果評估,實際上就是要估計出或計算出公共政策的處理效應。然而,現實是複雜的,評估面臨重重困難,比如我們經常遇到觀察值缺失、可觀測和不可觀測偏差、內生性和資料可得性等問題。因此,研究者要處理出相對可靠的處理效應結果,就需要很好地應對上述那些棘手的問題。賽魯利(Cerulli,2015)認為,對於不同的公共政策執行環境,研究者可以從三個維度去構建和選擇計量經濟學評估模型和方法,即識別假設、模型型別和資料結構(如表1所示)。

 

1.識別假設

 

在識別假設下,通常我們將影響偏差識別的原因分為兩種:可觀測變數選擇(形成可見偏差)和不可觀測變數選擇(形成不可見偏差),以此來選擇適用的計量模型。根據賽魯利(Cerulli,2015),迴歸校正法、匹配法和復權法適用於可觀測變數選擇的情況,工具變數法、模型選擇法和雙重差分法適用於不可觀測變數選擇的情況。斷點回歸法因其基於區域性實驗進行估計,故既可以適用於可觀測選擇情況,也適用於不可觀測情況。具體而言,清晰斷點設計適用可觀測變數選擇情況,模糊斷點法適用不可觀測變數選擇情況。

 

2.模型型別

 

在對公共政策進行計量經濟學評估時,通常可採用結構性模型和非結構性(簡易形式)模型兩大類。然而,不同計量經濟學評估方法,卻在不同形式模型下具有其特定的適用性。根據賽魯利(Cerulli,2015),如表1所示,工具變數法和模型選擇法只適用於結構性模型;而回歸校正法、匹配法、雙重差分法則僅適用非結構性(簡易形式)模型;斷點回歸法對於這兩類模型均可適用,其中模糊斷點回歸法適用於結構性模型,清晰斷點模型適用於非結構性(簡易形式)模型。

 

3.資料結構

 

對於公共政策計量評估所使用的資料主要有兩類:橫截面資料和麵板資料。賽魯利(Cerulli,2015)認為,在上文所列的七種方法中,僅雙重差分法適用於面板資料或,而其他估計方法均適用於一般橫截面資料(如表1所示)。在實際運用中,相比於橫截面資料,儘管面板資料能夠反映時間維度上的政策效應變化,但因其資料不易獲得,研究者們更多地使用橫截面資料。

 

(二)公共政策評估各種計量經濟學方法適用前提和應用場景

 

對於不同計量經濟學評估方法,均具有其各自的技術關鍵點,公共政策評價者只有準確把握這些關鍵點,才能有效避免計量經濟學評估方法誤用現象的發生。在本部分中,我們遵循《計量經濟學評估》一書章節順序,對不同計量經濟學方法進行評價並總結其應用前提和場景。

 

1. 迴歸校正法

 

這是一種廣義估計處理效應的一種方法,基於可觀測變數選擇的識別假設。實際上,這種方法僅在條件獨立假設(CIA,Conditional Independence Assumption)下才適用。通常我們可以使用引數和非引數方法估算出處理效應的大小,但這兩種處理方法各有利弊。資料稀疏(Sparseness)情況下非引數估計結果要比引數估計結果更可靠,而非引數估計卻又很難克服因為弱重疊(Weak Overlap)問題而帶來的識別問題。因此,對於迴歸校正法而言,使用引數估計還是非引數估計取決於現有資料的稀疏和重疊問題。

 

2.匹配法

 

匹配法是當前在非實驗環境下評估處理效應最為常用的方法之一(Stuart,2010)。從技術上說,匹配法是直接利用可觀測結果,而不是使用可觀測條件均值進行估計的迴歸校正法。相比於控制函式迴歸法(CFR,Control Function Regression)[1],匹配法具有三個優點:一是有很多具體匹配方法可供選用,以通過比較獲得相對穩健的結果;二是可以為處理組找到一個特徵相近的對照組,以獲得相對準確的處理效應估計;三是匹配原理較為簡單,即通過非處理組找到處理組在相反狀態下的潛在結果。具體實施過程中,需要注意以下四個方面的問題:

 

(1)關於處理效應的識別。匹配法可以很好解決弱重疊和弱平衡性(Weak Balancing)的問題,但不能消除不可觀測變數選擇偏差問題。匹配法要能識別出處理效應,通常要基於三個假設:一是條件均值獨立假設,即E(Y0|x,D)= E(Y0|x)和E(Y1|x,D)= E(Y1|x);二是重疊性假設,即0<p(x)<1,其中p(x)為傾向得分;三是平衡性假設,即匹配後處理組與控制組的協變數分佈相同。

 

(2)匹配估計量的大樣本特徵。匹配法作為一種特殊的非引數迴歸校正法,其獲得非觀測結果的方法使其漸進性質的識別成為問題。僅有一些匹配方法符合大樣本漸進性質,這其中主要包括核匹配(Kernel Matching)和近鄰匹配(Nearest-neighbor Matching)兩種方法。核匹配法在特定條件下的估計量可以滿足N-1/2漸進一致性,但並不滿足有效性[2];近鄰匹配法的估計量不僅可以滿足一致性和漸進正態分佈,還可以滿足有效性。

 

(3)精確匹配與維度問題。通常情況下,我們可以採取精確匹配方法來實現匹配,但這僅限於協變數維度較少時。如果協變數維度較多,而樣本容量又較小時,精確匹配將變得不可行,即所謂的維度問題(Dimensionality Curse)。為了克服這一問題,羅森鮑姆和魯濱(Rosenbaum & Rubin,1983)建議將多維協變數轉換為傾向得分這一單一維度進行匹配。

 

(4)傾向得分匹配。在運用傾向得分匹配法時,有兩個特別重要的特性:平衡性(Balancing)和無混淆性(Unconfoundedness)。前者是在給定傾向得分p(x)的條件下,處理變數D與其他變數x是獨立的,這一特性表明了當傾向得分被正確處理後,按照傾向得分劃分匹配個體和按照協變數x劃分匹配個體是無差別的。因此,在實證研究中檢驗平衡性是否成立,是檢驗傾向得分是否正確地用於劃分匹配個體的重要標準。無混淆性是指,給定p(x),處理變數D對於潛在結果的影響是可以忽略的,這一特性是否成立是檢驗是否窮盡協變數x的標準。傾向得分匹配法(PSM)在研究中被廣泛應用,但需要注重其適用性和缺陷:一是PSM需要比較大的樣本容量才能實現高質量的匹配;二是PSM要求處理組與控制組之間要有共同的取值範圍(重疊性),否則可能丟失較多觀測值,導致匹配成功變數較少;三是PSM雖然控制了可觀測變數,但仍然可能存在非觀測變數選擇問題,仍存在不可見偏差。

 

3. 復權法

 

復權法是在可觀測變數選擇情況下估計處理效應的一種有效方法,與上文的傾向得分匹配法之間有著密切關係。復權法的基本原理是:由於處理組個體不是隨機分配的,處理組個體和控制組個體之間可能呈現著非常不同的特徵,這樣也可能導致協變數x出現不平衡分佈。為了構建平衡的協變數分佈,通常針對不同觀測值賦予適當權重並且運用加權最小二乘法估計平均處理效應。相比於其他公共政策計量評估方法,復權法不依賴於對潛在結果m1(x)和m0(x)的估計,而僅依賴於傾向得分p(x)的估計。但這種方法也有一定限制,因為復權估計量對傾向得分估計方程設定較為敏感,如果方程設定存在問題,可能會導致嚴重的估計偏差。

 

4.工具變數法

 

工具變數法是處理不可觀測變數選擇(不可見偏差)而引起內生性問題的最有效方法之一。應用工具變數法,首要的是能找到至少一個工具變數,其要與處理變數D直接相關,但又不能與因變數(結果)Y相關。通常情況下,我們可以選擇二階段普通最小二乘法、Probit(或Logit)最小二乘法和Probit(或Logit)二階段最小二乘法作為工具變數法運用的具體迴歸方法。但需要注意的是,第一種方法若遇到弱工具變數問題,會降低處理效應迴歸結果的精確度,但仍然是滿足一致性的;第二種方法基於處理變數D的Probit或Logit迴歸量對選擇方程進行迴歸,其處理效應迴歸結果相比第一種方法具有更好的有效性,但需要依賴Probit或Logit迴歸方程的正確設定;第三種方法迴歸並不具有第二種方法的依賴性,即使Probit或Logit迴歸方程設定不正確,仍能滿足一致性,但在一定程度上損失了有效性。此外,我們在運用工具變數法時,要特別注意弱工具變數問題,即工具變數與因變數Y之間不完全外生或與處理變數之間的相關性較差,這可能導致處理效應的迴歸結果不一致和較差的有效性(Bound等,2005)。

 

5.模型選擇法

 

模型選擇法作為處理資料截斷或不可觀測變數選擇問題的一種方法,近年被逐漸廣泛應用於公共政策的效果評估中(Cerulli,2015)。在對選擇模型進行迴歸時,由於不同的不可觀測變數之間可能存在相關性,這會導致處理效應估計出現偏差。要獲得一致的處理效應估計,通常要基於不同誤差項之間的聯合正態分佈。在聯合正態分佈的假設下,可以利用極大似然估計法,這樣可以獲得一致且有效的引數估計量。但是,一般情況下極大似然估計可能會面對收斂問題,在迴歸方程存在離散控制變數時表現尤為突出(Woodridge,2010)。這時,採用兩步法可能是一個有效的校正方法。

 

6.雙重差分法

 

雙重差分法也是一種處理內生性問題的有效方法(Abadie,2005;Angrist和Pischke,2008)。在應用中,這種方法因不需像工具變數法那樣需要尋找工具變數,也不需像模型選擇法那樣附加嚴格的分佈假設,當前已經成為公共政策效果的計量評估中最重要、應用最廣泛的方法。雙重差分法適用於處理組和控制組在公共政策執行前後的資料均可得的情況,其基本原理是在公共政策執行前為處理組個體找到相同或相似的非處理組(控制組)個體,以這些非處理組個體在政策實施時點後的結果作為處理組個體在未進入處理組時的潛在結果參照,通過對比得到公共政策的處理效應。為了獲得處理組個體的潛在結果,通常我們要基於可得的協變數考察處理組和控制組個體之間是否具有共同趨勢(Common Trend)。相反,如果處理組和控制組之間不具有共同趨勢,將會嚴重影響處理效應迴歸結果的準確性。

 

7.斷點回歸法

 

斷點回歸法是另一種準自然實驗的估計方法,近年經常出現在公共政策因果效應評估的文獻中。斷點回歸法適用的基本條件是:存在一個驅動變數(Forcing Variable),以其某一取值作為門檻劃分處理組和非處理組個體。在門檻值之上的個體進入處理組,門檻值之下的個體進入非處理組。門檻值的取值處會出現政策斷點,通過選擇適當的門檻值臨界區間,比較處理組和非處理組因變數的平均值,即可獲得公共政策的處理效應。根據政策變數與驅動變數之間是確定關係還是隨機關係,可以將斷點回歸法分為清晰斷點法和模糊斷點法,前者的處理變數會在門限值處出現嚴格的“跳躍”,而後者則只形成了模糊的“跳躍”。

 

斷點回歸法在具體應用中,通常需要符合四個前提:一是準確識別斷點。準確識別的一個標準是在門檻值附近是否符合自然實驗的隨機抽樣標準,具體可以計算政策變數D和協變數x在門檻值左右兩側的差別。通常可以接受的斷點為政策變數D在門限值兩側具有明顯差異,而協變數x在門檻值兩側的差異不顯著;二是斷點不能被人為操控,即不能通過人為修改門檻值來改變斷點的位置。三是最優頻寬的選擇。頻寬的選擇實際上涉及估計精度和估計偏差的平衡。因為頻寬越大,迴歸可用的觀測值越多,可以提高迴歸的有效性,但同時偏離門檻值較遠的個體也就越多,增加了估計偏差。具體可以利用插入法(Plug-in)和交叉驗證法(Cross-validation)獲得最優頻寬。四是額外協變數選擇。一個變數是否能夠作為協變數進入迴歸方程,其標準是在門限值處不會出現統計上顯著的斷點。

 

四、總結

 

科學施政在當前“三期疊加”的經濟新常態下顯得尤為重要,科學施政的前提是科學評估以往各種改革政策的效果,為政策調整提供決策依據。近三十年來,計量經濟學方法被廣泛應用於公共政策效果的評估中。然而,在這項工作中,計量經濟學方法和模型經常出現被濫用和誤用的現象,這可能會得出錯誤的政策效果評價,會誤導政策制定者繼續推行甚至出臺貽害百姓的“劣政”和“惡政”。為了避免這一問題,研究者需要系統學習並且要準確把握各類公共政策計量經濟學評估方法的適用前提和技術要點,力求得出正確的政策評價結論。賽魯利(Cerulli,2015)的《社會政策的計量經濟學評估:理論與應用》一書系統介紹了公共政策評估的各類計量經濟學方法,如迴歸校正法、匹配法、復權法、工具變數法、模型選擇法、雙重差分法、斷點回歸法等,不僅介紹了這些方法的適用前提和適用範圍,而且說了基本統計學原理和軟體運用,很好地填補了公共政策評估計量經濟學著作的空白,可為研究者提供很好的應用參考。這本著作必將為研究者科學地評估我國各種改革政策的效果提供幫助,從而為政府制定政策提供智力支援。