1. 程式人生 > >Stata專題:2019寒假(2019.1.17-27)

Stata專題:2019寒假(2019.1.17-27)

Stata現場班-2019寒假


A. 課程概要

時間: 2019 年 1 月 17-27 日
地點: 北京 中國青年政治學院
授課教師: 連玉君 (初級+高階) || 江艇 (論文班)


》》》歡迎加入 [STATA學習-連享會] QQ群 225012362,一同學習 Stata!

》》》申請時,請填寫如下備註資訊:Stata連享會邀請-學校簡稱-姓名




B. 講授嘉賓簡介


連玉君

連玉君
連玉君 ,經濟學博士,副教授,博士生導師。2007年7月畢業於西安交通大學金禾經濟研究中心,現任教於中山大學嶺南學院金融系。主講課程為“金融計量”、“計量分析與Stata應用”、“實證金融”等。已在《China Economic Review》、《經濟研究》、《管理世界》、《經濟學(季刊)》、《金融研究》、《統計研究》等期刊發表論文60餘篇。連玉君副教授主持國家自然科學基金專案(2項)、教育部人文社科基金專案、廣東自然科學基金專案等課題專案10餘項。目前已完成 Panel VAR、Panel Threshold、Two-tier Stochastic Frontier 等計量模型的 Stata 實現程式,並編寫過幾十個小程式,如 xtbalance

, winsor2, bdiff, hausmanxt, ttable3, hhi5, ua等。連玉君老師團隊一直積極分享Stata應用中的點點滴滴,開設了 [Stata連享會-簡書][Stata連享會-知乎] 兩個專欄,並定期在微信公眾號 (StataChina) 中釋出精彩推文


江艇

江艇
江艇,香港科技大學商學院經濟學博士,中國人民大學經濟學院副教授,人大國家發展與戰略研究院研究員,人大微觀資料與實證方法研究中心副主任,美國哥倫比亞大學商學院訪問學者。主要研究領域為經濟增長與發展、城市經濟學、新政治經濟學,在Economics LettersReview of Development Economics、《經濟研究》、《管理世界》、《世界經濟》等國內外著名學術刊物上發表多篇論文,曾應邀在多所高校講授“應用微觀計量經濟學”短期前沿課程並廣受好評。



1. Stata初級班


  • 授課嘉賓: 連玉君 (中山大學)
  • 時間: 2019年1月17日-19日 (三天)
  • 地點: 北京市海淀區 中國青年政治學院
  • 課程詳情: http://www.peixun.net/view/307_detail.html
  • 授課安排
    (1) 授課方式:採用 Stata15 軟體,中文多媒體互動式授課方式
    (2) 授課時間:上午 9:00-12:00,下午 14:00-17:00 (17:00-17:30答疑)。

1.1 課程導引

實證分析中,最傷神和耗時的事情莫過於研究設計和資料處理。在以往的授課中,很多同學和老師都是在聽完了高階班的課程以後,又返回頭來聽初級班的內容。他們有一個共同的感觸就是,沒有一個紮實的基礎,以及對計量經濟學和Stata整體架構的認識,後續的學習成本會越來越高。

在初級班中,我力求將三天的課程設定成一個比較完整的體系,目的有二:

其一,希望大家經過三天的學習(尚需另外花費1-2個月的時間演練吸收),能對基本的統計和計量分析方法有所掌握,能讀懂多數期刊論文中使用的分析方法;

其二,希望諸位能建立起 Stata 的基本架構,熟知 Stata 能做什麼、如何做?以期為後續學習打下寬厚紮實的基礎。

翻閱 Top 期刊上的論文,你會發現多數論文並沒有使用非常複雜的方法,關鍵在於論文的想法或視角比較獨特,並使用了恰當的方法來論證。這裡的關鍵在於研究設計,而這在目前的計量教科書中鮮有涉及。為此,本次研討班突出兩個特點:一方面,我會努力把基礎知識講解透徹,進度上不求快;另一方面,我在每個專題中都會提供了 2-3 篇比較經典的論文,展示這些方法的合理應用。

內容安排上,基本上遵循了由淺入深,循序漸進的原則。

第 1-3 講依序介紹 Stata 的基本用法、資料處理和程式編寫,學習這些內容無需太多的計量經濟學基礎,但對於提高實證分析能力和分析效率,大有裨益。

第 4-5 講介紹文獻中使用頻率最高的線性迴歸模型,包括 OLS 的原理、結果的解釋,以及虛擬變數和交乘項的使用等。對於這些內容的深刻理解和熟練掌握,構成了後續,多種主流實證模型的基礎,例如,目前文獻中廣泛使用的固定效應模型 (FE),倍分法 (DID),斷點回歸設計 (RDD) 等方法,本質上就是在傳統的線性模型基礎上,增加一些虛擬變數或交乘項,配合巧妙的研究設計,來實現對不可觀測的個體效應的控制,以及對政策效應的估計。

第 6 講介紹固定效應模型 (FE),是第 4 講和第 5 講內容的延伸和應用,也是目前解決遺漏變數和內生性問題比較常用的方法。

具體說明如下:

第 1-2 講中,我會以一篇文章為例項,說明 Stata 的基本語法結構,並對資料處理過程中的關鍵問題進行介紹,如離群值的處理、文字變數的處理等。就我個人的經驗而言,資料處理能力的高低直接決定實證分析的效率,而對於離群值的處理是否妥善會直接影響全文結果的穩健性,是多數人不夠重視但卻至關重要的問題。

第3講介紹 Stata 程式設計的基礎知識。但凡提及寫程式,很多人都會產生恐懼心理,其實,一旦掌握了最基本的原理和語法格式,Stata 中的程式設定並沒有想象的那麼困難。更為重要的是,對於多數人而言,由於並不需要寫完整的 ado 文件,因此只需要學會最基本的條件語句和迴圈語句即可,難度又會進一步降低。

第 4 講和第 5 講介紹實證分析中的模型設定和結果解釋問題。很多人會覺得 OLS 很簡單,但 Top 期刊中使用最多的仍然是 OLS,如何合理的構建模型、解釋結果便成為實證分析中必須掌握的。我精選了大家經常面臨的幾個專題並結合論文進行講解,包括:虛擬變數的使用、交叉項的使用和解釋、分組迴歸的合理設定和假設檢驗,還有在經濟學和金融學中相對較新的 R2 貢獻度分析。

第 6 講介紹了目前廣泛應用的 面板資料模型。由於面板資料的獲取越來越方便,目前多數研究中使用的都是面板資料。在講解這些模型的基本思想和估計方法的過程中,筆者會將重點放在模型含義和應用範圍上來。例如,對於同一筆資料而言,何時採用 OLS 進行估計,何時採用 FE 估計?不同的方法之間有何差異和關聯?結果背後的經濟含義如何解讀?掌握這些方法有助於大家合理控制內生性問題,以便得到更為可信的結論。

1.2 課程大綱(Stata初級班)

連玉君主講-Stata寒假2019-初級班課程大綱



2. Stata高階班


  • 授課嘉賓: 連玉君 (中山大學)
  • 時間: 2019 年 1 月 21 日- 23 日 (三天)
  • 地點: 北京市海淀區 中國青年政治學院
  • 課程詳情: http://www.peixun.net/view/307_detail.html
  • 授課安排
    (1) 授課方式:採用 Stata15 軟體,中文多媒體互動式授課方式
    (2) 授課時間:上午 9:00-12:00,下午 14:00-17:00 (17:00-17:30答疑)。

2.1 課程導引

Stata高階班包括6個專題,重點講述各類面板模型以及一些新近發展的內生性處理方法。主要涉及如下幾個方面的內容:
(1) 面板模型:動態面板、面板VAR和麵板門檻模型(第1講和第2講),前者在刻畫變數之間的動態關係,以及政策衝擊方面非常有用;而後者則在近年中分析結構變化方面得到了廣泛的應用。
(2) 內生性問題,包括處理效應模型(第3講);斷點回歸分析(RDD, 第4講);合成控制法(SCM, 第5講)。
(3) 論文寫作和課題申請專題。

Stata 高階班包括 6 個專題,重點講述各類面板模型以及一些新近發展的內生性處理方法。主要涉及如下幾個方面的內容:

  • 面板模型: 動態面板模型、面板VAR模型和麵板門檻模型(第 1 講和第 2 講),前者在刻畫變數之間的動態關係,以及政策衝擊方面非常有用;而後者則在近年中分析結構變化方面得到了廣泛的應用。
  • 內生性問題: 包括處理效應模型(第 3 講);斷點回歸分析(RDD, 第 4 講);合成控制法(SCM, 第 5 講)。
  • 論文寫作和課題申請專題

課程特色和內容:

時至今日,多數領域使用的都是面板資料,也對相關的模型提出了越來越高的要求。在 第 1 講 中,我將介紹專門用來分析變數自身以及多個變數之間動態關係的動態面板資料模型和麵板 VAR 模型。這兩類模型在經濟增長、公司金融、國際貿易、勞動經濟學等領域都得到了廣泛應用。此外,在實證分析中,經常要處理結構變化問題,目前主要使用交叉項和分組迴歸等方式,但這兩種設定方法都需要預先知道或假設結構變化點,使其合理性頗受質疑。而 第 2 講 中介紹的面板門檻模型則基於“讓資料說話”的原則,自動搜尋結構變化點,從而克服了上述方法的侷限。

顯然,內生性問題是困擾我們這個時代的學者的一個普遍而棘手的問題。為此,高階班將通過三個專題全面深入地介紹了內生性問題。

第 3 講 介紹用以解決自我選擇偏誤導致的內生性問題的模型。一是處理效應模型,主要應對解釋變數中所包含的 0/1 內生變數;二是 Heckman 選擇模型,主要應對被解釋變數觀察值非隨機缺失問題。翻閱最近2年發表於《經濟研究》、《管理世界》、《經濟學(季刊)》等期刊的文章,這兩類模型在處理內生性問題方面得到了日益廣泛的應用。

第 4 講第 5 講介紹的斷點回歸設計方法 (RDD) 以及合成控制法 (SCM) 則是近年來被公認為“最為乾淨”的準實驗方法,在政策評價領域得到了特別的青睞。

在政策評價領域,長期存在著一個空白地帶:有些政策只針對某一個省或某一個州實施,此時 DID,PSM 等方法都不再適用,因為我們只有一個孤零零的實驗物件!

第 5 講 中,Abadie, Diamond, and Hainmueller (2010, JASA) 提出的合成控制法,可以很好的解決了這類問題。他們研究了「加州」於 1989 年實施的禁菸法案的政策效果。其基本思想是,使用其他 38 個未實施禁菸法案的州的加權平均來虛構一個「合成加州」,進而對比分析「加州」和「合成加州」在 1989 年之後香菸消費量的差異,這就是政策效果!作者還進一步的使用的組合檢驗,以及「安慰劑檢驗」來確定這一結果的統計顯著性。

第 6 講 中,我將根據個人的研究經歷,分享做一篇規範的實證研究的經驗。主要內容包括:論文的選題、研究貢獻的挖掘和陳述,以及研究設計等。

作為經濟研究、管理世界、金融研究、會計研究、世界經濟等期刊的匿名審稿人,我發現很多論文雖然有很好的想法,但往往因為如下原因而無法通過評審。其一,缺乏嚴謹規範的文獻綜述,使得讀者難以判斷文章的邊際貢獻;其二,實證分析部分雖然使用了比較前沿的方法,但基礎工作不夠紮實,如樣本的篩選過程不嚴謹、離群值未妥善處理、指標的選取過於隨意、結論的穩健性值得懷疑等;其三,實證結果的呈現方式不妥,分析不夠深入,論文的排版不夠精緻,導致讀者的第一印象比較差。

對於申請課題,我感觸良多。

我於 2007 年開始自己的教師生涯,此前沒有申請過任何課題,致使我在 2008 年的申請的四項課題全軍覆沒。痛定思痛,我收集了多位前輩的標書,反覆研究,發現寫論文與寫標書存在很大的差異。

論文力求清晰地呈現和解釋你的研究假設和研究結果,而課題申請書則需要強調你所研究的問題的重要性和特色,這是一個更高層次的問題。由於是研究計劃,不要求細節上的準確性,但問題要明確、思路要清晰,結構要合理,論證要有說服力。因此,很多時候是研究工作已經完成了十之八九,已經對問題有非常深刻的認識了,才能反向思維把標書寫好。任何故弄玄虛、試圖矇混過關的想法都不可行。

2009 年,我順利獲得教育人文社科基金和廣東自然科學基金資助,2010 年進一步獲得國家自然科學基金青年專案資助,此後又獲得了多項課題的資助,並於 2016 年獲得國家自然科學基金面上專案資助。事實上,瞭解了不同型別課題基金的特點,再輔以紮實的前期研究基礎,獲得資助並不是遙不可及的事情。

相對於初級班,高階班的內容在難度上,雖然難度有所增加,但思路和架構更為清楚。在學習方法上,高階班與初級班有所不同。初級班的主要目的在於打下紮實的基礎,建立一個完整的學習架構,而在高階班中,我則建議大家重點學習與自己研究方向密切相關的方法,通過廣泛閱讀文獻來掌握這些方法在不同場景下的應用條件和變通方法。

2.2 課程大綱(Stata高階班)

連玉君主講-2019高階班-課程大綱



3. Stata論文班


  • 授課嘉賓: 江艇 (中國人民大學)
  • 時間: 2019 年 1 月 25 日- 27 日 (三天)
  • 地點: 北京市海淀區 中國青年政治學院
  • 課程詳情: http://www.peixun.net/view/307_detail.html
  • 授課安排
    (1) 授課方式:採用 Stata15 軟體,中文多媒體互動式授課方式;
    (2) 授課時間:上午 9:00-12:00,下午 14:00-17:00 (17:00-17:30答疑)。

3.1 課程導引

在過去幾期的培訓結束後,我們都會收集學員的建議。大家都非常迫切地希望能夠精講一些經典論文的實證分析過程,對自己在初級和高階班的所學有一個整體的認知。

對於已經開始嘗試獨立開展研究工作的學員而言,大家明顯地感覺到,研究設計是最棘手的問題。在之前有導師指導或帶領的情況下,研究主題和研究內容都是預先給定的。此時,完成一篇論文相當於在做一個命題作文,而一旦開始獨立門戶,最大的挑戰是找到合適的研究主題,做一個可靠的研究設計。這其實也是實證分析工作中最難的部分。

在本次的學術論文班中,我們將挑選一些發表於頂尖期刊(包括 AER,QJE,JHR 等)上的代表性論文,詳細講解每篇論文的實證分析過程,剖析作者的研究思路、研究設計、內生性問題的處理、穩健性檢驗,以及對結果的詳細剖析。我們會提供重現每篇論文所需的所有資料和程式檔案,以便保證各位可以在聽課後反芻,並將這些論文中的分析方法遷移到你的研究中去。

精講並重現經典論文,有如下兩方面的好處

一方面,這些論文的研究設計都非常出色,我們可以借鑑並在博採眾長的基礎上,不斷改進自己的研究設計思路和方法。只有去拆解和重現這些論文,才能夠感受到作者的思考過程和寫作意圖,從而從實質上提高我們自身的分析和研究能力。

另一方面,這些論文涵蓋了目前實證分析中的主流方法,更為重要的是,每一篇論文通常會綜合使用多種分析方法,這對於我們理解和靈活應用初級班和高階班所學的計量方法大有裨益。

3.2. 專題介紹:Stata 學術論文班

下面對課程中涉及的主要論文作簡要介紹,以便各位瞭解此次課程的重點所在。

第 1 講中介紹的 Rajan and Zingales (1998) 的論文是互動項模型的經典之作。該文討論金融發展如何通過放鬆企業的外部融資約束而促進增長,並用法律起源作為金融發展水平的工具變數。文章的計量模型的設定非常簡潔,但行文論證極其精彩。我們不但可以學到如何用交叉表直觀展示研究結果、如何構造指標來傳達結果的經濟含義;而且可以學到為什麼要使用外生的調節變數來討論因果關係的作用機制;更可以感受到作者為了排除各種競爭性假說所做的巧妙努力。

第 2 講介紹的 Nunn and Wantchekon (2011) 的論文是展示工具變數方法各種技巧的洋洋大觀之作。該文討論歷史上的非洲奴隸貿易如何型塑了今天人際間的不信任,並用種族到海岸線的距離作為奴隸貿易強度的工具變數。文章先使用了 OLS 方法,然後評估 OLS 估計結果在多大程度上受到選擇性偏誤的影響;接著使用了工具變數方法,並通過“無第一階段”證偽檢驗 和“工具變數疑似內生”證偽檢驗來論證工具變數的合理性;最後展示瞭如何通過精妙的控制來討論因果關係的作用渠道。

第 3 講介紹的 Imbens (2015) 是由匹配方法的扛鼎人物 Imbens 所分享的關於如何正確使用匹配方法的最新指南。我們知道,匹配方法為數眾多,而且可以靈活操縱的空間也很大,匹配變數的選擇更是有很多講究,這使得匹配估計的結果往往不太穩健。我們從匹配方法的工作原理講起,深入剖析其與 OLS 的異同,向學員傳達匹配方法的思想實質。然後根據 Imbens 的建議,從樣本平衡性檢驗傾向得分估計、樣本刪截、估計方法選擇等各個環節逐一講解匹配方法的操作細節。

第 4 講介紹的 Aidt and Franck (2015) 是一篇在截面資料中綜合運用 OLS 方法、匹配方法和工具變數方法的頂刊文獻。該文討論 1830 年代英國各地區斯溫暴動的激烈程度如何形成了可置信的革命威脅,推動了代表新興階級的輝格黨在議會勢力的壯大,最終促成了改革法案的通過。從這篇文章中我們不但能夠回顧之前所學內容,而且還能學到安慰劑檢驗證偽檢驗等新的論證技巧。

第 5 講介紹的 Nunn and Qian (2011) 是一篇典型的運用連續型處理與多期雙重差分方法的經典文獻。該文討論土豆這一起源於新大陸的農作物在舊大陸的推廣如何促進了人口增長和城市化。文章用一國種植土豆的適宜程度作為該國接受 “政策干預” 的強度,用土豆在舊大陸的大規模推廣來確定“政策干預”的時點。這篇文章所運用的方法比離散型處理或兩期問題更具一般性,而且 基準估計靈活估計滾動估計變動處理時點變動處理組 等實證手段也極具借鑑意義。

第 6 講 介紹的 Fowlie et al. (2012) 是雙重差分方法與匹配方法相結合(PSM+DID)的代表作。我們首先介紹雙重差分方法與匹配方法相結合的兩種模式,其一是將匹配方法視為資料預處理手段,構造匹配樣本再進行雙重差分估計,其二是將多期問題轉換為兩期問題,先構造差分結果,然後進行匹配估計。前者的重點在第3講中已經涉及,本講介紹的論文則是對後者的應用。文章的一大亮點是嘗試對“無溢位效應”和“無混淆性”這兩大基本識別假設進行了間接檢驗。

需要特別強調的是,論文班的學習尤其要求大家要足夠努力。最基本的要求是,在開課之前,要認真研讀每一篇論文,瞭解其研究背景、研究思路、計量方法和主要結論。雖然這些論文的研究主題與諸位所在領域可能會有比較大的差異,但是,大道至簡,從這些論文中主要是學習計量方法的合理應用和研究設計的思想。

最後的話

需要特別強調的是,雖然論文班的學習並不要求紮實的計量基礎,但卻要求大家要足夠努力。最基本的要求是,在開課之前,要認真的研讀每一篇論文,瞭解其研究背景、研究思路、計量方法和主要結論。上課過程中,我會隨機抽取學員來回答一些問題。同時,也建議大家在開課前務必掌握文獻的檢索方法,學會使用百度學術、谷歌學術和 Endnote 等文獻管理軟體,這助於追蹤我們講解的每篇論文的後續進展,以便發掘新的研究主題。

雖然這些論文的研究主題與諸位所在領域可能會有比較大的差異,但是,大道至簡,從這些論文中主要是學習計量方法的合理應用和研究設計的思想。

3.3 課程大綱

江艇主講-Stata寒假2019-論文班課程大綱

時間: 2019 年 1 月 17-27 日
地點: 北京 中國青年政治學院
授課教師: 連玉君 (初級+高階) || 江艇 (論文班)


》》》歡迎加入 [STATA學習-連享會] QQ群 225012362,一同學習 Stata!

》》》> 申請時,請填寫如下備註資訊:Stata連享會邀請-學校簡稱-姓名