第(di)一部分(fen):初識Stata與數據讀入
1)熟悉界面
2)尋求幫助(zhu)(在線(xian)幫助(zhu)、搜索幫助(zhu)等)
3)DOS命令(cd、dir、erase、rm、shell等(deng))
4)Winexec調(diao)用windows系統相關操作
5)copy命(ming)令(文件(jian)操作、網頁源代(dai)碼讀取等)
6)Stata常用(yong)30個命令介(jie)紹
7)日期(qi)定(ding)義(日期(qi)格式設(she)置、日期(qi)函數等)
8)函數(字符串(chuan)函數、隨機(ji)函數、編程(cheng)函數等)
9)egen函數與常(chang)見統計量
10) txt、csv、excel等格式文件讀入
11)Wind交易數據整(zheng)理案例
12)基金(jin)經理變更數據整理案例
第二部分:宏與循環
1)local與global概念與基本操作
2)宏擴展函數
3)while、foreach、forvalue循(xun)環
4)跳出(chu)循環的continue 和continue, break
5)批量處理多(duo)(duo)個目錄下的多(duo)(duo)個文(wen)件(fs命(ming)令)
6)批量(liang)處理多(duo)個變量(liang)的多(duo)個取值(levelsof命令)
7)NBER工作論(lun)文下載案例(li)
8)上交所(suo)年(nian)報爬取綜合案(an)例
9)CSMAR交易和(he)財務數據整理案例
第三部(bu)分:數(shu)據(ju)庫操作
1)數據的(de)縱向(xiang)合(he)并、橫向(xiang)合(he)并與長寬變換(huan)
2) 工企數(shu)據庫運用(yong)案例(li)
3) Wind財務數據整理案例
4)美(mei)國流行歌曲目錄(lu)整(zheng)理案例
5)起死回生命令(preserve與restore)
6) CSSCI期刊目錄整理(li)案例
7) label命令介紹
8) labelsof、label 的宏擴(kuo)展函數
9)字(zi)符(fu)串(chuan)處理(li)(關鍵(jian)詞、替換、提取等)
第四(si)部(bu)分(fen):Post命令(ling)
1)post原理
2)定義post
3)用post計算股價同步(bu)性和Beta
4)基于網絡(luo)數據的事件研究
5)股本變更(geng)數據整理案例
第五部分(fen)(fen):回歸分(fen)(fen)析及(ji)結果輸出
1)putdocx命令輸出內容(rong)至(zhi)word文(wen)檔
a)編輯docx文件中的文字內容
b)輸(shu)出并編輯表格內容
c)輸出內存中(zhong)的list結果
d)輸出矩陣
e)輸出繪圖
2)putdocx命令相(xiang)關(guan)案例
a)輸出十進位(wei)制(zhi)下的漢字(zi)unicode編碼
b)結合常用漢(han)(han)字生成隨機漢(han)(han)字組成的段落(luo)
c)爬取并輸出陜西省人大代(dai)表(biao)信息
3)實證結果輸出
a)描述性統計信(xin)息:sum2docx
b)分組均值t檢驗:t2docx
c)相關系(xi)數矩陣(zhen):corr2docx
d)回歸結果:reg2docx
4)實證結果(guo)輸出完(wan)整展(zhan)示(shi)
高級班課程大綱
第一部(bu)分:正則表達(da)式
1)正則表達式基本函數介紹
a)ustrregexm()
b)ustrregexs()
c)ustrregexrf()與ustrregexra()
2)正則表(biao)達式元字符介(jie)紹(shao)
a)基本元字符
b)數量元字符
c)位置元字符
d)前后查找
e)特殊字(zi)符元字(zi)符
f)回溯引用
g)unicode編碼
3)正則表達式匹配模式
a)貪婪模式
b)懶惰模式
4)正則表達式例子
a)郵編提取
b)英文姓(xing)與(yu)名的拆(chai)分
c)CSSCI數據預處(chu)理
d)百度新聞數量
e)城市名稱提取
f)pdf表格數據的提(ti)取
g)英文姓(xing)名的拆分(fen)
h)用正(zheng)則表達式提取日期
i)北大(da)法寶裁判文書信息提取
5)正則(ze)表達式相關(guan)命令
a)moss命(ming)令與簡單的詞頻統計
b)subinfile命(ming)令對文本文檔(dang)進(jin)行操作
第二部分:網絡爬蟲
1)爬蟲初步
a)新浪高管任職(zhi)數據抓(zhua)取
b)NBER Working Paper信(xin)息(xi)的抓取
c)百(bai)度地圖api調用
2)尋找真實鏈接
a)和訊網港(gang)股(gu)數(shu)據
b)深交所(suo)信息(xi)披(pi)露質量
c)百度(du)新聞逐(zhu)年數據獲取
3)調用curl
a)新(xin)浪財(cai)經(jing)港股數據(ju)獲取(qu)
b)環(huan)保部AQI獲取
第三部分:文本分析
1)分詞原理
2)分詞的實現
a)ustrwordcount()和ustrword()
b)調用Python的(de)jieba和(he)pynlpir
c)Bosonnlp的(de)API
d)詞頻統計
3)高(gao)亮輸出(chu)文章重點
4)詞云圖的實現
5)情感分析原理
6)情感分析的實現
a)年(nian)報MDA語調分析
b)構建詞庫計算(suan)情感值
c)大眾(zhong)點(dian)評日(ri)料(liao)評論(lun)情感分析
第四部(bu)分:實證研究方法
1) 工(gong)具變量方法(IV)
a)工具變(bian)量方法介(jie)紹(shao)
b)現代IV方(fang)法(fa):LATE
c)IV方法(fa)應用一(yi)般步驟:論文案例與Stata實操
2) 斷點回歸方法(fa)(RD)
a)RD方法(fa)思想和(he)方法(fa)演(yan)進
b)精準斷點(Shape RD)與模糊斷點(Fuzzy RD)
c)RD方法應(ying)用一般步驟:論文(wen)案(an)例與Stata實操
3) 倍差法(DID)
a)DID模型設定、參數估計和假(jia)設檢驗
b)DID方法與(yu)固定(ding)效應估計(ji)(FE):聯系和區別
c)IV方法應用一般步驟:論文(wen)案例與Stata實操
d)DDD(三重差分)方法介紹與應(ying)用
e)DDD論(lun)文案例(li)與Stata實操 |