網(wǎng)友評分:
4.1分
stata是一款非常專業(yè)的電腦數(shù)據(jù)分析類軟件。該版本集數(shù)據(jù)分析、數(shù)據(jù)管理以及繪制專業(yè)圖表等多種功能于一體,該版本為全新的17.0版本,在功能體驗(yàn)上進(jìn)一步得到提升,提升了軟件速度以及加入了雙重差分法的官方命令、久期數(shù)據(jù)的新命令并且還整合了Python、Java等,從而就可以滿足用戶們在相關(guān)方面的辦公需求。
1、雙重差分法的官方命令
“雙重差分法”(Difference-in-differences,簡記DID)或許是最常用的計(jì)量方法。怎么能沒有DID的Stata官方命令呢?為此,Stata 17及時地推出了DID的官方命令xtdidregress;其中,“xt” 表示這是適用于面板數(shù)據(jù)的命令。
除了進(jìn)行常規(guī)的 DID 估計(jì),命令xtdidregress還允許最多指定三個“分組變量”(group variables),或兩個分組變量與一個時間變量,從而進(jìn)行“三重差分法”(Difference-in-differences-in-differences,簡記DDD)的估計(jì)。
另外,針對“重復(fù)截面數(shù)據(jù)”(repeated cross-sectional data),即所謂“準(zhǔn)面板”(pseudo panel data),Stata 17也推出了相關(guān)的新命令didregress,可進(jìn)行類似 DID 的估計(jì)。更重要的是,你可以用DID的官方命令,輕松地畫平行趨勢圖啦~
2、完美的表格輸出
實(shí)證研究者經(jīng)常需要將Stata的多個回歸結(jié)果以表格形式輸出到word文件中。雖然早有官方命令estimates table可完成此類任務(wù),但比較死板;故此前Stata用戶一般使用非官方命令(比如estout或outreg)來輸出回歸結(jié)果。為此,Stata 17大幅改善了原來的table命令,使用戶可輕松地以表格形式匯報(bào)回歸結(jié)果(regression results)或統(tǒng)計(jì)特征(summary statistics)。
進(jìn)一步,你可以設(shè)計(jì)回歸表格的風(fēng)格(styles),并應(yīng)用于所創(chuàng)建的表格,然后將此表格輸出到Word或其他形式的文件(包括PDF、HTML、LaTex、Excel、markdown 等)。另外,你還可以使用新增的前綴(prefix)collect,來收集Stata命令的各種估計(jì)結(jié)果。最后,Stata 17還新增了Table Builder(表格創(chuàng)建器),讓用戶可通過點(diǎn)擊鼠標(biāo)(point-and-click)來創(chuàng)建表格。
3、Lasso的新功能
作為“高維回歸”(high-dimensional regression)的常用工具,Stata 16已經(jīng)推出了有關(guān)Lasso(Least Absolute Shrinkage and Selection Operator,即所謂 “套索估計(jì)量”)的一系列官方命令。Stata 17則提供了更多有關(guān) Lasso 的新功能。
使用Lasso估計(jì)處理效應(yīng)模型。在 Stata 16 中,可使用命令teffects估計(jì)“處理效應(yīng)”(treatment effects)模型;而命令lasso則用于估計(jì)協(xié)變量很多的高維模型。Stata 17則將二者結(jié)合起來,其推出的新命令telasso,可估計(jì)包含很多協(xié)變量的處理效應(yīng)模型。
使用 BIC 選擇Lasso懲罰參數(shù)。作為一種“懲罰回歸”(penalized regression),在進(jìn)行Lasso估計(jì)時,需要選擇懲罰參數(shù)(penalty parameter)。在Stata 16中,可使用交叉驗(yàn)證(cross-validation)、適應(yīng)性方法(adaptive method)或代入法(plugin)來選擇懲罰參數(shù)。
在Stata 17中,新增了選擇項(xiàng) “selection(bic)”,可使用 “貝葉斯信息準(zhǔn)則”(Bayesian Information Criterion,簡記BIC)選擇懲罰參數(shù)。而且,新增的估計(jì)后命令(postestimation command)bicplot 可以很方便地將此選擇過程可視化。
使用Lasso處理聚類數(shù)據(jù)。對于“聚類數(shù)據(jù)”(cluster data),由于每個聚類中觀測值存在自相關(guān),故通常的Lasso估計(jì)可能導(dǎo)致偏差。在Stata 17中,在使用命令lasso或elasticnet時,可通過新增選擇項(xiàng) “cluster(clustvar)” 來處理聚類數(shù)據(jù)。進(jìn)一步,對于使用Lasso進(jìn)行統(tǒng)計(jì)推斷的命令,比如poregress(表示partialing-out regress),則可使用Stata 17的新增選擇項(xiàng) “cluster(clustvar)” 來得到聚類穩(wěn)健的標(biāo)準(zhǔn)誤(cluster-robust standard errors)。
4、離散選擇模型的新命令
離散選擇模型(discrete choice model)是微觀計(jì)量經(jīng)濟(jì)學(xué)的常用模型。在Stata 17中,增加了以下離散選擇模型的新命令:
“面板多項(xiàng)邏輯模型”(panel multinomial logit model)。對于橫截面數(shù)據(jù)的多項(xiàng)邏輯模型,Stata已有mlogit命令。Stata 17新增的xtmlogit命令則可使用面板數(shù)據(jù)估計(jì)多項(xiàng)邏輯模型。這無疑是Stata在離散選擇模型方面的一大進(jìn)步,因?yàn)榇饲癝tata只能使用xtlogit或xtprobit估計(jì)面板二值選擇模型。
“零膨脹排序邏輯模型”(zero-inflated ordered logit model)。對于排序數(shù)據(jù)(ordered data),此前可使用Stata命令ologit或oprobit進(jìn)行估計(jì)。在實(shí)踐中,有時排序數(shù)據(jù)中最低類別所占比重很大。若將最低類別的取值記為“零”,則存在所謂“零膨脹”現(xiàn)象。此時可使用Stata 17的新增命令ziologit,估計(jì)更有效率的“零膨脹排序邏輯模型”(zero-inflated ordered logit model)。
5、久期數(shù)據(jù)的新命令
“久期數(shù)據(jù)”(duration data)常用于生物統(tǒng)計(jì)的 “生存分析”(survival analysis),在經(jīng)濟(jì)學(xué)中也有廣泛用途,例如失業(yè)的持續(xù)時間,婚姻的延續(xù)時長,王朝的壽命等。久期數(shù)據(jù)常存在 “刪失”(censoring)或 “歸并” 問題,比如當(dāng)研究結(jié)束時,有些病人可能尚未死亡;或者有些失業(yè)者還未找到工作。
Stata 17新推出的命令stintcox,可使用Cox模型來估計(jì)一種特殊的“區(qū)間刪失”(interval-censored)數(shù)據(jù)。對于區(qū)間刪失數(shù)據(jù),我們只知道事件發(fā)生于某個區(qū)間,但無法確知其發(fā)生時點(diǎn);比如,只知道癌癥復(fù)發(fā)于兩次體檢之間的時段。如果忽略久期數(shù)據(jù)存在的區(qū)間刪失問題,則會導(dǎo)致估計(jì)偏差。
6、貝葉斯計(jì)量經(jīng)濟(jì)學(xué)的全面升級
在大數(shù)據(jù)時代,由于數(shù)據(jù)日益復(fù)雜而多樣,在處理有些問題時,基于頻率學(xué)派的傳統(tǒng)計(jì)量方法可能不便使用,使得貝葉斯學(xué)派的計(jì)量經(jīng)濟(jì)學(xué)逐漸興起。頻率學(xué)派認(rèn)為待估計(jì)的參數(shù)是給定的未知數(shù)(fixed unknown parameters),而貝葉斯學(xué)派則將未知參數(shù)視為服從某個分布的隨機(jī)變量,并可隨時根據(jù)新的樣本信息將其 “先驗(yàn)分布”(prior distribution)更新為 “后驗(yàn)分布”(posterior distribution)。Stata 17將Stata中原有的貝葉斯統(tǒng)計(jì)學(xué)與計(jì)量經(jīng)濟(jì)學(xué)進(jìn)行了全面升級。
貝葉斯面板數(shù)據(jù)模型(Bayesian panel-data models)。Stata目前已有的面板命令包括xtreg(靜態(tài)面板),xtlogit或xtprobit(面板二值選擇模型),以及xtologit或xtoprobit(面板排序模型)等。在 Stata 17中,如果要使用貝葉斯方法估計(jì)這些面板模型,只要在原命令之前加上 “前綴”(prefix)bayes即可。
貝葉斯向量自回歸模型(Bayesian VAR models)。“向量自回歸”(Vector Autoregression,簡記VAR)是常見的時間序列模型。在已有的Stata中,可用命令var來估計(jì)VAR模型,而后續(xù)命令則包括:使用fcast進(jìn)行 “動態(tài)預(yù)測”(dynamic forecast),以及使用irf估計(jì) “脈沖響應(yīng)函數(shù)”(impulse response function,簡記 IRF)與 “預(yù)測誤差方差分解”(forecast error variance decomposition,簡記 FEVD)。
在Stata 17中,則可使用命令“bayes: var”(即在命令var之前加上前綴 bayes)估計(jì)貝葉斯的 VAR 模型,然后用bayesfcast進(jìn)行動態(tài)預(yù)測;而脈沖響應(yīng)函數(shù)與預(yù)測誤差方差分解也可類似地得到。
然后,使用bayesfcast進(jìn)行動態(tài)預(yù)測;
而脈沖響應(yīng)函數(shù)(IRF)與預(yù)測誤差方差分解(FEVD)也可類似地得到。
使用貝葉斯方法估計(jì)VAR模型有兩大好處。首先,VAR模型通常包含較多參數(shù),若樣本較小,則估計(jì)結(jié)果不穩(wěn)定。而貝葉斯方法由于較易“整合先驗(yàn)信息”(incorporating prior information),故在用小樣本估計(jì)VAR模型時更為穩(wěn)健。
其次,經(jīng)典的VAR模型使用大樣本理論進(jìn)行統(tǒng)計(jì)推斷與預(yù)測,需要假設(shè)估計(jì)量服從漸近正態(tài)分布,在小樣本中不易滿足。而貝葉斯方法則不使用大樣本理論,也無須漸近正態(tài)的假設(shè),故更適用于小樣本。
貝葉斯多層模型(Bayesian multilevel models)。Stata 17新推出的bayesmh命令可以估計(jì)一系列的貝葉斯多層模型,包含“單變量”(univariate)或“多變量”(multivariate)的線性與非線性多層模型(linear and nonlinear multilevel models),乃至面板的生存時間模型(joint longitudinal and survival-time models)以及結(jié)構(gòu)方程之類的模型(SEM-type models)等。
貝葉斯線性與非線性DSGE模型(Bayesian linear and nonlinear DSGE models)。“動態(tài)隨機(jī)一般均衡”(Dynamic Stochastic General Equilibrium,簡記DSGE)模型是宏觀經(jīng)濟(jì)學(xué)的主流模型。在Stata 16 中,可使用命令dsge與dsgenl分別估計(jì)線性與非線性的 DSGE 模型。
在Stata 17中,只要在命令dsge與dsgenl之前加上前綴bayes,即可估計(jì)相應(yīng)的線性或非線性的貝葉斯DSGE模型。可供用戶選用的 “先驗(yàn)分布”(prior distribution)多達(dá)30以上,并可進(jìn)行貝葉斯脈沖響應(yīng)分析(Bayesian IRF analysis),區(qū)間假設(shè)檢驗(yàn)(interval hypothesis testing),以及使用貝葉斯因子(Bayesian factors)來比較模型等。
7、非參數(shù)的趨勢檢驗(yàn)
有時樣本數(shù)據(jù)中存在分組(比如,分為3組),且這些分組有天然的排序(比如,記為1,2,3組),即所謂 “排序分組”(ordered groups)。在這種排序分組的數(shù)據(jù)中,經(jīng)常希望檢驗(yàn)?zāi)硞€變量在此分組排序中(比如,第1-3組),是否存在某種趨勢,比如此變量的取值傾向于越來越大,即所謂 “tests for trend across ordered group”。
為此,可使用Stata已有命令nptrend,進(jìn)行非參數(shù)的Cuzick秩檢驗(yàn)(Cuzick test using ranks)。而Stata 17的最新版nptrend命令,則在 Cuzick秩檢驗(yàn)之外,新增了三個非參數(shù)檢驗(yàn),即“Cochran-Armitage test”,“Jonckheere-Terpstra test” 與“linear-by-linear trend test”,使得命令nptrend的功能大大增強(qiáng)。
8、元分析的新命令
“元分析”(meta-analysis)將多個類似的研究結(jié)果綜合在一起。比如,針對某個疫苗的有效性(vaccine efficacy),在世界各地進(jìn)行了多個實(shí)驗(yàn),如何將每個實(shí)驗(yàn)所得的疫苗有效性指標(biāo),通過加權(quán)平均得到統(tǒng)一的度量。Stata 17將Stata的元分析功能作了進(jìn)一步的提升。
多維元分析(Multivariate meta-analysis)。在將多個研究結(jié)果綜合在一起時,其中的每個研究可能同時匯報(bào) “多個效應(yīng)規(guī)模”(multiple effect sizes),而這些效應(yīng)之間可能存在相關(guān)性。若使用Stata既有的 meta命令,則會忽略這種相關(guān)性。Stata 17的新增命令meta mvregress可進(jìn)行多維元分析,并處理這種相關(guān)性。
加爾布雷斯圖(Galbraith plots)。Stata 17還新增了命令meta galbraithplot,可以畫元分析的 “加爾布雷斯圖”(Galbraith plots)。此圖可用于評估不同研究之間的異質(zhì)性(assessing heterogeneity of the studies),并發(fā)現(xiàn)潛在的極端值(potential outliers)。
留一元分析(Leave-one-out meta analysis)。Stata 17新增了 “留一元分析”(Leave-one-out meta-analysis)的功能。所謂“留一元分析”,就是在進(jìn)行元分析時,每次均留出一個研究(不放在樣本中),以考察元分析結(jié)果的穩(wěn)健性;比如,最終結(jié)果是否過度依賴于某個研究。在使用Stata命令meta summarize或meta forestplot進(jìn)行元分析時,可使用新增的選擇項(xiàng)leaveoneout來進(jìn)行留一元分析。
9、Stata與Python、Java、H2O及Jupyter Notebook的整合
在大數(shù)據(jù)時代,Stata也在加快與主流軟件平臺的整合,為用戶提供更多的增值服務(wù)。這在Stata 17的此次升級中體現(xiàn)尤其突出。
與 Python 的整合(Python integration)。Python已是炙手可熱的主流計(jì)算機(jī)語言。為此,Stata 16專門提供了一個與Python的接口,讓用戶在熟悉的Stata界面下調(diào)用Python,并在Stata中顯示運(yùn)行結(jié)果。Stata 17則更進(jìn)一步,推出了新的Python包(Python package)pystata,使得用戶可在Python 中方便地調(diào)用Stata。Stata 17還引入了一個新概念 “PyStata” ,包括 Stata與Python交互的所有方式。
與 Java 的整合(Java integration)。Java是一種應(yīng)用廣泛的跨平臺編程語言。在Stata 17中,你可以十分方便地在Stata程序中嵌入并執(zhí)行 Java 代碼。
對于JDBC數(shù)據(jù)交換格式的支持(Support for JDBC)。JDBC(Java Database Connectivity)是一個在不同程序與數(shù)據(jù)庫之間交換數(shù)據(jù)的跨平臺標(biāo)準(zhǔn)(a cross-platform standard for exchanging data between programs and databases)。在Stata 17中,通過支持JDBC,使得 Stata用戶可從一些最流行的數(shù)據(jù)庫導(dǎo)入數(shù)據(jù),包括Oracle、MySQL、AmazonRedShift、Snowflake、Microsoft SQL Server等。
與H2O的整合(H2O integration)。H2O是一款流行的機(jī)器學(xué)習(xí)軟件平臺。在Stata 17中,你可以連接并調(diào)用H2O的機(jī)器學(xué)習(xí)算法。這無疑為Stata用戶打開了另外一扇通往機(jī)器學(xué)習(xí)的窗口!
在Jupyter Notebook中使用Stata(Jupyter Notebook with Stata)。Jupyter Notebook是一款基于網(wǎng)頁的流行“集成開發(fā)環(huán)境”(integrated development environment,簡記 IDE),尤其方便展示代碼、公式、文字與可視化。在Stata 17中,作為PyStata的一部分(依賴于 Python 包 pystata),你可以從 Jupyter Notebook調(diào)用 Stata與Mata(Stata的矩陣語言)。這意味著,你可以在同一環(huán)境中整合Python與Stata的功能,使得你的工作更加可復(fù)制(reproducible)且易于分享。
10、Do文件編輯器的改進(jìn)與Stata速度提升等
Do文件編輯器的改進(jìn)(Do-file Editor improvements)。隨著編程的重要性日益提高,Stata 16在Do文件編輯器中加入了 “自動填寫完成”(autocompletion)與 “語法高亮”(syntax highlighting)的功能。Stata 17又將Do文件編輯器的功能進(jìn)一步提升。
在Stata 17的Do文件編輯器中,可通過設(shè)置 “bookmarks”(書簽)而在一個較長的do文件中迅速跳至想要編輯的部分。Stata 17的Do文件編輯器還新增了“navigation control”(導(dǎo)航),其中羅列所有的書簽及其標(biāo)簽(bookmarks and their labels),以該Do文件中的全部“程序”(programs)。
Stata的速度提升(Faster Stata)。在大數(shù)據(jù)時代,基礎(chǔ)算法的速度越來越重要。為此,Stata 17更新了命令sort與collapse的算法,使之更為快捷。另外,Stata 17也提升了命令mixed(用于估計(jì)多層混合效應(yīng)模型,即 multilevel mixed-effects models)的運(yùn)行速度。
使用Intel Math Kernel Library(MKL)提升速度。Stata 17引入了Intel Math Kernel Library(MKL),適用于所有Intel或AMD的64位計(jì)算機(jī),從而可調(diào)用深度優(yōu)化(deeply optimized)的LAPACK(Linear Algebra PACKage)線性代數(shù)包。這將使得Stata與Mata的底層計(jì)算速度進(jìn)一步提升,而Stata用戶無須作任何事情即可享用。
處理日期與時間的新函數(shù)(New functions for dates and times)。Stata 17 引入了方便處理日期與時間的新函數(shù),包括Datetime duration(計(jì)算持續(xù)時間),Datetime relative dates(計(jì)算相對日期,比如下個生日的日期),以及Datetime(從日期中提取不同的成分)。這些新函數(shù)還會自動考慮閏年(leap years)、閏日(leap days)與閏秒(leap seconds)的因素。
總之,Stata 17是一次令人激動的重大升級,不僅有貝葉斯計(jì)量經(jīng)濟(jì)學(xué)的高歌猛進(jìn),與主流計(jì)算機(jī)語言平臺的深度整合,更便于編程的Do文件編輯器,而且更為貼近計(jì)量實(shí)戰(zhàn)的需求(DID,表格輸出,離散選擇等)。顯然,在可預(yù)見的將來,Stata 依然會是經(jīng)管社科的首選計(jì)量與統(tǒng)計(jì)軟件。
1、線性模型
回歸•審查結(jié)果•內(nèi)生回歸量•自舉,折刀,魯棒和群集穩(wěn)健方差•工具變量•三階段最小二乘•約束•分位數(shù)回歸•GLS•更多。
2、小組/縱向數(shù)據(jù)
具有強(qiáng)大標(biāo)準(zhǔn)誤差的隨機(jī)和固定效應(yīng)•線性混合模型•隨機(jī)效應(yīng)概率•GEE•隨機(jī)和固定效應(yīng)泊松•動態(tài)面板數(shù)據(jù)模型•工具變量•面板單位根測試•更多。
3、多級混合效果模型
連續(xù),二元,計(jì)數(shù)和生存結(jié)果•兩級,三級和更高級模型•廣義線性模型•非線性模型•隨機(jī)截距•隨機(jī)斜率•交叉隨機(jī)效應(yīng)•效果和擬合值的BLUP•分層模型•殘差錯誤結(jié)構(gòu)•DDF調(diào)整•支持調(diào)查數(shù)據(jù)•更多。
4、二進(jìn)制,計(jì)數(shù)和有限的結(jié)果
logistic,probit,tobit•泊松和負(fù)二項(xiàng)•條件,多項(xiàng),嵌套,有序,秩序和刻板邏輯•多項(xiàng)概率•零膨脹和左截?cái)嘤?jì)數(shù)模型•選擇模型•邊際效應(yīng)•更多。
5、選擇模型
離散選擇•等級排序備選方案•條件logit•多項(xiàng)式probit•嵌套logit•混合logit•面板數(shù)據(jù)•特定于案例和特定于備選方案的預(yù)測器•解釋結(jié)果預(yù)期概率,協(xié)變量效應(yīng),跨備選方案的比較•更多。
6、擴(kuò)展回歸模型(ERM)
內(nèi)源性協(xié)變量•樣本選擇•非隨機(jī)處理•小組數(shù)據(jù)•單獨(dú)或組合出現(xiàn)問題•連續(xù),區(qū)間刪失,二元和有序結(jié)果•更多。
1、新的元分析套件;改進(jìn)和擴(kuò)展的選擇建模(邊距適用于所有地方)。
2、Python與軟件的集成;貝葉斯預(yù)測,多鏈以及更多。
3、面板數(shù)據(jù)的擴(kuò)展回歸模型(ERM);導(dǎo)入SAS和SPSS數(shù)據(jù)集。
4、靈活的非參數(shù)序列回歸;內(nèi)存中的多個數(shù)據(jù)集,即幀。
5、置信區(qū)間的樣本大小分析;非線性DSGE模型。
6、多組IRT;面板數(shù)據(jù)Heckman選擇模型。
7、Stata具有滯后的NLME:多劑量藥代動力學(xué)模型等。
8、Heteroskedastic命令probit;圖形大小以英寸,厘米和打印機(jī)點(diǎn)為單位。
9、Mata中的數(shù)值積分;Mata中的線性編程。
10、文件編輯器:自動完成,語法高亮等;for Mac:暗模式和標(biāo)簽式窗口。
1、下載解壓得到,Stata 17安裝包和stata17序列號和密碼;
2、運(yùn)行SetupStata17.exe,開始安裝軟件;
3、接受同意條款,然后繼續(xù)安裝;
4、選擇想要安裝的版本,Stata BE為基礎(chǔ)版、Stata SE為特別版、Stata MP為并行計(jì)算版;
5、設(shè)置軟件安裝路徑,默認(rèn)即可;
6、等待軟件安裝完成,先不要打開軟件;
7、將crack破解補(bǔ)丁中的文件復(fù)制到軟件根目錄下替換;
默認(rèn)路徑:C:\Program Files\Stata17
8、至此,軟件成功激活,完美支持簡體中文,以上就是Stata 17中文破解版的安裝教程了,希望對你有所幫助;
標(biāo)簽: stata 數(shù)據(jù)分析
關(guān)于本站|下載幫助|下載聲明|軟件發(fā)布|聯(lián)系我們
Copyright ? 2005-2025 daaijiaoyu.cn.All rights reserved.
浙ICP備2024132706號-1 浙公網(wǎng)安備33038102330474號