大概就是用R来搞经济学,用Python玩爬虫,用SAS处理数据?
终于蹭上了我想要的编程课,顺便把一元和多元回归学精!
用Python来搞计量经济学的配套书。迷,我先看看理论吧。
Using Python for Introductory Econometrics
UPfIE
捯饬半天找好资料之后被数据集卡住,下载的本地数据集我把Variable Name和Data file分装两个文件,我不会合并路♂️,最后成功用包导入, perfect!
如何在Stata/Python/R中简单快速读地取伍德里奇《计量经济学导论》中的数据集? - 知乎
1. 调用module:library(wooldridge)
2. 导入数据
> df_wage1 <- wooldridge::wage1
> View(df_wage1)
3.导入数据后还需要看要分析哪个表就attach()
Q1
attach(wage1) #绑定数据 wage1 > mean(educ) #求均值 [1] 12.56274 > min(educ) #求最小值 [1] 0 > max(educ) #求最大值 [1] 18 > summary(educ) #一次性得以上描述性统计量 Min. 1st Qu. Median Mean 3rd Qu. Max. 0.00 12.00 12.00 12.56 14.00 18.00 > 184/56.9* mean(wage) #用2003年美元度x平均小时工资 [1] 19.06648 > sum(female) [1] 252 > length(female)-sum(female) #length() indicates the number of indicators [1] 274
#R和Python对大小写都这么严格 view 不给我看.
Q2
#I think it is unnecessary md.pattern(bwght) #我们发现缺失值 多 且缺失值分在的不同变 中 我们 用一种更方便的方法审 缺失值。mice包中的md.pattern()函数 够轻松实现 一功 。 参 《R 实战》第一版320页 。 回的结果告 我们在fatheduc变 上有缺失值的 测有196个 在motheduc上有缺失值的 测有1个。 > length(fatheduc) [1] 1388 # 由于 数据 中的 测是妇女的宝宝的情况 所以一个 测对应着一名妇女。我们只 意取一个变 测 其 测值数 即可。值得一提的是 缺失值仍然会 算为一个 测。例如fatheduc中有196个缺失值 faminc中没有缺失值 但length(fatheduc) > table(cigs) cigs 0 1 2 3 4 5 6 7 8 9 10 12 15 20 30 40 46 50 1176 3 4 7 9 19 6 4 5 1 55 5 19 62 5 6 1 1 #1388-1176=212 cigrates smokers #Frequency Table!!! > a<-bwght[cigs>0] > length(a) [1] 212 #Method 2 > mean(fatheduc) [1] NA > mean(fatheduc,na.rm = TRUE) #由于fatheduc存在缺失值。我们直接在mean()中定义na.rm = TRUE来计算排除缺失值的平均值。 [1] 13.18624
确实糟糕,这个CFA II里面的讲法完全不同樂
把非线性因素加入线性方程:所以看到指数对数这些东西。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)