- Tushare大数据社区——想要的我都有
- for who?
- 有哪些内容?
- 数据质量怎么样?
- 上证50指数数据的对比实例
- 该如何获取呢?
- 写在最后
- 感谢观看
万德太贵?爬虫不会?但还是需要财经数据怎么办?Tushare大数据社区:我啥都有!(tushare ID:436348)
对于经管类科研工作者来说,财经数据简直就是刚需。巧妇难为无米之炊,就大部分的实证研究来说好的数据才是发文发刊的利器,可是就小编知道的购买万德、国泰安数据库的高校相对来说真的少(小编所在学校就是一所211高校,买的数据库只有瑞思,而且一些数据还没有权限)。而Tushare大数据社区可以成为你数据的重要来源!还有学生权限,免费数据简直不要太好用!
for who?通过上面的文字,也许您也看出来了本博文主要是针对有财经数据需求的经管类科研工作者,尤其是刚读研的研一研二的科研小白。如果你是在读的学生或者在校老师,通过申请学生权限,你可以拿到的数据基本就可以满足你的科研需求了
有哪些内容?tushare本身提供的数据是非常丰富的,重点说一下在申请学生权限后可以拿到什么数据,包括但不限于股票、指数、基金、期货、期权的行情数据,资产负债表、利润表等公司基本面数据,还有GDP、价格指数等宏观数据,也有新闻通讯、新冠疫情等另类数据。可以说真的很丰富了。更具体的可以参考官网:https://tushare.pro/
。。。等等等等
就相同数据来说,Tushare大数据社区提供的数据相当可靠。下面就通过python一个例子来说明一下。(与某思数据进行对比)(以下文中代码都在jupyter中完成)
上证50指数数据的对比实例先看看tushare上的数据
导入必要的包
import numpy as np import pandas as pd import tushare as ts import matplotlib.pyplot as plt ts.set_token('##############') #括号中需要写自己的token pro = ts.pro_api()
导入上证50指数在2021年三月份的数据
szh_tS = pro.index_daily(ts_code='000016.SH', start_date='20210301', end_date='20210331') szh_tS.iloc[:,0:9] #以下为jupyter输出结果 ts_code trade_date close open high low pre_close change 0 000016.SH 20210331 3539.3696 3573.8565 3573.8565 3518.1678 3577.2434 -37.8738 1 000016.SH 20210330 3577.2434 3541.3771 3582.0181 3531.6295 3537.7110 39.5324 2 000016.SH 20210329 3537.7110 3543.2452 3563.4001 3510.4110 3529.7282 7.9828 3 000016.SH 20210326 3529.7282 3483.6948 3539.2260 3480.3337 3463.8727 65.8555 4 000016.SH 20210325 3463.8727 3454.4611 3479.1275 3439.5127 3466.0422 -2.1695 5 000016.SH 20210324 3466.0422 3507.5484 3528.7345 3457.4445 3516.3626 -50.3204 6 000016.SH 20210323 3516.3626 3541.3289 3542.8163 3482.5866 3538.4271 -22.0645 7 000016.SH 20210322 3538.4271 3516.6567 3558.9361 3511.7241 3512.0203 26.4068 8 000016.SH 20210319 3512.0203 3565.0925 3573.0574 3496.3815 3605.6047 -93.5844 9 000016.SH 20210318 3605.6047 3598.8499 3619.3306 3586.5036 3590.8339 14.7708 10 000016.SH 20210317 3590.8339 3588.2332 3616.9357 3552.4871 3599.1646 -8.3307 11 000016.SH 20210316 3599.1646 3579.0111 3608.1148 3556.6180 3566.8773 32.2873 12 000016.SH 20210315 3566.8773 3620.0419 3627.3069 3539.4859 3632.5784 -65.7011 13 000016.SH 20210312 3632.5784 3647.5097 3647.5097 3600.3919 3625.3052 7.2732 14 000016.SH 20210311 3625.3052 3554.6825 3633.7724 3554.6825 3532.0523 93.2529 15 000016.SH 20210310 3532.0523 3563.5639 3572.3740 3528.3165 3509.6137 22.4386 16 000016.SH 20210309 3509.6137 3570.2561 3595.1858 3489.9697 3573.4310 -63.8173 17 000016.SH 20210308 3573.4310 3713.4587 3732.7790 3571.4154 3688.6818 -115.2508 18 000016.SH 20210305 3688.6818 3655.9072 3721.2755 3627.2889 3708.6606 -19.9788 19 000016.SH 20210304 3708.6606 3769.9730 3781.2754 3686.0903 3817.4128 -108.7522 20 000016.SH 20210303 3817.4128 3710.2632 3818.0719 3708.2309 3718.7739 98.6389 21 000016.SH 20210302 3718.7739 3812.3503 3812.3503 3689.0111 3787.8695 -69.0956 22 000016.SH 20210301 3787.8695 3793.3653 3795.0518 3747.5791 3756.8597 31.0098
然后以收盘价close作为对比
szh_tS.index=szh_tS['trade_date'] szh_tS1=szh_tS[['close']] szh_tSf=szh_tS1.sort_index() szh_tSI=szh_tSf.index szh_tSf.index = pd.DatetimeIndex(szh_tSI) szh_tSf #以下为jupyter中的输出结果 trade_date close 2021-03-01 3787.8695 2021-03-02 3718.7739 2021-03-03 3817.4128 2021-03-04 3708.6606 2021-03-05 3688.6818 2021-03-08 3573.4310 2021-03-09 3509.6137 2021-03-10 3532.0523 2021-03-11 3625.3052 2021-03-12 3632.5784 2021-03-15 3566.8773 2021-03-16 3599.1646 2021-03-17 3590.8339 2021-03-18 3605.6047 2021-03-19 3512.0203 2021-03-22 3538.4271 2021-03-23 3516.3626 2021-03-24 3466.0422 2021-03-25 3463.8727 2021-03-26 3529.7282 2021-03-29 3537.7110 2021-03-30 3577.2434 2021-03-31 3539.3696
加载下好的某思的数据
shz50=pd.read_csv(lj+"shangzhRs.csv",index_col='交易日期_TrdDt',parse_dates=['交易日期_TrdDt'],encoding='gbk') shz50['2021-03']['收盘价(元/点)_ClPr'] ##以下为jupyter中的输出结果 交易日期_TrdDt 2021-03-01 3787.87 2021-03-02 3718.77 2021-03-03 3817.41 2021-03-04 3708.66 2021-03-05 3688.68 2021-03-08 3573.43 2021-03-09 3509.61 2021-03-10 3532.05 2021-03-11 3625.31 2021-03-12 3632.58 2021-03-15 3566.88 2021-03-16 3599.16 2021-03-17 3590.83 2021-03-18 3605.60 2021-03-19 3512.02 2021-03-22 3538.43 2021-03-23 3516.36 2021-03-24 3466.04 2021-03-25 3463.87 2021-03-26 3529.73 2021-03-29 3537.71 2021-03-30 3577.24 2021-03-31 3539.37 Name: 收盘价(元/点)_ClPr, dtype: float64
将两个数据放在一起
szh_tSf['close_Rs']=shz50['2021-03']['收盘价(元/点)_ClPr'] szh_tSf ##以下为jupyter中的输出结果 close close_Rs trade_date 2021-03-01 3787.8695 3787.87 2021-03-02 3718.7739 3718.77 2021-03-03 3817.4128 3817.41 2021-03-04 3708.6606 3708.66 2021-03-05 3688.6818 3688.68 2021-03-08 3573.4310 3573.43 2021-03-09 3509.6137 3509.61 2021-03-10 3532.0523 3532.05 2021-03-11 3625.3052 3625.31 2021-03-12 3632.5784 3632.58 2021-03-15 3566.8773 3566.88 2021-03-16 3599.1646 3599.16 2021-03-17 3590.8339 3590.83 2021-03-18 3605.6047 3605.60 2021-03-19 3512.0203 3512.02 2021-03-22 3538.4271 3538.43 2021-03-23 3516.3626 3516.36 2021-03-24 3466.0422 3466.04 2021-03-25 3463.8727 3463.87 2021-03-26 3529.7282 3529.73 2021-03-29 3537.7110 3537.71 2021-03-30 3577.2434 3577.24 2021-03-31 3539.3696 3539.37
从上面的数据可以看出来,tushare提供的数据精确到了4位小数点,在四舍五入保留两位小数之后和某思的数据就完全没有差别了。因此在数据质量上,Tushare的数据是非常过关的。
该如何获取呢?tushare数据的获取相对来说也是比较简单,可以通过多种方法来获取,对于经管类的学术小白,建议学个简单编程,这对你以后的论文写作也有一定的帮助。
对于有编程基础的小伙伴来说,不要一个下午就可以轻松上手撸数据,如果不想费脑子记住,也可以参考tushare数据接口tushare数据接口给出的实例,随用随查,非常好用!
tushare的数据丰富,获取简单,对于在校大学生更是非常友好,如果你也需要财经类数据,tushare可以成为你的数据后盾。
本人打算用开始时间序列的专栏,感兴趣的可以点个赞,鼓励一下!
感谢观看感谢观看,希望本文能为你带来帮助!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)