【Tushare 大数据社区——解救你的财经数据需求】

【Tushare 大数据社区——解救你的财经数据需求】,第1张

【Tushare 大数据社区——解救你的财经数据需求】

Tushare 大数据社区——解救你的财经数据需求
  • Tushare大数据社区——想要的我都有
    • for who?
    • 有哪些内容?
    • 数据质量怎么样?
      • 上证50指数数据的对比实例
    • 该如何获取呢?
    • 写在最后
    • 感谢观看

Tushare大数据社区——想要的我都有

万德太贵?爬虫不会?但还是需要财经数据怎么办?Tushare大数据社区:我啥都有!(tushare ID:436348)

对于经管类科研工作者来说,财经数据简直就是刚需。巧妇难为无米之炊,就大部分的实证研究来说好的数据才是发文发刊的利器,可是就小编知道的购买万德、国泰安数据库的高校相对来说真的少(小编所在学校就是一所211高校,买的数据库只有瑞思,而且一些数据还没有权限)。而Tushare大数据社区可以成为你数据的重要来源!还有学生权限,免费数据简直不要太好用!

for who?

通过上面的文字,也许您也看出来了本博文主要是针对有财经数据需求的经管类科研工作者,尤其是刚读研的研一研二的科研小白。如果你是在读的学生或者在校老师,通过申请学生权限,你可以拿到的数据基本就可以满足你的科研需求了

有哪些内容?

tushare本身提供的数据是非常丰富的,重点说一下在申请学生权限后可以拿到什么数据,包括但不限于股票、指数、基金、期货、期权的行情数据,资产负债表、利润表等公司基本面数据,还有GDP、价格指数等宏观数据,也有新闻通讯、新冠疫情等另类数据。可以说真的很丰富了。更具体的可以参考官网:https://tushare.pro/



。。。等等等等

数据质量怎么样?

就相同数据来说,Tushare大数据社区提供的数据相当可靠。下面就通过python一个例子来说明一下。(与某思数据进行对比)(以下文中代码都在jupyter中完成)

上证50指数数据的对比实例

先看看tushare上的数据
导入必要的包

import numpy as np
import pandas as pd
import tushare as ts
import matplotlib.pyplot as plt
ts.set_token('##############')
#括号中需要写自己的token
pro = ts.pro_api()

导入上证50指数在2021年三月份的数据

szh_tS = pro.index_daily(ts_code='000016.SH', start_date='20210301', end_date='20210331')
szh_tS.iloc[:,0:9]
#以下为jupyter输出结果
    ts_code 	trade_date 	close	    open	    high	    low	        pre_close	change
0	000016.SH	20210331	3539.3696	3573.8565	3573.8565	3518.1678	3577.2434	-37.8738
1	000016.SH	20210330	3577.2434	3541.3771	3582.0181	3531.6295	3537.7110	39.5324
2	000016.SH	20210329	3537.7110	3543.2452	3563.4001	3510.4110	3529.7282	7.9828
3	000016.SH	20210326	3529.7282	3483.6948	3539.2260	3480.3337	3463.8727	65.8555
4	000016.SH	20210325	3463.8727	3454.4611	3479.1275	3439.5127	3466.0422	-2.1695
5	000016.SH	20210324	3466.0422	3507.5484	3528.7345	3457.4445	3516.3626	-50.3204
6	000016.SH	20210323	3516.3626	3541.3289	3542.8163	3482.5866	3538.4271	-22.0645
7	000016.SH	20210322	3538.4271	3516.6567	3558.9361	3511.7241	3512.0203	26.4068
8	000016.SH	20210319	3512.0203	3565.0925	3573.0574	3496.3815	3605.6047	-93.5844
9	000016.SH	20210318	3605.6047	3598.8499	3619.3306	3586.5036	3590.8339	14.7708
10	000016.SH	20210317	3590.8339	3588.2332	3616.9357	3552.4871	3599.1646	-8.3307
11	000016.SH	20210316	3599.1646	3579.0111	3608.1148	3556.6180	3566.8773	32.2873
12	000016.SH	20210315	3566.8773	3620.0419	3627.3069	3539.4859	3632.5784	-65.7011
13	000016.SH	20210312	3632.5784	3647.5097	3647.5097	3600.3919	3625.3052	7.2732
14	000016.SH	20210311	3625.3052	3554.6825	3633.7724	3554.6825	3532.0523	93.2529
15	000016.SH	20210310	3532.0523	3563.5639	3572.3740	3528.3165	3509.6137	22.4386
16	000016.SH	20210309	3509.6137	3570.2561	3595.1858	3489.9697	3573.4310	-63.8173
17	000016.SH	20210308	3573.4310	3713.4587	3732.7790	3571.4154	3688.6818	-115.2508
18	000016.SH	20210305	3688.6818	3655.9072	3721.2755	3627.2889	3708.6606	-19.9788
19	000016.SH	20210304	3708.6606	3769.9730	3781.2754	3686.0903	3817.4128	-108.7522
20	000016.SH	20210303	3817.4128	3710.2632	3818.0719	3708.2309	3718.7739	98.6389
21	000016.SH	20210302	3718.7739	3812.3503	3812.3503	3689.0111	3787.8695	-69.0956
22	000016.SH	20210301	3787.8695	3793.3653	3795.0518	3747.5791	3756.8597	31.0098

然后以收盘价close作为对比

szh_tS.index=szh_tS['trade_date']
szh_tS1=szh_tS[['close']]
szh_tSf=szh_tS1.sort_index()
szh_tSI=szh_tSf.index
szh_tSf.index = pd.DatetimeIndex(szh_tSI)
szh_tSf
#以下为jupyter中的输出结果
	          
trade_date	close
2021-03-01	3787.8695
2021-03-02	3718.7739
2021-03-03	3817.4128
2021-03-04	3708.6606
2021-03-05	3688.6818
2021-03-08	3573.4310
2021-03-09	3509.6137
2021-03-10	3532.0523
2021-03-11	3625.3052
2021-03-12	3632.5784
2021-03-15	3566.8773
2021-03-16	3599.1646
2021-03-17	3590.8339
2021-03-18	3605.6047
2021-03-19	3512.0203
2021-03-22	3538.4271
2021-03-23	3516.3626
2021-03-24	3466.0422
2021-03-25	3463.8727
2021-03-26	3529.7282
2021-03-29	3537.7110
2021-03-30	3577.2434
2021-03-31	3539.3696

加载下好的某思的数据

shz50=pd.read_csv(lj+"shangzhRs.csv",index_col='交易日期_TrdDt',parse_dates=['交易日期_TrdDt'],encoding='gbk')
shz50['2021-03']['收盘价(元/点)_ClPr']
##以下为jupyter中的输出结果
交易日期_TrdDt
2021-03-01    3787.87
2021-03-02    3718.77
2021-03-03    3817.41
2021-03-04    3708.66
2021-03-05    3688.68
2021-03-08    3573.43
2021-03-09    3509.61
2021-03-10    3532.05
2021-03-11    3625.31
2021-03-12    3632.58
2021-03-15    3566.88
2021-03-16    3599.16
2021-03-17    3590.83
2021-03-18    3605.60
2021-03-19    3512.02
2021-03-22    3538.43
2021-03-23    3516.36
2021-03-24    3466.04
2021-03-25    3463.87
2021-03-26    3529.73
2021-03-29    3537.71
2021-03-30    3577.24
2021-03-31    3539.37
Name: 收盘价(元/点)_ClPr, dtype: float64

将两个数据放在一起

szh_tSf['close_Rs']=shz50['2021-03']['收盘价(元/点)_ClPr']
szh_tSf
##以下为jupyter中的输出结果
				close	close_Rs
trade_date		
2021-03-01	3787.8695	3787.87
2021-03-02	3718.7739	3718.77
2021-03-03	3817.4128	3817.41
2021-03-04	3708.6606	3708.66
2021-03-05	3688.6818	3688.68
2021-03-08	3573.4310	3573.43
2021-03-09	3509.6137	3509.61
2021-03-10	3532.0523	3532.05
2021-03-11	3625.3052	3625.31
2021-03-12	3632.5784	3632.58
2021-03-15	3566.8773	3566.88
2021-03-16	3599.1646	3599.16
2021-03-17	3590.8339	3590.83
2021-03-18	3605.6047	3605.60
2021-03-19	3512.0203	3512.02
2021-03-22	3538.4271	3538.43
2021-03-23	3516.3626	3516.36
2021-03-24	3466.0422	3466.04
2021-03-25	3463.8727	3463.87
2021-03-26	3529.7282	3529.73
2021-03-29	3537.7110	3537.71
2021-03-30	3577.2434	3577.24
2021-03-31	3539.3696	3539.37

从上面的数据可以看出来,tushare提供的数据精确到了4位小数点,在四舍五入保留两位小数之后和某思的数据就完全没有差别了。因此在数据质量上,Tushare的数据是非常过关的。

该如何获取呢?

tushare数据的获取相对来说也是比较简单,可以通过多种方法来获取,对于经管类的学术小白,建议学个简单编程,这对你以后的论文写作也有一定的帮助。

对于有编程基础的小伙伴来说,不要一个下午就可以轻松上手撸数据,如果不想费脑子记住,也可以参考tushare数据接口tushare数据接口给出的实例,随用随查,非常好用!

写在最后

tushare的数据丰富,获取简单,对于在校大学生更是非常友好,如果你也需要财经类数据,tushare可以成为你的数据后盾。

本人打算用开始时间序列的专栏,感兴趣的可以点个赞,鼓励一下!

感谢观看

感谢观看,希望本文能为你带来帮助!

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/5688001.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-17
下一篇 2022-12-17

发表评论

登录后才能评论

评论列表(0条)

保存