Python常用数据分析包:
Pandas:数据分析
Nltk:自然语言处理
Scikit:人工智能和机器学习
Numpy/scipy:矢量数据和科学计算
Sympy:符号计算
Gpu:并行超速运算
Opencv:图像视频处理
TVTK/mayavi:可视化
财经数据接口包
Pandas
Python Data Analysis Library 或 是基于NumPy 的一种工具,是python的一个数据分析包。
Pandas最初被作为金融数据分析工具而开发出来,因此,pandas为时间序列分析提供了很好的支持。
Pandas的名称来自于面板数据(panel data)和python数据分析(data analysis)。
Pandas返回的数据格式都是pandas DataFrame类型,非常便于用pandas/NumPy/Matplotlib进行数据分析和可视化。
使用pandas自带财经数据接口,能够获取雅虎财经、世界银行等财经数据。
TuShare
TuShare是一个免费、开源的python财经数据接口包。
主要实现对股票等金融数据从数据采集、清洗加工到数据存储的过程,能够为金融分析人员提供快速、整洁和多样的便于分析的数据,为他们在数据来源方面极大地减轻了工作量,使他们更加专注于策略和模型的研究与实现上。
TuShare返回的绝大部分的数据格式都是pandas DataFrame类型,非常便于用pandas/NumPy/Matplotlib进行数据分析和可视化。
使用TuShare自带财经数据接口,能够获取新浪财经的证券、宏观等财经数据。
使用TuShare自带财经数据接口,能够获取即时新浪财经数据、新浪股吧数据、个股信息地雷数据等数据。
接口简单易懂,返回的数据格式规整,非常便于处理分析!
数据挖掘实验室
持续追踪大数据和数据新闻前沿,通过自然语言处理、机器学习、R等大数据处理手段和D3、Echarts等数据可视化方法,玩转大数据驱动新闻。
pandas是python的一个数据分析的库,可以读取excel、csv、html中的table等等可以做数据的处理(值替换replace、关联merge、分组group计算等等)
具体请参照:
百度百科
https://baike.baidu.com/item/pandas/17209606
官方手册
http://pandas.pydata.org/pandas-docs/stable
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)