如何用numpy 分析mysql_随笔

Pandas是Python下一个开源数据分析的库，它提供的数据结构DataFrame极大的简化了数据分析过程中一些繁琐 *** 作。 1. 基本使用：创建DataFrame. DataFrame是一张二维的表，大家可以把它想象成一张Excel表单或者Sql表。

float本身保存的就是近似值，因为你后面有e-06这样的字符，这个其实也是数字的一部分，这么看，不管你怎么存小数位都是不够的，比如这个3.90104e-06，翻译过来应该是0.00000390194，你估计float的话要怎么写，他是8位的精度，这里来看最好就是0.0000039也就这样了，我想就算这个也不是你要的吧。

所以个人觉得办法就是换一个数据类型，最简单的就是double（我估计16位的精度应该够了吧，不过他和float一样，存一个近似值，你可以试试写成double（16，14）试试，如果还不行，那就只能用decimal了），如果还是进位，那就用decimal（65位的定点数，怎么算都够了。）

如果还不行就祭出终极大招字符型，这个总没有问题，当然如果你还要计算，那就最好别用这个。

pandas是python环境下最有名的数据统计包，而DataFrame翻译为数据框，是一种数据组织方式，这么说你可能无法从感性上认识它，举个例子，你大概用过Excel，而它也是一种数据组织和呈现的方式，简单说就是表格，而在在pandas中用DataFrame组织数据，如果你不print DataFrame，你看不到这些数据，下面我们来看看DataFrame是如何使用的。

首先是引入pandas和numpy，这是经常配合使用的两个包，pandas依赖于numpy，引入以后我们可以直接使用np/pd来表示这个两个模块

先创建一个时间索引，所谓的索引（index)就是每一行数据的id，可以标识每一行的唯一值

为了快速入门，我们看一下如何创建一个6X4的数据：randn函数用于创建随机数，参数表示行数和列数，dates是上一步创建的索引列

我们还可以使用字典来创建数据框，例如创建一个列名为A的数据框，索引是自动创建的整数

这又是一个字典创建DataFrame的例子

假如字典内的数据长度不同，以最长的数据为准，比如B列有4行：

可以使用dtypes来查看各行的数据格式

接着看一下如何查看数据框中的数据，看一下所有的数据

使用head查看前几行数据（默认是前5行），不过你可以指定前几行

查看前三行数据

使用tail查看后5行数据

查看数据框的索引

查看列名用columns

查看数据值，用values

查看描述性统计，用describe

使用type看一下输出的描述性统计是什么样的数据类型——DataFrame数据

使用T来转置数据，也就是行列转换

对数据进行排序，用到了sort，参数可以指定根据哪一列数据进行排序。

好了，这篇入门教程到这里，后面还有很多，希望有志同道合的朋友一起交流学习，有什么说的不对的地方，请批评指正。

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/zaji/7347768.html

如何用numpy 分析mysql

发表评论

评论列表（0条）