pandas是python环境下最有名的数据统计包,而DataFrame翻译为数据框,是一种数据组织方式,这么说你可能无法从感性上认识它,举个例子,你大概用过Excel,而它也是一种数据组织和呈现的方式,简单说就是表格,而在在pandas中用DataFrame组织数据,如果你不print DataFrame,你看不到这些数据,下面我们来看看DataFrame是如何使用的。
首先是引入pandas和numpy,这是经常配合使用的两个包,pandas依赖于numpy,引入以后我们可以直接使用np/pd来表示这个两个模块![pandas教程:[1]DataFrame入门](https://exp-picture.cdn.bcebos.com/836a6aee1c324b1830c7e74253a7263349844842.jpg)
先创建一个时间索引,所谓的索引(index)就是每一行数据的id,可以标识每一行的唯一值![pandas教程:[1]DataFrame入门](https://exp-picture.cdn.bcebos.com/57af657f860e7c75891f9746650d3aceabd7bf42.jpg)
为了快速入门,我们看一下如何创建一个6X4的数据:randn函数用于创建随机数,参数表示行数和列数,dates是上一步创建的索引列![pandas教程:[1]DataFrame入门](https://exp-picture.cdn.bcebos.com/cfa9ae04541bd10f76cd6629ba0e1799e82aa742.jpg)
我们还可以使用字典来创建数据框,例如创建一个列名为A的数据框,索引是自动创建的整数![pandas教程:[1]DataFrame入门](https://exp-picture.cdn.bcebos.com/94af5fc1b727ac539463fa9f2ecadce891489942.jpg)
这又是一个字典创建DataFrame的例子![pandas教程:[1]DataFrame入门](https://exp-picture.cdn.bcebos.com/dda98e4800fc77f701e53493c8715fdb37209042.jpg)
假如字典内的数据长度不同,以最长的数据为准,比如B列有4行:![pandas教程:[1]DataFrame入门](https://exp-picture.cdn.bcebos.com/2184380f8835dd8afd352eb403013870d4418742.jpg)
可以使用dtypes来查看各行的数据格式![pandas教程:[1]DataFrame入门](https://exp-picture.cdn.bcebos.com/3bcdb808a50f94fcfd67f07d4cf88a775cddfc42.jpg)
接着看一下如何查看数据框中的数据,看一下所有的数据![pandas教程:[1]DataFrame入门](https://exp-picture.cdn.bcebos.com/890dfb4a2f27e7ef9eed00b219dd3340b7f3f542.jpg)
使用head查看前几行数据(默认是前5行),不过你可以指定前几行![pandas教程:[1]DataFrame入门](https://exp-picture.cdn.bcebos.com/9881b1fce186242f6999ffac35e434daf15ee842.jpg)
查看前三行数据![pandas教程:[1]DataFrame入门](https://exp-picture.cdn.bcebos.com/4b626771fe1d96d8d2f20a932ccd0c6efaf2e142.jpg)
使用tail查看后5行数据![pandas教程:[1]DataFrame入门](https://exp-picture.cdn.bcebos.com/0d2fe5f202b375d74890d047515872dadf49d842.jpg)
查看数据框的索引![pandas教程:[1]DataFrame入门](https://exp-picture.cdn.bcebos.com/ac45306817e951e1d21333e55e3da824d9e9cf42.jpg)
查看列名用columns![pandas教程:[1]DataFrame入门](https://exp-picture.cdn.bcebos.com/ed792abb19efa25ffcffa9c859828689a0463b43.jpg)
查看数据值,用values![pandas教程:[1]DataFrame入门](https://exp-picture.cdn.bcebos.com/23fd63c5cf672b5fd1aa6e253314f4d0b4032743.jpg)
查看描述性统计,用describe![pandas教程:[1]DataFrame入门](https://exp-picture.cdn.bcebos.com/def3c219ce2c5b1b05329f6f2b39131fcfec0e43.jpg)
使用type看一下输出的描述性统计是什么样的数据类型——DataFrame数据![pandas教程:[1]DataFrame入门](https://exp-picture.cdn.bcebos.com/f385f299594304016e1275f1d66b04d148290543.jpg)
使用T来转置数据,也就是行列转换![pandas教程:[1]DataFrame入门](https://exp-picture.cdn.bcebos.com/486884883913e8e5c202c60f352f477047187d43.jpg)
对数据进行排序,用到了sort,参数可以指定根据哪一列数据进行排序。![pandas教程:[1]DataFrame入门](https://exp-picture.cdn.bcebos.com/03605157935653bbc2cc0f481d0b312104617143.jpg)
好了,这篇入门教程到这里,后面还有很多,希望有志同道合的朋友一起交流学习,有什么说的不对的地方,请批评指正。