很多数据是从网上下载而来,数据的格式可能是csv,那么pandas可以很容易的从csv格式的文件中读取数据,下面我们来看看具体的过程:
引入pandas![pandas教程:[5]读取csv数据](https://exp-picture.cdn.bcebos.com/a9338a1fbee434da941f8690f271fe1d97d8e494.jpg)
使用pandas下的read_csv方法,读取csv文件,参数是文件的路径,这是一个相对路径,是相对于当前工作目录的,那么如何知道当前的工作目录呢?![pandas教程:[5]读取csv数据](https://exp-picture.cdn.bcebos.com/a68c126efbf202b31a9655c830f4da5873dadb94.jpg)
使用os.getcwd()方法获取当前工作目录![pandas教程:[5]读取csv数据](https://exp-picture.cdn.bcebos.com/50a010f85856d53dd665145a47d2bb665059ca94.jpg)
读取前三后数据,查看一下是否读取正确,显然都是乱码,这是什么问题呢?![pandas教程:[5]读取csv数据](https://exp-picture.cdn.bcebos.com/05a320a23a42a07a29517080673834bb18efc194.jpg)
我们需要设定参数encoding,也就是编码方式,如果你不设定编码方式,默认是utf8,现在csv文件是gbk编码的,所以需要使用encoding='gbk'![pandas教程:[5]读取csv数据](https://exp-picture.cdn.bcebos.com/a31e1214c27bd28214c86df53cb1eef97ebd3695.jpg)
我用的编辑器是eric4,注意,eric4默认是不支持中文的,如果你想要显示中文,前提是设置正确的编码,在preferences中![pandas教程:[5]读取csv数据](https://exp-picture.cdn.bcebos.com/023cff37c97622bcdd8403d4a05fd54604962895.jpg)
设置成utf8即可![pandas教程:[5]读取csv数据](https://exp-picture.cdn.bcebos.com/c3c22dbf3bef354ffff9788d23db574afb321b95.jpg)
回到pandas,我们可以有更多选项来设置打开数据时的操作:
![pandas教程:[5]读取csv数据](https://exp-picture.cdn.bcebos.com/5a5a00def4dca039ae5e025f58d96975f3c40d95.jpg)