python pandas中索引函数loc和iloc的区别分析

 

前言

使用pandas进行数据分析的时候,我们经常需要对DataFrame的行或者列进行索引。使用pandas进行索引的方法主要有三种:直接使用行或者列标签、loc函数和iloc函数。

举个简单的例子:

import numpy as np
import pandas as pd
df = pd.DataFrame({"Fruits":["apple","pear","banana","watermelon"],"Price":[1.2,1.4,2.3,4.2],"Sales":[11,45,25,16]})
df

生成的DataFrame如下所示:

Fruits Price Sales
0 apple 1.2 11
1 pear 1.4 45
2 banana 2.3 25
3 watermelon 4.2 16

 

1、直接使用行或者列标签

假如我们要选取df的Fruits和Price两列,则

df[['Fruits','Price']]
Fruits Price
0 apple 1.2
1 pear 1.4
2 banana 2.3
3 watermelon 4.2

假如我们要选取df的第2、3行,则

df[2:4]
Fruits Price Sales
2 banana 2.3 25
3 watermelon 4.2 16

 

2、loc函数

loc函数是基于行标签和列标签进行索引的,其基本用法为:

DataFrame.loc[行标签,列标签]

假如我们要选取df的第2、3行和Price、Sales对应的列,则

df[2:3,'Price':'Sales']
Price Sales
2 2.3 25
3 4.2 16

假如我们要选取所有的行和Fruits、Sales对应的列,则

df.loc[:,['Fruits','Sales']]
Fruits Sales
0 apple 11
1 pear 45
2 banana 25
3 watermelon 16

 

3、iloc函数

iloc函数是基于行和列的位置进行索引的,索引值从0开始,并且得到的结果不包括最后一个位置的值,其基本用法为:

DataFrame.iloc[行位置,列位置]

假如我们要选取df的第2、3行和第1、2列,则

df.iloc[2:4,1:3]
Price Sales
2 2.3 25
3 4.2 16

假如我们要选取所有的行和第0、2列,则

df.iloc[:,[0,2]]
Fruits Sales
0 apple 11
1 pear 45
2 banana 25
3 watermelon 16

 

总结

关于python pandas中索引函数loc和iloc区别的文章就介绍至此,更多相关pandas索引函数loc和iloc内容请搜索编程宝库以前的文章,希望大家多多支持编程宝库

 1 Git简介Git 是目前世界上最先进的分布式版本控制系统(没有之一) 作用: 源代码管理 为什么要进行源代码管理? 方便多人协同开发 方便版本控制1.1 Git管理源代码 ...