python pandas中索引函数loc和iloc的区别分析
前言
使用pandas进行数据分析的时候,我们经常需要对DataFrame的行或者列进行索引。使用pandas进行索引的方法主要有三种:直接使用行或者列标签、loc函数和iloc函数。
举个简单的例子:
import numpy as np import pandas as pd df = pd.DataFrame({"Fruits":["apple","pear","banana","watermelon"],"Price":[1.2,1.4,2.3,4.2],"Sales":[11,45,25,16]}) df
生成的DataFrame如下所示:
Fruits | Price | Sales | |
0 | apple | 1.2 | 11 |
1 | pear | 1.4 | 45 |
2 | banana | 2.3 | 25 |
3 | watermelon | 4.2 | 16 |
1、直接使用行或者列标签
假如我们要选取df的Fruits和Price两列,则
df[['Fruits','Price']]
Fruits | Price | |
0 | apple | 1.2 |
1 | pear | 1.4 |
2 | banana | 2.3 |
3 | watermelon | 4.2 |
假如我们要选取df的第2、3行,则
df[2:4]
Fruits | Price | Sales | |
2 | banana | 2.3 | 25 |
3 | watermelon | 4.2 | 16 |
2、loc函数
loc函数是基于行标签和列标签进行索引的,其基本用法为:
DataFrame.loc[行标签,列标签]
假如我们要选取df的第2、3行和Price、Sales对应的列,则
df[2:3,'Price':'Sales']
Price | Sales | |
2 | 2.3 | 25 |
3 | 4.2 | 16 |
假如我们要选取所有的行和Fruits、Sales对应的列,则
df.loc[:,['Fruits','Sales']]
Fruits | Sales | |
0 | apple | 11 |
1 | pear | 45 |
2 | banana | 25 |
3 | watermelon | 16 |
3、iloc函数
iloc函数是基于行和列的位置进行索引的,索引值从0开始,并且得到的结果不包括最后一个位置的值,其基本用法为:
DataFrame.iloc[行位置,列位置]
假如我们要选取df的第2、3行和第1、2列,则
df.iloc[2:4,1:3]
Price | Sales | |
2 | 2.3 | 25 |
3 | 4.2 | 16 |
假如我们要选取所有的行和第0、2列,则
df.iloc[:,[0,2]]
Fruits | Sales | |
0 | apple | 11 |
1 | pear | 45 |
2 | banana | 25 |
3 | watermelon | 16 |
总结
关于python pandas中索引函数loc和iloc区别的文章就介绍至此,更多相关pandas索引函数loc和iloc内容请搜索编程宝库以前的文章,希望大家多多支持编程宝库!
1 Git简介Git 是目前世界上最先进的分布式版本控制系统(没有之一) 作用: 源代码管理 为什么要进行源代码管理? 方便多人协同开发 方便版本控制1.1 Git管理源代码 ...