Pandas 数据结构 - Series

Pandas Series 代表表格中的一个列(column),类似于一维数组,可以保存任何数据类型。

Series 由索引(index)和列组成,函数如下:

pandas.Series( data, index, dtype, name, copy)

参数说明:

  • data:一组数据(ndarray 类型)。
  • index:数据索引标签,如果不指定,默认从 0 开始。
  • dtype:数据类型,默认会自己判断。
  • name:设置名称。
  • copy:拷贝数据,默认为 False。

创建一个简单的 Series 范例:

import pandas as pd

a = [1, 2, 3]
myvar = pd.Series(a)
print(myvar)

输出结果如下:

从上图可知,如果没有指定索引,索引值就从 0 开始,我们可以根据索引值读取数据:

import pandas as pd

a = [1, 2, 3]
myvar = pd.Series(a)
print(myvar[1])

输出结果如下:

2

我们可以指定索引值,如下范例:

import pandas as pd

a = ["Google", "Codebaoku", "Wiki"]
myvar = pd.Series(a, index = ["x", "y", "z"])
print(myvar)

输出结果如下:

根据索引值读取数据:

import pandas as pd

a = ["Google", "Codebaoku", "Wiki"]
myvar = pd.Series(a, index = ["x", "y", "z"])
print(myvar["y"])

输出结果如下:

Codebaoku

我们也可以使用 key/value 对象,类似字典来创建 Series:

import pandas as pd

sites = {1: "Google", 2: "Codebaoku", 3: "Wiki"}
myvar = pd.Series(sites)
print(myvar)

输出结果如下:

从上图可知,字典的 key 变成了索引值。

如果我们只需要字典中的一部分数据,只需要指定需要数据的索引即可,如下范例:

import pandas as pd

sites = {1: "Google", 2: "Codebaoku", 3: "Wiki"}
myvar = pd.Series(sites, index = [1, 2])
print(myvar)

输出结果如下:

设置 Series 名称参数:

import pandas as pd

sites = {1: "Google", 2: "Codebaoku", 3: "Wiki"}
myvar = pd.Series(sites, index = [1, 2], name="CODEBAOKU-Series-TEST" )
print(myvar)

Pandas 数据结构 DataFrame:DataFrame 是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔型值)。DataFrame 既有行索引也有列索引,它可以被看做由 Series 组成的字典(共同用一个索引)。