数据结构
Series
Series
类似于表格中的一个列,即一个一维数组,可以保存任何数据
- 构造函数:
pandas.Series(data, index, dtype, name, copy)
data
:一组数据(ndarray
类型)
index
:数据索引标签,不指定则默认从0开始
dtype
:数据类型,默认自动判断
name
:设置Series的名称
copy
:拷贝数据,默认为False
索引(index)
- 可以使用指定的索引值来取出元素:
name[index]
- 自定义索引
- 使用List:
index = ['a', 'b', 'c', ...]
- 同样,可以使用类字典(key/value)的方式来创建
Series
- 可以使用
object.index
取出索引
DataFrame
DataFrame
是一个表格型的数据结构
- 含有一组有序的列,每列可以是不同的值类型
- 既有行索引,也有列索引
- 可以被看作由Series组成的字典(共用一个索引)
- 构造方法:
pandas.DataFrame(data, index, column, dtype, copy)
- 参数说明
data
:一组数据(ndarray/series/map/lists/dict
等类型)
index
:行标签,不指定则默认从0开始
column
:列标签,不指定则默认从0开始
dtype
:数据类型,默认自动判断
copy
:拷贝数据,默认为False
- 使用普通方法构建:
- 使用
ndarray
创建
- 使用字典创建,其中字典的key为列名
- 没有对应的部分数据为
NaN
索引
- 索引值的指定方法与
Series
一致
- 使用
object.object
和object.column
取出行索引和列索引
loc
- 若没有设置行索引,则默认从0开始:
df.loc[3]
- 使用
[[indexs]]
返回多行数据:df.loc[[0,1]]
- 返回的结果为一个
DataFrame
数据
- 同样可以使用
[from:to]
索引多行
iloc
- 通过普通索引(数字)的方式索引数据
- i->index
- 其返回值附带标签信息
- 条件过滤筛选
df[df["A"]>0]
df.loc[:, df.iloc[0] > 0]