
数据结构Series,一维数组,pandas.Series( data, index, dtype, name, copy)
DataFrame,二维数组,pandas.DataFrame( data, index, columns, dtype, copy)
查询数组行/列标签情况
sr.index # RangeIndex(start=0, stop=5, step=1) df.index # RangeIndex(start=0, stop=5, step=1) df.index.values # array类型 df.columns # Index(['姓名', '班级'], dtype='object') df.columns.values # array类型 df.axes # 返回含行列情况的数组
按行索引/切片
索引 df.iloc
df.iloc[0] # series df.iloc[[0]] # dataframe
切片 df[] / df.iloc
# 连续多行,前开后闭 df[2:3] # data frame df.iloc[2:3] # data frame # 不连续多行 df.iloc[[1,3]] # data frame
按列索引/切片
df[] / df.loc[] / df.iloc[]
# series testdf3['A'] # 按列名索引得到单列 testdf3.loc[:,'A'] # 按列名索引得到单列 testdf3.iloc[:,0] # 按列index索引得到单列 # data frame testdf3[['A','B']] # 按列名索引得到单/多列 testdf3.loc[:,['A','B']] # 按列名索引得到单/多列 testdf3.iloc[:,[0, 1]] # 按列index索引得到单/多列
行列同时索引/切片
df.loc[] / df.iloc[]
df.iloc[[1,3],0] # 1. series, 单行/单列索引 df.iloc[[1,3],[0]] # 2. dataframe, 单行/单列索引 df.iloc[[1,3],[1,3]] # 2. dataframe, 不连续多行/多列索引 df.iloc[[1,3],1:3] # 3. dataframe, 连续多行/多列切片 df.loc[1,["A","D"]] # series 对应上述1 df.loc[[1],["A","D"]] # df 对应上述2 df.loc[[1,3],["A","D"]] # df 对应上述2 df.loc[[1,3],"A":"D"] # df 对应上述3
df.loc 按名称,df.iloc 按index。
查询数据的基本信息
查询数据前/后片段
df.head(n) # 前n行 df.tail(n) # 尾n行
查询数据维度 (行/列总数)
df.shape # (3453, 27)
查询数据类型 / 索引
df.dtypes # 各列数据类型
查询数据总体情况
df.info()
参考资料:
Pandas DataFrame切片 - 知乎
活动地址:CSDN21天学习挑战赛