pandas 常用函数与方法
| 函数或方法 | 说明 |
|---|---|
| Series | 构造序列类型对象 |
| DataFrame | 构造数据框类型对象 |
| read_table | 读取文本文件的函数,支持txt、csv等格式 |
| read_csv | 读取文本文件的函数,支持txt、csv等格式 |
| read_excel | 读取电子表格 |
| read_sql | 读取数据库数据的函数 |
| head/tail | 显示数据框首/末几行数据 |
| shape | 返回数据框行列数 |
| dtypes | 返回数据框中各变量数据类型 |
| to_datetime | 将变量转换为日期时间类型 |
| astype | 将变量转换为其他类型 |
| describe | 统计性描述 |
| colums | 返回数据框变量名 |
| index | 返回数据框索引 |
| apply | 对序列或数据框进行映射 |
| value_counts | 统计序列值频次 |
| reset_index | 将行索引转换为变量 |
| duplicated | 检验观测是否重复 |
| drop_duplicates | 删除重复项 |
| drop | 删除变量名或观测 |
| dropna | 删除缺失值 |
| fillna | 填充缺失值 |
| quantile | 统计序列分位数 |
| plot | 对序列和数据框图进行绘图 |
| iloc/loc/ix | 数据框子集获取 |
| pivot_table | 构建透视表 |
| concat | 实现多表纵向合并 |
| merge | 实现两表水平拓展 |
| groupby | 分组聚合时,指定分组变量 |
| aggregate | 指定聚合统计 |
| rename | 修改数据框变量名 |