Pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素之一。
10-Minutes-to-pandas,这是十分钟搞定pandas 10 minutes in pandas的中文翻译。
Pandas_Exercises,这个是pandas的练习题。
-
-
-
0.导语
-
1.Series
-
2.DataFrame 2.1 DataFrame的简单运用
-
3.pandas选择数据 3.1 实战筛选 3.2 筛选总结
-
4.Pandas设置值 4.1 创建数据 4.2 根据位置设置loc和iloc 4.3 根据条件设置 4.4 按行或列设置 4.5 添加Series序列(长度必须对齐) 4.6 设定某行某列为特定值 4.7 修改一整行数据
-
5.Pandas处理丢失数据 5.1 创建含NaN的矩阵 5.2 删除掉有NaN的行或列 5.3 替换NaN值为0或者其他 5.4 是否有缺失数据NaN
-
6.Pandas导入导出 6.1 导入数据 6.2 导出数据
-
7.Pandas合并操作 7.1 Pandas合并concat 7.2.Pandas 合并 merge
-
7.2.1 定义资料集并打印出
-
7.2.2 依据key column合并,并打印
-
7.2.3 两列合并
-
7.2.4 Indicator设置合并列名称
-
7.2.5 依据index合并
-
7.2.6 解决overlapping的问题
-
-
8.Pandas plot出图
-
9.学习来源
-
-