「来源:|大数据应用ID:Datalaus」
今日份知识你摄入了么?
Pandas库是Python中最强大的库之一。它建立在NumPy之上,为Python编程语言提供便于使用的数据结构,和数据分析工具。
请参阅下面的小节,了解Pandas提供的各种功能和工具。
目录:
1.Pandas数据结构2.删除3.排序和排名4.检索Series/DataFrame信息5.DataFrame总结6.选择7.应用函数8.数据对齐9.输入/输出
Pandas数据结构
Pandas库主要围绕两种类型的数据结构。第一个是称为Series的一维数组,第二个是称为DataFrame的二维表。
Series-一维标记数组
DataFrame——二维数据结构
删除(Dropping)
在本节中,你将学习如何从Series中删除特定值,以及如何从DataFrame中删除列或行。
下面代码中的s和df是本节中使用的Series和DataFrame示例。
从行中删除值(轴=0)
从列中删除值(轴=1)
排序和排名
在本节中,你将学习如何根据索引/列对DataFrame进行排序,以及如何对列值进行排序。
下面代码中的df是本节中使用的DataFrame示例。
沿轴按标签排序
沿轴按值排序
给条目分配等级
检索Series/DataFrame信息
在本节中,你可以学到如何从DataFrame中检索信息,该DataFrame包括维度、列名、列类型和索引范围。
下面代码中的df是本节中使用的DataFrame示例。
(行、列)
描述索引
描述DataFrame列
关于DataFrame的信息
非NA值的数量
DataFrame汇总信息
在本节中,你将学习如何检索DataFrame的汇总统计信息,其中包括每一列的总和、每一列的最小/最大值、每一列的平均值等等。
下面代码中的df是本节中使用的DataFrame示例。
值的总和
累计值
最小值
最大值
汇总统计
平均值
中位数
选择
在本节中,你将学习如何从Series和DataFrame中检索特定的值。
下面代码中的s和df是本节中使用的Series和DataFrame示例。
获取一个元素
获取DataFrame的子集
按行和列选择单个值
按行和列的标签选择单个值
选择子集行中的一行
选择子集列中的一列
选择行和列
使用Filter函数调整DataFrame
将Seriess的索引a设置为6
应用函数
在本节中,你将学习如何将函数应用于DataFrame或特定列的所有值。
下面代码中的df是本节中使用的DataFrame示例。
应用函数
数据对齐
在本节中,你将学习如何对两个不同索引的Series进行加、减和除运算。
下面代码中,s和s3都是本节中使用的Series示例。
内部数据对齐
使用填充方法的算术运算
输入/输出
在本节中,你将学习如何使用Pandas将CSV文件、Excel文件和SQLQuery读取到Python中。你还将学习如何将Pandas中的DataFrame导出至CSV文件、Excel文件和SQLQuery。
读取CSV文件
写入CSV文件
读取Excel文件
写入Excel文件
从同一个文件中读取多个工作表
读取SQLQuery
写入SQLQuery
从过去到现在直至未来,Python一直是数据科学领域的领头羊。Pandas是其中最强大的库之一,今天许多数据科学家都要求掌握Pandas知识。
初学者可使用此基础知识手册作为使用指南,有需要时可返回查看,这样你就可以很好地掌握Pandas库。感谢你的阅读!希望这篇关于Python的常用函数对你起到了帮助!
原文作者:ChristopherZita
翻译作者:Lia
美工编辑:过儿
校对审稿:JiaweiTong
原文链接: