Python数据处理库pandas干货小

在使用pandas处理数据时,我们可能需要频繁判断DataFrame是否有数据,比如在分组时做细致的判断处理。

我们来看看各种判断方式,哪种是最高效的,如图:

df.empty,这是DataFrame内置的属性,可以看到虽然调用简单,但他是最耗时的len(df)==0,这是通过Python内置len方法判断DataFrame的行数,相对来说速度比较快,是第1种的3倍len(df.index)==0,这是判断DataFrame的行索引的值数量,这已经到达纳秒级别了,是其中最快的方式当然,如果不是非常密集的调用,那么选哪种都无所谓。当你需要对程序进行性能调优时,就可以考虑选用上述的方式2或3。




转载请注明:http://www.aierlanlan.com/rzgz/3255.html