重庆分公司,新征程启航
为企业提供网站建设、域名注册、服务器等服务
小编给大家分享一下pandas中有哪些不常用的函数功能,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!
江干ssl适用于网站、小程序/APP、API接口等需要进行数据传输应用场景,ssl证书未来市场广阔!成为成都创新互联的ssl证书销售渠道,可以享受市场价格4-6折优惠!如果有意向欢迎电话联系或者加微信:18980820575(备注:SSL证书合作)期待与您的合作!
pandas 是我们常用的一个Python数据分析库。其中有不少操作是我们平时很少用到的。如下:
数据源:
df
获取某列的最小值:
df["数量"].min()
获取最小值所对应的汽车品牌:
df[df["数量"] == df["数量"].min()]["品牌"].values[0]
获取最大值同理。
然而,我们可以使用.idxmax() 或 idxmin() 函数来更优雅得实现以上功能:
df.loc[df["数量"].idxmin()]["品牌"]
可见,所得结果一致,并且语句显得更加简短优雅。
用 .cut() 函数将数据区间 [10,80] 均等地分成10份,等差为 (80 - 10) / 10 = 7.
pd.cut(df["数量"],10)
查看当前数据所属的划分区间:
pd.cut(df["数量"],10,labels = False)
比如获取数量最小的前3条记录:
df[["国家", "品牌", "数量"]].nsmallest(3, "数量")
再跟常用的方法对比一下,如下:
df.sort_values(by = "数量",ascending = True).head(3)
注意事项:.nsmallest() 或 .nlargest() 参数里的筛选条件一定要包好在所抽取出来的DataFrame里面。
4.1 普通的筛选求和:
df[(df["国家"] == "中国") & (df["品牌"] == "五菱")]["数量"].sum()
4.2 pivot_table
pd.pivot_table(df, values = "数量", index = "品牌", columns = "国家", aggfunc = "sum").fillna(0)
4.2 pivot_table + unstack
pd.pivot_table(df, values = "数量", index = "品牌", columns = "国家", aggfunc = "sum").fillna(0).unstack()
以上是“pandas中有哪些不常用的函数功能”这篇文章的所有内容,感谢各位的阅读!相信大家都有了一定的了解,希望分享的内容对大家有所帮助,如果还想学习更多知识,欢迎关注创新互联行业资讯频道!