重庆分公司,新征程启航
为企业提供网站建设、域名注册、服务器等服务
小编给大家分享一下Pandas如何实现数据可视化基础绘图,希望大家阅读完这篇文章之后都有所收获,下面让我们一起去探讨吧!
创新互联建站于2013年成立,先为奎屯等服务建站,奎屯等地企业,进行企业商务咨询服务。为奎屯企业网站制作PC+手机+微官网三网同步一站式服务解决您的所有建站问题。1、环境
IDE : jupyter notebook
Anaconda 3.X
2、基于matplotlib
import matplotlib.pyplot as plt
注:导入matplotlib.pyplot
import matplotlib
matplotlib.style.use('ggplot')
%matplotlib inline
注:使用ggplot样式,并且将图画在jupyter notebook中
import pandas as pd
import numpy as np
ts = pd.Series(np.random.randn(1000), index=pd.date_range('1/1/2000', periods=1000))
ts.plot()
注:使用pandas创建一个Series(序列),序列值是随机生成的1000个标准正态分布值,索引是从2000-1-1开始的1000个时间序列值。
然后使用plot默认画图。可以看出,下图非常不规则,因为相邻的两个值也是随机大小。
import pandas as pd
import numpy as np
ts = pd.Series(np.random.randn(1000), index=pd.date_range('1/1/2000', periods=1000))
ts = ts.cumsum()
ts.plot()
注:这里加上了ts = ts.cumsum(),意思是返回累积值,在时间序列分析中,经常观察累积值曲线观察走势
这个累积值就看起来规则多了。
df = pd.DataFrame(np.random.randn(1000, 4), index=ts.index, columns=list('ABCD'))
df = df.cumsum()
plt.figure()
df.plot()
注:这里使用pandas创建了一个DataFrame(数据框,有点像excel表格那种),为什么不用刚才的Series呢?因为这里DataFrame中创建了4组数据,这4组数据都是随机生成的1000个标准正态分布值,索引是从2000-1-1开始的1000个时间序列值,并且也是求他们各自的累积值并且画图。
df3 = pd.DataFrame(np.random.randn(1000, 2), columns=['B', 'C']).cumsum()
df3['A'] = pd.Series(list(range(len(df))))
df3.plot(x='A', y='B')
注:使用DataFrame创建了2组数据,也是1000个标准正态分布,分别命名为B、C(就行excel中列名)。并且求累积值,再在原来的df(DataFrame的简称)(这里名字是df3)上加上一列名为A,A的值是0-999(使用df3的长度为1000,然后range被套列表生成一列数,作为x轴),y轴是B列数据(累积值),c列数据最后绘图没有用上。
最后Pandas基础绘图plot就完成了!
看完了这篇文章,相信你对“Pandas如何实现数据可视化基础绘图”有了一定的了解,如果想了解更多相关知识,欢迎关注创新互联成都网站设计公司行业资讯频道,感谢各位的阅读!
另外有需要云服务器可以了解下创新互联scvps.cn,海内外云服务器15元起步,三天无理由+7*72小时售后在线,公司持有idc许可证,提供“云服务器、裸金属服务器、高防服务器、香港服务器、美国服务器、虚拟主机、免备案服务器”等云主机租用服务以及企业上云的综合解决方案,具有“安全稳定、简单易用、服务可用性高、性价比高”等特点与优势,专为企业上云打造定制,能够满足用户丰富、多元化的应用场景需求。