重庆分公司,新征程启航
为企业提供网站建设、域名注册、服务器等服务
这篇文章主要讲解了“怎么使用Python的Pandas布尔索引”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“怎么使用Python的Pandas布尔索引”吧!
成都创新互联公司成立10年来,这条路我们正越走越好,积累了技术与客户资源,形成了良好的口碑。为客户提供网站制作、成都网站建设、网站策划、网页设计、域名申请、网络营销、VI设计、网站改版、漏洞修补等服务。网站是否美观、功能强大、用户体验好、性价比高、打开快等等,这些对于网站建设都非常重要,成都创新互联公司通过对建站技术性的掌握、对创意设计的研究为客户提供一站式互联网解决方案,携手广大客户,共同发展进步。
1.计算布尔值统计信息
import pandas as pd import numpy as np import matplotlib.pyplot as plt #读取movie,设定行索引是movie_title pd.options.display.max_columns = 50 movie = pd.read_csv("./data/movie.csv",index_col = 'movie_title') #判断电影时长是否超过两个小时 #Figure1 movie_2_hours = movie['duration'] > 120 #统计时长超过两小时的电影总数 print(movie_2_hours.sum()) #result:1039 #统计时长超过两小时的电影的比例 print(movie_2_hours.mean()) #统计False和True的比例 print(movie_2_hours.value_counts(normalize = True)) #比较同一个DataFrame中的两列 actors = movie[['actor_1_facebook_likes','actor_2_facebook_likes']].dropna() print((actors['actor_1_facebook_likes'] > actors['actor_2_facebook_likes']).mean()) #Figure2
运行结果:
Figure1
Figure2
2. 构建多个布尔条件
import pandas as pd import numpy as np import matplotlib.pyplot as plt #读取movie,设定行索引是movie_title pd.options.display.max_columns = 50 movie = pd.read_csv("./data/movie.csv",index_col = 'movie_title') #创建多个布尔条件 criteria1 = movie.imdb_score > 8 criteria2 = movie.content_rating == "PG-13" criteria3 = (movie.title_year < 2000) | (movie.title_year >= 2010) """ print(criteria1.head()) print(criteria2.head()) print(criteria3.head()) 运行结果:Figure1 """ #将多个布尔条件合并成一个 criteria_final = criteria1 & criteria2 & criteria3 print(criteria_final.head()) #运行结果:Figure2
运行结果:
Figure1
Figure2
3.用布尔索引过滤
import pandas as pd import numpy as np import matplotlib.pyplot as plt #读取movie,设定行索引是movie_title pd.options.display.max_columns = 50 movie = pd.read_csv("./data/movie.csv",index_col = 'movie_title') #创建第一个布尔条件 crit_a1 = movie.imdb_score > 8 crit_a2 = movie.content_rating == 'PG-13' crit_a3 = (movie.title_year < 2000) | (movie.title_year > 2009) final_crit_a = crit_a1 & crit_a2 & crit_a3 #创建第二个布尔条件 crit_b1 = movie.imdb_score < 5 crit_b2 = movie.content_rating == 'R' crit_b3 = (movie.title_year >= 2000) & (movie.title_year <= 2010) final_crit_b = crit_b1 & crit_b2 & crit_b3 #将两个条件用或运算合并起来 final_crit_all = final_crit_a | final_crit_b print(final_crit_all.head()) #Figure 1 #用最终的布尔条件过滤数据 print(movie[final_crit_all].head()) #Figure2
运行结果:
Figure1
Figure2
import pandas as pd import numpy as np import matplotlib.pyplot as plt #读取movie,设定行索引是movie_title pd.options.display.max_columns = 50 movie = pd.read_csv("./data/movie.csv",index_col = 'movie_title') #创建第一个布尔条件 crit_a1 = movie.imdb_score > 8 crit_a2 = movie.content_rating == 'PG-13' crit_a3 = (movie.title_year < 2000) | (movie.title_year > 2009) final_crit_a = crit_a1 & crit_a2 & crit_a3 #创建第二个布尔条件 crit_b1 = movie.imdb_score < 5 crit_b2 = movie.content_rating == 'R' crit_b3 = (movie.title_year >= 2000) & (movie.title_year <= 2010) final_crit_b = crit_b1 & crit_b2 & crit_b3 #将两个条件用或运算合并起来 final_crit_all = final_crit_a | final_crit_b #使用loc,对指定的列做过滤操作,可以清楚地看到过滤是否起作用 cols = ['imdb_score','content_rating','title_year'] movie_filtered = movie.loc[final_crit_all,cols] print(movie_filtered.head(10))
运行结果:
感谢各位的阅读,以上就是“怎么使用Python的Pandas布尔索引”的内容了,经过本文的学习后,相信大家对怎么使用Python的Pandas布尔索引这一问题有了更深刻的体会,具体使用情况还需要大家实践验证。这里是创新互联,小编将为大家推送更多相关知识点的文章,欢迎关注!