重庆分公司,新征程启航
为企业提供网站建设、域名注册、服务器等服务
pd.DataFrame中通常含有许多特征,有时候需要对每个含有缺失值的列,都用均值进行填充,代码实现可以这样:
成都创新互联是一家集网站建设,綦江企业网站建设,綦江品牌网站建设,网站定制,綦江网站建设报价,网络营销,网络优化,綦江网站推广为一体的创新建站企业,帮助传统企业提升企业形象加强企业竞争力。可充分满足这一群体相比中小企业更为丰富、高端、多元的互联网需求。同时我们时刻保持专业、时尚、前沿,时刻以成就客户成长自我,坚持不断学习、思考、沉淀、净化自己,让我们为更多的企业打造出实用型网站。for column in list(df.columns[df.isnull().sum() > 0]): mean_val = df[column].mean() df[column].fillna(mean_val, inplace=True) # -------代码分解------- # 判断哪些列有缺失值,得到series对象 df.isnull().sum() > 0 # output contributors True coordinates True created_at False display_text_range False entities False extended_entities True favorite_count False favorited False full_text False geo True id False id_str False ... # 根据上一步结果,筛选需要填充的列 df.columns[df.isnull().sum() > 0] # output Index(['contributors', 'coordinates', 'extended_entities', 'geo', 'in_reply_to_screen_name', 'in_reply_to_status_id', 'in_reply_to_status_id_str', 'in_reply_to_user_id', 'in_reply_to_user_id_str', 'place', 'possibly_sensitive', 'possibly_sensitive_appealable', 'quoted_status', 'quoted_status_id', 'quoted_status_id_str', 'retweeted_status'], dtype='object')