缺失值处理
判断
datats_code symbol name area industry list_date0 000001.SZ1.0 平安银行 深圳 银行 199104031 000002.SZNaN 万科A 深圳全国地产 199101292 000004.SZ4.0 ST国华 NaN软件服务 199101143 000005.SZ5.0 ST星源 深圳环境保护 19901210data.isna()ts_code symbol name area industry list_date0 False False False FalseFalseFalse1 False True False FalseFalseFalse2 False False False TrueFalseFalse3 False False False FalseFalseFalsedata.isna()["area"]0 False1 False2True3 FalseName: area, dtype: booldata["area"].isna()0 False1 False2True3 FalseName: area, dtype: bool
填充(替换)
data.fillna("-999")ts_code symbol name area industry list_date0 000001.SZ 1.0 平安银行 深圳 银行 199104031 000002.SZ -999 万科A 深圳全国地产 199101292 000004.SZ 4.0 ST国华 -999软件服务 199101143 000005.SZ 5.0 ST星源 深圳环境保护 19901210data["area"].fillna("-999")0深圳1深圳2 -9993深圳Name: area, dtype: objectdata["area"] = data["area"].fillna("-999")datats_code symbol name area industry list_date0 000001.SZ1.0 平安银行 深圳 银行 199104031 000002.SZNaN 万科A 深圳全国地产 199101292 000004.SZ4.0 ST国华 -999软件服务 199101143 000005.SZ5.0 ST星源 深圳环境保护 19901210
删除
data.dropna()ts_code symbol name area industry list_date0 000001.SZ1.0 平安银行 深圳 银行 199104033 000005.SZ5.0 ST星源 深圳环境保护 19901210data["area"].isna()0 False1 False2True3 FalseName: area, dtype: booldata[~data["area"].isna()]ts_code symbol name area industry list_date0 000001.SZ1.0 平安银行 深圳 银行 199104031 000002.SZNaN 万科A 深圳全国地产 199101293 000005.SZ5.0 ST星源 深圳环境保护 19901210