文章大纲
1. 探索性数据分析2.代码样例3.效果4.解决pandas profile 中文显示的问题1. 探索性数据分析
数据的筛选、重组、结构化、预处理等都属于探索性数据分析的范畴,探索性数据分析是帮助数据分析师掌握数据结构的重要工具,也是奠定后续工作的成功基石。
在数据的分析项目中,数据的收集和预处理往往占据整个项目工作量的十之八九,正式这些简单的工作决定了整个项目的成败。
在数据分析进行之前,了解原始数据的分布,缺失值情况,数据的相关性等非常重要,今天介绍的python 库就可以非常便利而且炫酷的解决这个问题。
Generates profile reports from a pandas DataFrame. The pandas df.describe() function is great but a little basic for serious exploratory data analysis. pandas_profiling extends the pandas DataFrame with df.profile_report() for quick data analysis.
For each column the following statistics - if relevant for the column type - are presented in an interactive HTML report:
Essentials: type, unique values