Exemples de comment tracer un histogramme à partir des colonnes d'une dataframe avec pandas en python:
Table des matières
Créer une dataframe avec pandas
Créons une simple dataframe avec pandas:
import pandas as pd
import matplotlib.pyplot as plt
data = {'c':['a','a','a','b','b','b','a','a','b'],
'v1':[1,1,2,3,4,4,4,5,5],
'v2':[6,6,4,4,4,5,5,7,8]}
df = pd.DataFrame(data)
print(df)
donne
c v1 v2
0 a 1 6
1 a 1 6
2 a 2 4
3 b 3 4
4 b 4 4
5 b 4 5
6 a 4 5
7 a 5 7
8 b 5 8
Tracer des histogrammes
Pour tracer un histogramme relatif à une colonne donnée
hist = df['v1'].hist()
plt.savefig("pandas_hist_01.png", bbox_inches='tight', dpi=100)
Pour créer un histogramme depuis une colonne donnée en créant des catégories depuis une autre colonne:
hist = df['v1'].hist(by=df['c'])
plt.savefig("pandas_hist_02.png", bbox_inches='tight', dpi=100)
Pour créer deux histogrammes de puis les colonnes va et v2
df.hist(column=['v1','v2'])
plt.savefig("pandas_hist_03.png", bbox_inches='tight', dpi=100)
donne le même resultat que précédemment
hist = df[['v1','v2']].hist()
plt.savefig("pandas_hist_04.png", bbox_inches='tight', dpi=100)
Pour créer deux histogrammes qui partage les même axes x et y.:
hist = df[['v1','v2']].hist(sharey=True, sharex=True)
plt.savefig("pandas_hist_05.png", bbox_inches='tight', dpi=100)
hist = df.hist(column=['v1'], by=df['c'])
plt.savefig("pandas_hist_06.png", bbox_inches='tight', dpi=100)