Exemples de comment calculer la moyenne sur une colonne d'une dataframe avec pandas en python:
1 -- Créer une dataframe
Soit par exemple la dataframe suivante:
import pandas as pddata = {'Name':['Ben','Anna','Zoe','Tom','John','Steve'],'Age':[20,27,43,30,12,21]}df = pd.DataFrame(data)
donne
Name Age0 Ben 201 Anna 272 Zoe 433 Tom 304 John 125 Steve 21
2 -- Calculer la moyenne d'age
Pour calculer une moyenne sur la colonne intitulée 'Age' on peut utiliser la fonction pandas mean(), exemple
df['Age'].mean()
donne
25.5
3 -- Autre exemple avec des données manquantes
import pandas as pdimport numpy as npdata = {'Name':['Ben','Anna','Zoe','Tom','John','Steve','Bob'],'Age':[20,27,43,30,12,21, np.nan]}df = pd.DataFrame(data)Name Age0 Ben 20.01 Anna 27.02 Zoe 43.03 Tom 30.04 John 12.05 Steve 21.06 Bob NaNdf['Age'].mean()
donne
25.5
