Exemples de comment calculer la moyenne sur une colonne d'une dataframe avec pandas en python:
1 -- Créer une dataframe
Soit par exemple la dataframe suivante:
import pandas as pd
data = {'Name':['Ben','Anna','Zoe','Tom','John','Steve'],
'Age':[20,27,43,30,12,21]}
df = pd.DataFrame(data)
donne
Name Age
0 Ben 20
1 Anna 27
2 Zoe 43
3 Tom 30
4 John 12
5 Steve 21
2 -- Calculer la moyenne d'age
Pour calculer une moyenne sur la colonne intitulée 'Age' on peut utiliser la fonction pandas mean(), exemple
df['Age'].mean()
donne
25.5
3 -- Autre exemple avec des données manquantes
import pandas as pd
import numpy as np
data = {'Name':['Ben','Anna','Zoe','Tom','John','Steve','Bob'],
'Age':[20,27,43,30,12,21, np.nan]}
df = pd.DataFrame(data)
Name Age
0 Ben 20.0
1 Anna 27.0
2 Zoe 43.0
3 Tom 30.0
4 John 12.0
5 Steve 21.0
6 Bob NaN
df['Age'].mean()
donne
25.5