Exemple de comment transformer une colonne de date de naissance en age avec pandas en python:
1 -- Créer une dataframe
Soit par exemple la dataframe suivante:
import pandas as pd
data = {'Name':['Ben','Anna','Zoe','Tom','John','Steve'],
'dob':['1982-07-08 00:00:00',
'1987-03-01 00:00:00',
'2016-02-12 00:00:00',
'2002-08-14 00:00:00',
'2011-01-19 00:00:00',
'2016-03-22 00:00:00']}
df = pd.DataFrame(data)
donne
print(df)
Name dob
0 Ben 1982-07-08 00:00:00
1 Anna 1987-03-01 00:00:00
2 Zoe 2016-02-12 00:00:00
3 Tom 2002-08-14 00:00:00
4 John 2011-01-19 00:00:00
5 Steve 2016-03-22 00:00:00
2 -- Convertir la colonne dob en datetime type
Convertir les elements de la colonne dob en datetime:
df['Date'] = pd.to_datetime(df.dob)
df['Date']
donne
0 1982-07-08
1 1987-03-01
2 2016-02-12
3 2002-08-14
4 2011-01-19
5 2016-03-22
3 -- Calculer l'age en fonction de la date de naissance
Créer une fonction qui calcule l'age en fonction de la date de naissance:
def from_dob_to_age(born):
today = datetime.date.today()
return today.year - born.year - ((today.month, today.day) < (born.month, born.day))
Obtenir l'age en appliquant la fonction ci-dessus:
df['Date'].apply(lambda x: from_dob_to_age(x))
0 37
1 33
2 4
3 17
4 9
5 4