Exemples de conversion de données quantitatives en données catégorielles avec pandas en utilisant "cut":
Table des matières
Créer des données synthétiques
Commençons par créer de fausses données :
import randoml = [random.randint(0,100) for i in range(10)]
donne par exemple
[66, 44, 62, 99, 82, 13, 7, 58, 60, 38]
Enregistrer les données dans une dataframe
import pandas as pdimport numpy as npdata = np.array(l)df = pd.DataFrame(data,columns=['x'])print(df)
donne
x0 661 442 623 994 825 136 77 588 609 38
Aggregation
Pour convertir des données numériques en données catégorielles, une solution avec pandas consiste à utiliser cut
pd.cut(df['x'], [0,25,50,75,100], labels=['A', 'B', 'C', 'D'])
donne
0 C1 B2 C3 D4 D5 A6 A7 C8 C9 BName: x, dtype: categoryCategories (4, object): ['A' < 'B' < 'C' < 'D']
Créez une nouvelle colonne :
df['Cx'] = pd.cut(df['x'], [0,25,50,75,100], labels=['A', 'B', 'C', 'D'])print(df)
donne
x Cx0 66 C1 44 B2 62 C3 99 D4 82 D5 13 A6 7 A7 58 C8 60 C9 38 B
