Exemples de comment trouver toutes les valeurs unique d'une colonne dans une dataframe avec pandas en python:
Créer une dataframe avec pandas
Soit par exemple la dataframe suivante:
import pandas as pddata = {'custumer id':['001','002','002','002','003','003','004','005','006'],'custumer name':['Ben','Anna','Anna','Anna','Zoe','Zoe','Tom','John','Steve']}df = pd.DataFrame(data)
donne
custumer id custumer name0 001 Ben1 002 Anna2 002 Anna3 002 Anna4 003 Zoe5 003 Zoe6 004 Tom7 005 John8 006 Steve
Trouver toutes les valeurs uniques dans la colonne 'custumer id'
Pour trouver les valeurs uniques dans la colonne 'custumer id' une solution est d'utiliser la fonction pandas unique
df['custumer id'].unique()
donne dans cet exemple
array(['001', '002', '003', '004', '005', '006'], dtype=object)
Trouver toutes les valeurs uniques en utilisant groupby()
Un autre exemple, soit la dataframe suivante:
import pandas as pddata = {'custumer_id':['001','001','002','003','004','004','005','005','007'],'household_id':['001','001','001','001','002','002','003','003','003']}df = pd.DataFrame(data)print(df)
donne
custumer_id household_id0 001 0011 001 0012 002 0013 003 0014 004 0025 004 0026 005 0037 005 0038 007 003
Pour trouver toutes les valeurs uniques de 'custumer_id' pour un household_id donné, on peut faire comme ceci:
df.groupby('household_id')['custumer_id'].unique()
donne
household_id001 [001, 002, 003]002 [004]003 [005, 007]Name: custumer_id, dtype: object
