Exemples de comment trouver toutes les valeurs unique d'une colonne dans une dataframe avec pandas en python:
Créer une dataframe avec pandas
Soit par exemple la dataframe suivante:
import pandas as pd
data = {'custumer id':['001','002','002','002','003','003','004','005','006'],
'custumer name':['Ben','Anna','Anna','Anna','Zoe','Zoe','Tom','John','Steve']}
df = pd.DataFrame(data)
donne
custumer id custumer name
0 001 Ben
1 002 Anna
2 002 Anna
3 002 Anna
4 003 Zoe
5 003 Zoe
6 004 Tom
7 005 John
8 006 Steve
Trouver toutes les valeurs uniques dans la colonne 'custumer id'
Pour trouver les valeurs uniques dans la colonne 'custumer id' une solution est d'utiliser la fonction pandas unique
df['custumer id'].unique()
donne dans cet exemple
array(['001', '002', '003', '004', '005', '006'], dtype=object)
Trouver toutes les valeurs uniques en utilisant groupby()
Un autre exemple, soit la dataframe suivante:
import pandas as pd
data = {'custumer_id':['001','001','002','003','004','004','005','005','007'],
'household_id':['001','001','001','001','002','002','003','003','003']}
df = pd.DataFrame(data)
print(df)
donne
custumer_id household_id
0 001 001
1 001 001
2 002 001
3 003 001
4 004 002
5 004 002
6 005 003
7 005 003
8 007 003
Pour trouver toutes les valeurs uniques de 'custumer_id' pour un household_id donné, on peut faire comme ceci:
df.groupby('household_id')['custumer_id'].unique()
donne
household_id
001 [001, 002, 003]
002 [004]
003 [005, 007]
Name: custumer_id, dtype: object