Comment trouver toutes les valeurs uniques d'une colonne dans une dataframe avec pandas en python ?

Published: 29 juillet 2020

Tags: Python; Pandas; DataFrame;

DMCA.com Protection Status

Exemples de comment trouver toutes les valeurs unique d'une colonne dans une dataframe avec pandas en python:

Créer une dataframe avec pandas

Soit par exemple la dataframe suivante:

import pandas as pd

data = {'custumer id':['001','002','002','002','003','003','004','005','006'], 
        'custumer name':['Ben','Anna','Anna','Anna','Zoe','Zoe','Tom','John','Steve']}


df = pd.DataFrame(data)

donne

  custumer id custumer name
0         001           Ben
1         002          Anna
2         002          Anna
3         002          Anna
4         003           Zoe
5         003           Zoe
6         004           Tom
7         005          John
8         006         Steve

Trouver toutes les valeurs uniques dans la colonne 'custumer id'

Pour trouver les valeurs uniques dans la colonne 'custumer id' une solution est d'utiliser la fonction pandas unique

df['custumer id'].unique()

donne dans cet exemple

array(['001', '002', '003', '004', '005', '006'], dtype=object)

Trouver toutes les valeurs uniques en utilisant groupby()

Un autre exemple, soit la dataframe suivante:

import pandas as pd

data = {'custumer_id':['001','001','002','003','004','004','005','005','007'], 
        'household_id':['001','001','001','001','002','002','003','003','003']}


df = pd.DataFrame(data)

print(df)

donne

  custumer_id household_id
0         001          001
1         001          001
2         002          001
3         003          001
4         004          002
5         004          002
6         005          003
7         005          003
8         007          003

Pour trouver toutes les valeurs uniques de 'custumer_id' pour un household_id donné, on peut faire comme ceci:

df.groupby('household_id')['custumer_id'].unique()

donne

household_id
001    [001, 002, 003]
002              [004]
003         [005, 007]
Name: custumer_id, dtype: object

Références