Comment compter le nombres d'occurrences d'éléments d'une colonne dans une dataframe avec pandas en python ?

Exemples de comment compter le nombre d'occurrence d'un element dans une dataframe colonne avec pandas en python:

Créer une simple dataframe avec pandas

Commençons par créer une simple dataframe df:

>>> import pandas as pd
>>> import numpy as np

>>> df = pd.DataFrame(columns=['target','a','b'])

>>> df = df.append({"target": 0, "a":  "no", "b":  "M"}, ignore_index=True)
>>> df = df.append({"target": 1, "a":  "yes", "b":  "F"}, ignore_index=True)
>>> df = df.append({"target": 1, "a":  "yes", "b":  "M"}, ignore_index=True)
>>> df = df.append({"target": 1, "a":  "no", "b":  "F"}, ignore_index=True)
>>> df = df.append({"target": 0, "a":  "no", "b":  "F"}, ignore_index=True)

>>> df

donne

  target    a  b
0      0   no  M
1      1  yes  F
2      1  yes  M
3      1   no  F
4      0   no  F

Compter le nombre d'occurrence

Pour compter le nombres d'occurrences des éléments de la colonne 'target', une solution est d'utiliser la fonction value_counts

>>> df['target'].value_counts()

qui donne

1    3
0    2

soit le nombre 1 est présent 3 fois dans la colonne 'target' et 0 est présent 2 fois.

Echantillonner la dataframe

Autre solution pour obtenir par exemple le nombre d'occurrence de 0:

>>> sub_df = df[ df['target'] == 0 ]
>>>  sub_df 
  target   a  b
0      0  no  M
4      0  no  F
>>> len(sub_df) 
2

Références