Exemples de comment compter le nombre d'occurrence d'un element dans une dataframe colonne avec pandas en python:
Créer une simple dataframe avec pandas
Commençons par créer une simple dataframe df:
>>> import pandas as pd>>> import numpy as np>>> df = pd.DataFrame(columns=['target','a','b'])>>> df = df.append({"target": 0, "a": "no", "b": "M"}, ignore_index=True)>>> df = df.append({"target": 1, "a": "yes", "b": "F"}, ignore_index=True)>>> df = df.append({"target": 1, "a": "yes", "b": "M"}, ignore_index=True)>>> df = df.append({"target": 1, "a": "no", "b": "F"}, ignore_index=True)>>> df = df.append({"target": 0, "a": "no", "b": "F"}, ignore_index=True)>>> df
donne
target a b0 0 no M1 1 yes F2 1 yes M3 1 no F4 0 no F
Compter le nombre d'occurrence
Pour compter le nombres d'occurrences des éléments de la colonne 'target', une solution est d'utiliser la fonction value_counts
>>> df['target'].value_counts()
qui donne
1 30 2
soit le nombre 1 est présent 3 fois dans la colonne 'target' et 0 est présent 2 fois.
Echantillonner la dataframe
Autre solution pour obtenir par exemple le nombre d'occurrence de 0:
>>> sub_df = df[ df['target'] == 0 ]>>> sub_dftarget a b0 0 no M4 0 no F>>> len(sub_df)2
