Exemple de comment appliquer une fonction sur une ligne d'une dataframe avec pandas en python:
Créer une simple dataframe avec pandas
Commençons par créer une simple dataframe df:
>>> import pandas as pd>>> import numpy as np>>> data = np.arange(1,13)>>> data = data.reshape(3,4)>>> df = pd.DataFrame(data=data,columns=['a','b','c','d'])>>> dfa b c d0 1 2 3 41 5 6 7 82 9 10 11 12
Appliquer une fonction sur une ligne donnée
Essayons alors de modifier les éléments de la ligne 1 par exemple:
>>> df.iloc[1]a 5b 6c 7d 8
Si on veut ajouter 10 à tous les éléments de la ligne 1 on peut simplement faire comme ceci:
>>> df.iloc[1] = df.iloc[1] + 10>>> dfa b c d0 1 2 3 41 15 16 17 182 9 10 11 12
Autre exemple en multipliant tous les éléments de la ligne 1 par 2:
>>> df.iloc[1] = df.iloc[1] * 2.0>>> dfa b c d0 1.0 2.0 3.0 4.01 30.0 32.0 34.0 36.02 9.0 10.0 11.0 12.0
Pour appliquer une fonction plus compliquée comme une racine carrée par exemple, une solution est de passer par la fonction pandas apply():
>>> df.iloc[1].apply(np.sqrt)a 5.477226b 5.656854c 5.830952d 6.000000Name: 1, dtype: float64
ou encore comme ceci
>>> df.apply(lambda x: np.sqrt(x) if x.name == 1 else x, axis=1)a b c d0 1.000000 2.000000 3.000000 4.01 5.477226 5.656854 5.830952 6.02 9.000000 10.000000 11.000000 12.0
Exemple en définissant sa propre fonction:
>>> def myfunc(x):... return x**2 + 2*x + 3...>>>>>> df.iloc[1].apply(myfunc)a 963.0b 1091.0c 1227.0d 1371.0
Références
| Liens | Site |
|---|---|
| Apply a function to a single column in Dataframe | thispointer.com |
| pandas.DataFrame.apply | pandas doc |
