Exemples de comment trouver toutes les colonnes d'une dataframe contenant un mot donné avec pandas ?
Créer une dataframe avec pandas
Commençons par créer une dataframe avec des pandas
import pandas as pd
import numpy as np
data = np.arange(1,33)
data = data.reshape(4,8)
df = pd.DataFrame(data=data,columns=['name','address_01','address_02','address_03',
'full address name','street address','zip code','county'])
print(df)
donne
name address_01 address_02 address_03 full address name \
0 1 2 3 4 5
1 9 10 11 12 13
2 17 18 19 20 21
3 25 26 27 28 29
street address zip code county
0 6 7 8
1 14 15 16
2 22 23 24
3 30 31 32
Colonnes contenant le mot "address"
df.filter(regex='address',axis=1) )
donne
address_01 address_02 address_03 full address name street address
0 2 3 4 5 6
1 10 11 12 13 14
2 18 19 20 21 22
3 26 27 28 29 30
Colonnes qui se terminent par le mot "address"
df.filter(regex='address$',axis=1)
donne
street address
0 6
1 14
2 22
3 30
Colonnes commençant par le mot "address"
df.filter(regex='^address',axis=1)
donne
address_01 address_02 address_03
0 2 3 4
1 10 11 12
2 18 19 20
3 26 27 28
En utilisant une "list comprehension"
Une autre solution:
col_list = [col for col in df.columns if 'address' in col]
print( df[col_list ] )
donne
address_01 address_02 address_03 full address name street address
0 2 3 4 5 6
1 10 11 12 13 14
2 18 19 20 21 22
3 26 27 28 29 30