Apres avoir lu un fichier quelconque en python on peut se retrouver avec des strings comprenant des caractères de contrôle. Pour supprimer ces derniers il est possible d'utiliser un regex comme ceci:
>>> import re
>>> s = "Salut \n Comment ca va ?"
>>> regex = re.compile(r'[\n\r\t]')
>>> s = regex.sub(" ", s)
>>> s
'Salut Comment ca va ?'
Deuxième méthode en utilisant translate, comme ceci
>>> import string
>>> s = "Salut \n Comment ca va ?"
>>> t = string.maketrans("\n\t\r", " ")
>>> s = s.translate(t)
>>> s
'Salut Comment ca va ?'
>>>
Voir Deleting specific control characters(\n \r \t) from a string pour une discussion sur la vitesse d'execution de ces deux méthodes.
Recherches associées
Liens | Site |
---|---|
re — Regular expression operations | python doc |
Deleting specific control characters(\n \r \t) from a string | stackoverflow |
string — Common string operations | python doc |