Comment convertir les pages d'un document pdf en images avec python ?


Exemples de comment convertir les pages d'un document pdf en images avec python

1. Avec le module python pdf2image

Pour installer le module voir pdf2image. Note: le module requière aussi le module poppler. Exemple d'installation avec conda:

conda install -c conda-forge poppler
pip install pdf2image

On peut alors utiliser le module pdf2image comme ceci:

>>> from pdf2image import convert_from_path

>>> pages = convert_from_path('document.pdf', dpi=200)

1.1 Convertir toutes les pages du document pdf en images:

Pour convertir toutes les pages du document pdf en image on peut utiliser une boucle

>>> for idx,page in enumerate(pages):
...     page.save('page'+str(idx)+'.jpg', 'JPEG')

1.2 Convertir une page donnée du document pdf en image:

Pour convertir une une page donnée

>>> page = pages[0]
>>> page.save('image.jpg', 'JPEG')

2. Avec imagemagick

Autre solution avec imagemagick](http://www.imagemagick.org/script/index.php). Pour créer un aperçu de la première page d'un document pdf il suffit alors de taper la commande :

convert MonDocument.pdf[0] image.jpg

[0] correspond ici à l'indice de la première page du document MonDocument.pdf. Pour transformer la page 4 en image il suffit de taper MonDocument.pdf[3]. Il est possible aussi de modifier la qualité de l'image et la taille:

convert -density 144 image.pdf[0] -resize 50% image.jpg

Note: pour transformer un pdf en images il existe aussi des convertisseurs disponible en ligne gratuitement comme: freepdfconvert.

Références