Comment convertir les pages d'un document pdf en images avec python ?

Published: 01 octobre 2019

DMCA.com Protection Status

Exemples de comment convertir les pages d'un document pdf en images avec python

1. Avec le module python pdf2image

Pour installer le module voir pdf2image. Note: le module requière aussi le module poppler. Exemple d'installation avec conda:

conda install -c conda-forge poppler
pip install pdf2image

On peut alors utiliser le module pdf2image comme ceci:

>>> from pdf2image import convert_from_path

>>> pages = convert_from_path('document.pdf', dpi=200)

1.1 Convertir toutes les pages du document pdf en images:

Pour convertir toutes les pages du document pdf en image on peut utiliser une boucle

>>> for idx,page in enumerate(pages):
...     page.save('page'+str(idx)+'.jpg', 'JPEG')

1.2 Convertir une page donnée du document pdf en image:

Pour convertir une une page donnée

>>> page = pages[0]
>>> page.save('image.jpg', 'JPEG')

2. Avec imagemagick

Autre solution avec imagemagick](http://www.imagemagick.org/script/index.php). Pour créer un aperçu de la première page d'un document pdf il suffit alors de taper la commande :

convert MonDocument.pdf[0] image.jpg

[0] correspond ici à l'indice de la première page du document MonDocument.pdf. Pour transformer la page 4 en image il suffit de taper MonDocument.pdf[3]. Il est possible aussi de modifier la qualité de l'image et la taille:

convert -density 144 image.pdf[0] -resize 50% image.jpg

Note: pour transformer un pdf en images il existe aussi des convertisseurs disponible en ligne gratuitement comme: freepdfconvert.

Références