Avec python il est possible de vérifier si une adresse url existe ou pas grâce aux modules httplib et urlparse. Voici un exemple de mise en pratique (source):
# -*- coding: utf-8 -*-
import httplib
from urlparse import urlparse
def checkUrl(url):
p = urlparse(url)
conn = httplib.HTTPConnection(p.netloc)
conn.request('HEAD', p.path)
resp = conn.getresponse()
return resp.status < 400
if __name__ == '__main__':
print checkUrl('http://fr.wikipedia.org/wiki/Napoléon_Ier')
print checkUrl('http://fr.wikipedia.org/wiki/Napoléon_123')
qui donne ici:
True
False
Dans cet exemple on a testé avec le script si les adresses urls: 'fr.wikipedia.org/wiki/Napoléon_Ier' et 'fr.wikipedia.org/wiki/Napoléon_123' existent. Vous pouvez alors remplacer ces adresses par des adresses url de votre choix.
Recherches associées
Liens | Site |
---|---|
httplib | Python Doc |
urlparse | Python Doc |
Python script to see if a web page exists without downloading the whole page? | stackoverflow |