Maison > Questions et réponses > le corps du texte
Comment Python extrait-il le nom de domaine de l'URL ? Les URL se présentent sous différents formats comme suit :
Entrez :
https://docs.google.com/spreadsheet/ccc?key=blah-blah-blah-blah#gid=1
https://stackoverflow.com/questions/1234567/blah-blah-blah-blah
http://www.domain.com
https://www.other-domain.com/whatever/blah/blah/?v1=0&v2=blah+blah ...
Sortie :
docs.google.com
stackoverflow.com
www.domain.com
www.other-domain.com
仅有的幸福2017-06-28 09:24:24
Utilisez le module urlparse intégré de Python
from urlparse import *
url = 'https://docs.google.com/spreadsheet/ccc?key=blah-blah-blah-blah#gid=1'
result = urlparse(url)
le résultat contient toutes les informations de l'URL
ringa_lee2017-06-28 09:24:24
Source originale : liste de scripts pratiques Python
Extraire le nom de domaine de l'URL
def extractDomainFromURL(url):
"""Get domain name from url"""
from urlparse import urlparse
parsed_uri = urlparse(url)
domain = '{uri.netloc}'.format(uri=parsed_uri)
return domain