Maison  >  Questions et réponses  >  le corps du texte

Python extrait le nom de domaine de l'URL

Comment Python extrait-il le nom de domaine de l'URL ? Les URL se présentent sous différents formats comme suit :

Entrez :

https://docs.google.com/spreadsheet/ccc?key=blah-blah-blah-blah#gid=1
https://stackoverflow.com/questions/1234567/blah-blah-blah-blah
http://www.domain.com
https://www.other-domain.com/whatever/blah/blah/?v1=0&v2=blah+blah ...

Sortie :

docs.google.com
stackoverflow.com
www.domain.com
www.other-domain.com
为情所困为情所困2669 Il y a quelques jours784

répondre à tous(2)je répondrai

  • 仅有的幸福

    仅有的幸福2017-06-28 09:24:24

    Utilisez le module urlparse intégré de Python

    from urlparse import *
    url = 'https://docs.google.com/spreadsheet/ccc?key=blah-blah-blah-blah#gid=1'
    result = urlparse(url)

    le résultat contient toutes les informations de l'URL

    répondre
    0
  • ringa_lee

    ringa_lee2017-06-28 09:24:24

    Source originale : liste de scripts pratiques Python

    Extraire le nom de domaine de l'URL

    def extractDomainFromURL(url):
        """Get domain name from url"""
        from urlparse import urlparse
        parsed_uri = urlparse(url)
        domain = '{uri.netloc}'.format(uri=parsed_uri)
        return domain

    répondre
    0
  • Annulerrépondre