Maison >interface Web >js tutoriel >Pourquoi les développeurs expérimentés n'utilisent jamais les regex pour la validation des e-mails ?

Pourquoi les développeurs expérimentés n'utilisent jamais les regex pour la validation des e-mails ?

Susan Sarandon
Susan Sarandonoriginal
2024-12-18 01:59:09976parcourir

Le problème dont personne ne parle

Soyons réalistes : la validation des e-mails semble simple, mais c'est un piège technique qui attrape même les développeurs expérimentés.

Que se passe-t-il réellement ?

Imaginez que vous créez un formulaire d'inscription. Votre premier réflexe ? Lancez une expression régulière dans le champ de courrier électronique. Mauvais coup.

E-mails étranges valides réels

# These are ALL technically valid emails!
valid_emails = [
    '"J. R. \"Bob\" Dobbs"@example.com',
    'admin@mailserver1',
    'user+tag@gmail.com',
    'postmaster@[123.123.123.123]'
]

La plupart des moteurs d'expressions régulières s'étoufferaient avec ceux-ci.

Pourquoi ?

Les normes de courrier électronique sont sauvages.

La plupart des développeurs seraient surpris d'apprendre qu'il s'agissait en fait d'une adresse e-mail techniquement valide selon la RFC 5322. La spécification permet :

  • Pièces locales citées
  • Commentaires entre parenthèses
  • Commentaires imbriqués
  • Caractères spéciaux dans les pièces locales
  • Plusieurs étiquettes de domaine

Les coûts cachés d’une mauvaise validation

1. Perdre de vrais utilisateurs

Une expression régulière stricte peut rejeter des adresses e-mail parfaitement bonnes. Imaginez refuser un client potentiel parce que son e-mail semble « bizarre », comme si :

  • Adressage Plus (user tags@gmail.com)
  • Structures de domaines non conventionnelles
  • Jeux de caractères internationaux
  • Conventions de dénomination légitimes mais complexes

Votre équipe produit serait vraiment mécontente, de plus ; les ventes seraient vraiment énervées.

2. Attaques ReDoS

Les moteurs Regex utilisant le backtracking sont sensibles aux attaques par déni de service Regex (ReDoS).

def dangerous_regex_check(user_input):
    # This regex can destroy your server's performance
    evil_pattern = r'^(a+)+b$'
    return re.match(evil_pattern, user_input)

# Just 30 characters can crash your system
malicious_input = 'a' * 30 + 'b'

Les attaquants peuvent créer des entrées qui bloquent votre fonction de validation.

Une approche plus intelligente

Une validation de base qui fonctionne réellement

def smart_email_check(email):
    """Quick and dirty email sanity check"""
    return (
        email and 
        '@' in email and 
        '.' in email.split('@')[1] and
        len(email) <= 254  # Email length limit
    )

La vraie solution : la vérification

  1. Vérification de la syntaxe de base
  2. Envoyer un lien de vérification
  3. Laissez l'utilisateur prouver que l'e-mail fonctionne
def validate_email(email):
    if not basic_email_check(email):
        return False

    # Send verification token
    token = generate_unique_token()
    send_verification_email(email, token)

    return True

Pro Tools pour les vrais développeurs

Au lieu d'écrire votre propre regex, utilisez des bibliothèques testées :

  • Python : validateur d'e-mails
  • JavaScript : validator.js
  • Java : validateur Apache Commons

Une meilleure classe de validation

class EmailValidator:
    @staticmethod
    def validate(email):
        """
        Smart email validation
        - Quick syntax check
        - Verify deliverability
        """
        try:
            # Use a smart library
            validate_email(
                email, 
                check_deliverability=True
            )
            return True
        except EmailInvalidError:
            return False

L'essentiel

La validation des e-mails ne consiste pas à créer une forteresse incassable. Il s'agit de :

  • Laisser entrer les vrais utilisateurs
  • Garder votre système en sécurité
  • Ne pas compliquer les choses

Points clés à retenir

  1. Oubliez les expressions régulières complexes
  2. Utilisez des bibliothèques éprouvées
  3. Envoyer des e-mails de vérification
  4. Soyez convivial

Les développeurs qui réussissent s'épargnent d'innombrables maux de tête.

Voulez-vous que je détaille davantage une partie de cela ?

Au fait, je travaille sur un outil contextuel illimité, où vous pouvez utiliser votre LLM préféré sans avoir besoin de donner le contexte encore et encore.

Regardez ceci, c'est entièrement gratuit pour les développeurs.


Why experienced developers never use regex for email validation?

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn