Rumah >hujung hadapan web >tutorial js >Mengapa pembangun berpengalaman tidak pernah menggunakan regex untuk pengesahan e-mel?

Mengapa pembangun berpengalaman tidak pernah menggunakan regex untuk pengesahan e-mel?

Susan Sarandon
Susan Sarandonasal
2024-12-18 01:59:091025semak imbas

Masalah Tiada Siapa Bicarakan

Mari menjadi nyata: pengesahan e-mel kedengaran mudah, tetapi ia adalah perangkap teknikal yang menangkap walaupun pembangun berpengalaman.

Apa yang Sebenarnya Berlaku?

Bayangkan anda sedang membina borang pendaftaran. Naluri pertama anda? Lemparkan regex pada medan e-mel. Tindakan buruk.

E-mel Pelik Sah Sebenar

# These are ALL technically valid emails!
valid_emails = [
    '"J. R. \"Bob\" Dobbs"@example.com',
    'admin@mailserver1',
    'user+tag@gmail.com',
    'postmaster@[123.123.123.123]'
]

Kebanyakan enjin regex akan tercekik ini.

Kenapa?

Standard e-mel adalah liar.

Kebanyakan pembangun akan terkejut apabila mengetahui bahawa ia sebenarnya adalah alamat e-mel yang sah secara teknikal mengikut RFC 5322. Spesifikasinya membenarkan:

  • Bahagian tempatan yang dipetik
  • Ulasan dalam kurungan
  • Komen bersarang
  • Watak istimewa di bahagian tempatan
  • Berbilang label domain

Kos Tersembunyi Pengesahan Buruk

1. Kehilangan Pengguna Sebenar

Reex yang ketat mungkin menolak alamat e-mel yang sangat bagus. Bayangkan menolak bakal pelanggan kerana e-mel mereka kelihatan "pelik", seperti mempunyai:

  • Tambahan pengalamatan (tag pengguna@gmail.com)
  • Struktur domain bukan konvensional
  • Set watak antarabangsa
  • Konvensyen penamaan yang sah tetapi kompleks

Pasukan produk anda pasti tidak berpuas hati, lebih-lebih lagi; jualan akan benar-benar marah.

2. Serangan ReDoS

Enjin Regex yang menggunakan pengesanan belakang terdedah kepada serangan Penafian Perkhidmatan Regex (ReDoS).

def dangerous_regex_check(user_input):
    # This regex can destroy your server's performance
    evil_pattern = r'^(a+)+b$'
    return re.match(evil_pattern, user_input)

# Just 30 characters can crash your system
malicious_input = 'a' * 30 + 'b'

Penyerang boleh membuat input yang membuat fungsi pengesahan anda terhenti.

Pendekatan Lebih Bijak

Pengesahan Asas Yang Sebenarnya Berfungsi

def smart_email_check(email):
    """Quick and dirty email sanity check"""
    return (
        email and 
        '@' in email and 
        '.' in email.split('@')[1] and
        len(email) <= 254  # Email length limit
    )

Penyelesaian Sebenar: Pengesahan

  1. Semakan sintaks asas
  2. Hantar pautan pengesahan
  3. Biarkan pengguna membuktikan e-mel berfungsi
def validate_email(email):
    if not basic_email_check(email):
        return False

    # Send verification token
    token = generate_unique_token()
    send_verification_email(email, token)

    return True

Alat Pro untuk Pembangun Sebenar

Daripada menulis regex anda sendiri, gunakan perpustakaan yang diuji:

  • Python: pengesah e-mel
  • JavaScript: validator.js
  • Java: Pengesah Apache Commons

Kelas Pengesahan yang Lebih Baik

class EmailValidator:
    @staticmethod
    def validate(email):
        """
        Smart email validation
        - Quick syntax check
        - Verify deliverability
        """
        try:
            # Use a smart library
            validate_email(
                email, 
                check_deliverability=True
            )
            return True
        except EmailInvalidError:
            return False

Garis Bawah

Pengesahan e-mel bukan tentang mencipta kubu yang tidak boleh dipecahkan. Ia mengenai:

  • Membenarkan pengguna sebenar masuk
  • Memastikan sistem anda selamat
  • Tidak membuat perkara menjadi rumit

Pengambilan Utama

  1. Lupakan regex kompleks
  2. Gunakan perpustakaan yang terbukti
  3. Hantar e-mel pengesahan
  4. Jadilah mesra pengguna

Pembangun yang mendapat hak ini menyelamatkan diri mereka daripada sakit kepala yang tidak terkira banyaknya.

Mahu saya pecahkan lagi bahagian ini?

Btw, saya sedang mengusahakan alat konteks tanpa had, di mana anda boleh menggunakan LLM pilihan anda tanpa perlu memberikan konteks lagi dan lagi.

Sila lihat ini, ia percuma sepenuhnya untuk pembangun.


Why experienced developers never use regex for email validation?

Atas ialah kandungan terperinci Mengapa pembangun berpengalaman tidak pernah menggunakan regex untuk pengesahan e-mel?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn