说实话:电子邮件验证听起来很简单,但它是一个技术陷阱,即使是经验丰富的开发人员也会陷入困境。
假设您正在构建一个注册表单。你的第一直觉?在电子邮件字段中添加正则表达式。糟糕的举动。
# These are ALL technically valid emails! valid_emails = [ '"J. R. \"Bob\" Dobbs"@example.com', 'admin@mailserver1', 'user+tag@gmail.com', 'postmaster@[123.123.123.123]' ]
大多数正则表达式引擎都会因这些而窒息。
为什么?
电子邮件标准太疯狂了。
大多数开发人员会惊讶地发现,根据 RFC 5322,这些实际上是技术上有效的电子邮件地址。该规范允许:
严格的正则表达式可能会拒绝完美的电子邮件地址。想象一下因为潜在客户的电子邮件看起来“奇怪”而拒绝他们,就像有:
你的产品团队会非常不高兴,更重要的是;销售真的会很生气。
使用回溯的正则表达式引擎容易受到正则表达式拒绝服务 (ReDoS) 攻击。
def dangerous_regex_check(user_input): # This regex can destroy your server's performance evil_pattern = r'^(a+)+b$' return re.match(evil_pattern, user_input) # Just 30 characters can crash your system malicious_input = 'a' * 30 + 'b'
攻击者可以精心设计输入,使您的验证函数陷入停顿。
def smart_email_check(email): """Quick and dirty email sanity check""" return ( email and '@' in email and '.' in email.split('@')[1] and len(email) <= 254 # Email length limit )
def validate_email(email): if not basic_email_check(email): return False # Send verification token token = generate_unique_token() send_verification_email(email, token) return True
不要编写自己的正则表达式,而是使用经过测试的库:
class EmailValidator: @staticmethod def validate(email): """ Smart email validation - Quick syntax check - Verify deliverability """ try: # Use a smart library validate_email( email, check_deliverability=True ) return True except EmailInvalidError: return False
电子邮件验证并不是要创建一个牢不可破的堡垒。这是关于:
正确做到这一点的开发人员可以避免无数的麻烦。
想要我进一步分解其中的任何部分吗?
顺便说一句,我正在开发一个无限制的上下文工具,您可以在其中使用您喜欢的法学硕士,而无需一次又一次地提供上下文。
请检查一下,它对开发者完全免费。
以上是为什么经验丰富的开发人员从不使用正则表达式进行电子邮件验证?的详细内容。更多信息请关注PHP中文网其他相关文章!