>웹 프론트엔드 >JS 튜토리얼 >빠른 일회용 이메일 도메인 탐지를 위해 역방향 트라이를 사용하는 방법

빠른 일회용 이메일 도메인 탐지를 위해 역방향 트라이를 사용하는 방법

DDD
DDD원래의
2024-12-14 03:42:09661검색

How to Use a Reverse Trie for Fast Disposable Email Domain Detection

Reverse Trie를 사용하여 일회용 이메일 도메인을 효율적으로 감지하는 방법을 알아보세요. 빠르고 정확한 결과를 위해 맞춤화된 확장 가능하고 메모리 효율적인 솔루션으로 도메인 조회를 최적화하세요.

  • 내 웹사이트에서 기사 읽기
  • 무료 일회용 이메일 도메인 탐지기 사용

일회용 이메일은 허위 가입, 스팸 등의 문제를 일으킬 수 있습니다. 사용자는 수천 개의 임시 이메일 생성기 중 하나에서 주소를 가져와서 전달합니다. 이메일 정규식의 GOAT조차도 여기서 당신을 구할 수 없습니다.

개인적으로 저는 모든 일회용 이메일 도메인의 큰 목록을 보유하는 것이 가장 쉽고 효과적인 솔루션이라고 생각합니다. 하지만 해당 목록을 조합하고 for ... of 루프를 시작하여 이를 확인하기 전에 O(n) 복잡성을 생각해 보세요!

이를 식별하는 가장 좋은 방법은 빠른 조회를 위한 효율적인 데이터 구조인 reverse Trie를 사용하는 것입니다.

리버스 트라이(Reverse Trie)란 무엇입니까?

먼저 Trie가 무엇인지 알아보겠습니다. 문자열이 다음과 같은 데이터 구조입니다.

  • 잘게 썬 것, 한 글자씩
  • 트리 구조로 조립

예를 들어, 보아, 브로, 브리에게 먹이를 주면 다음과 같이 Map을 사용하여 이들을 조립합니다.

b
 ├── o ── a
 └── r ── o  
     └─── i ── e

이 접근 방식을 사용하면 전체 목록을 순환하지 않고도 직접 조회할 수 있습니다. 각 문자는 더 깊은 검색을 안내합니다.

효율성을 위해 메모리를 교환합니다. 문자열을 찾는 데 걸리는 시간은 목록의 크기가 아니라 문자열의 길이에 따라 달라집니다!

reverse Trie는 문자열을 역순으로 저장하므로 도메인에 이상적입니다.

  • mailinator.com은 moc.rotanliam이 됩니다.
  • Trashmail.com은 moc.liambhsart가 됩니다.

이 구현에 대한 참고 사항

도메인을 역방향으로 전환하면 여러 도메인에서 공유되는 TLD(예: .com)에서 검색이 시작됩니다. 더욱 최적화하기 위해 TLD를 문자로 분할하는 대신 단일 키(com)로 저장합니다. 도메인의 나머지 부분은 표준 Trie 구조를 따릅니다.

역방향 트라이 도메인 구현

이것은 트리 구조이므로 각 노드는 해당 하위 항목을 참조합니다.

type TrieNode = Map<string, TrieNode>;

먼저, 도메인의 나머지 부분에서 TLD를 분할하는 유틸리티 기능:

private splitTLDFromRest(input: string) {
    const dot = input.lastIndexOf('.');
    const TLD = input.substring(dot + 1);
    const rest = input.substring(0, dot);
    return [TLD, rest];
}

lastIndexOf를 사용하면 foo.bar.baz.com과 같은 하위 도메인이 올바르게 처리됩니다.

다음으로 생성자는 Trie를 어셈블합니다.

export class ReverseTrieDomains {
    private root: TrieNode = new Map();

    // ...

    constructor(...domains: string[]) {
        for (const domain of domains) {
            // For "didof.dev"
            const [TLD, rest] = this.splitTLDFromRest(domain);
            // dev, didof

            // Keep the refence to the TLD node for final set
            let node = this.root.get(TLD);
            if (!node) node = new Map();

            // Start from TLD node, walk along the string in reverse
            let currentNode: TrieNode = node;
            for (let i = rest.length - 1; i >= 0; i--) {
                const char = rest[i];
                let childNode = currentNode.get(char);
                if (!childNode) {
                    childNode = new Map();
                    currentNode.set(char, childNode);
                }
                currentNode = childNode;
            }

            this.root.set(TLD, node);
        }
    }
}

도메인이 일회용인지 확인하려면 Trie를 탐색하세요.

export class ReverseTrieDomains {
    // ...

    public has(domain: string) {
        const [TLD, rest] = this.splitTLDFromRest(domain)

        const node = this.root.get(TLD)
        if (!node) return false

        let currentNode: TrieNode = node
        let isFullDomainFound = false
        for (let i = rest.length - 1; i >= 0; i--) {
            const char = rest[i]
            const childNode = currentNode.get(char)
            if (!childNode) return false
            currentNode = childNode
            if (i === 0) {
                isFullDomainFound = currentNode.size === 0;
            }
        }

        return isFullDomainFound
    }
}

결론

역방향 Trie를 사용하면 다음과 같은 여러 가지 이점을 얻을 수 있습니다.

  • 빠른 조회: 문자를 단계별로 탐색하여 빠른 결과를 얻을 수 있습니다.
  • 메모리 효율성: .com과 같은 일반적인 접미사는 한 번만 저장됩니다.
  • 확장성: 대규모 도메인 목록을 손쉽게 처리합니다.

일회성 이메일을 처리하는 경우 이 스마트하고 확장 가능한 솔루션을 구현할 수 있습니다.

위 내용은 빠른 일회용 이메일 도메인 탐지를 위해 역방향 트라이를 사용하는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.