찾다
데이터 베이스RedisRedis BloomFilter Bloom 필터 구현 방법

    Bloom 필터 개념

    Bloom이라는 남자가 1970년에 Bloom 필터(영어명: Bloom Filter)를 제안했습니다. 실제로는 긴 이진 벡터와 일련의 무작위 매핑 함수입니다. 블룸 필터는 요소가 컬렉션에 있는지 검색하는 데 사용할 수 있습니다. 장점은 일반 알고리즘에 비해 공간 효율성과 쿼리 시간이 훨씬 높다는 점이며, 단점은 일정 수준의 오인식률과 삭제가 어렵다는 점입니다.

    블룸 필터 원리

    블룸 필터의 원리는 집합에 요소가 추가되면 K개의 해시 함수를 사용하여 해당 요소를 비트 배열의 K개 포인트로 매핑하고 1로 설정하는 것입니다. 검색할 때 이 포인트가 모두 1인지 여부만 확인하면 세트에 있는지 여부를 대략 알 수 있습니다. 이 포인트 중 하나라도 0이면 검사된 요소가 모두 1이면 해당 요소가 없어야 합니다. 그런 다음 체크된 요소일 가능성이 높습니다. 이것이 블룸필터의 기본 아이디어이다.

    블룸 필터와 단일 해시 함수 비트맵의 차이점은 블룸 필터가 k개의 해시 함수를 사용하고 각 문자열이 k비트에 해당한다는 점입니다. 이를 통해 충돌 가능성을 줄입니다

    Redis BloomFilter Bloom 필터 구현 방법

    캐시 침투

    Redis BloomFilter Bloom 필터 구현 방법

    모든 쿼리는 DB에 직접 도달합니다

    간단히 말해서 먼저 데이터베이스의 모든 데이터를 In the filter에 로드합니다. , 예를 들어 현재 데이터베이스의 ID는 1, 2, 3

    입니다. 그런 다음 ID: 1을 예로 사용합니다. 위 그림에서 3번 해싱한 후 원래 값인 0을 1

    으로 3번 변경했습니다. 쿼리를 위해 데이터가 들어왔을 때 id의 값이 1이면 1을 3번 해시하여 3개의 해시 값이 위의 3개 위치와 완전히 동일하다는 것을 알게 됩니다. 1이 필터

    이고 그 반대도 다르다면 존재하지 않는다는 뜻입니다. 그렇다면 적용 시나리오는 어디에 있나요? 일반적으로 캐시 고장을 방지하기 위해 사용합니다

    간단히 말하면 데이터베이스의 ID는 1로 시작하여 자체적으로 증가합니다. 그러면 인터페이스가 ID로 쿼리된다는 것을 알고 있으므로 음수를 사용하여 쿼리하겠습니다. 이때 캐시에 그런 데이터가 없다는 걸 알게 됐고, 데이터베이스를 확인해봐도 아무것도 나오지 않았다. 요청이 하나 있는데 100, 1,000, 10,000 정도는 어떨까? 귀하의 DB는 기본적으로 이를 처리할 수 없습니다. 이것을 캐시에 추가하면 더 이상 존재하지 않게 됩니다. 그런 데이터가 없다고 판단되면 그냥 데이터를 반환하는 것이 낫지 않을까요? 그거 비어있어?

    이거 너무 효과가 좋은데 단점이 뭔가요? 네, 아래를 살펴보겠습니다

    블룸 필터의 단점

    블룸 필터가 시간과 공간적으로 더 효율적일 수 있는 이유는 판단의 정확성과 삭제의 편의성이 희생되기 때문입니다

    컨테이너에는 포함되지 않을 수도 있지만 찾아야 할 요소들이 있는데, 해시 연산으로 인해 k개의 해시 위치에 있는 이들 요소들의 값이 모두 1이기 때문에 오판으로 이어질 수 있다. 오판의 가능성이 있는 요소를 저장하기 위해 화이트리스트를 구축함으로써, 블룸 필터가 블랙리스트를 저장할 때 오판율을 줄일 수 있습니다.

    삭제가 어렵습니다. 컨테이너에 배치된 요소는 비트 배열의 k번째 위치에 1로 매핑되며, 삭제 시 다른 요소의 판단에 영향을 미칠 수 있으므로 단순히 0으로 설정할 수는 없습니다. Counting Bloom Filter를 사용할 수 있습니다

    FAQ

    1. 왜 여러 해시 함수를 사용합니까?

    해시 함수를 하나만 사용하면 해시 자체가 충돌하는 경우가 많습니다. 예를 들어 길이가 100인 배열의 경우 하나의 해시 함수만 사용하면 한 요소를 추가한 후 두 번째 요소를 추가할 때 충돌 확률은 1%, 세 번째 요소를 추가할 때 충돌 확률은 2입니다. %... 하지만 두 요소를 추가하면 충돌 확률은 1%입니다. 해시 함수는 요소를 추가한 후 두 번째 요소를 추가할 때 충돌 확률이 10,000분의 4로 감소합니다(4가지 가능한 충돌 상황, 총 상황 수는 100x100)

    Go 언어 구현

    package main
    import (
    	"fmt"
    	"github.com/bits-and-blooms/bitset"
    )
    //设置哈希数组默认大小为16
    const DefaultSize = 16
    //设置种子,保证不同哈希函数有不同的计算方式
    var seeds = []uint{7, 11, 13, 31, 37, 61}
    //布隆过滤器结构,包括二进制数组和多个哈希函数
    type BloomFilter struct {
    	//使用第三方库
    	set *bitset.BitSet
    	//指定长度为6
    	hashFuncs [6]func(seed uint, value string) uint
    }
    //构造一个布隆过滤器,包括数组和哈希函数的初始化
    func NewBloomFilter() *BloomFilter {
    	bf := new(BloomFilter)
    	bf.set = bitset.New(DefaultSize)
    
    	for i := 0; i < len(bf.hashFuncs); i++ {
    		bf.hashFuncs[i] = createHash()
    	}
    	return bf
    }
    //构造6个哈希函数,每个哈希函数有参数seed保证计算方式的不同
    func createHash() func(seed uint, value string) uint {
    	return func(seed uint, value string) uint {
    		var result uint = 0
    		for i := 0; i < len(value); i++ {
    			result = result*seed + uint(value[i])
    		}
    		//length = 2^n 时,X % length = X & (length - 1)
    		return result & (DefaultSize - 1)
    	}
    }
    //添加元素
    func (b *BloomFilter) add(value string) {
    	for i, f := range b.hashFuncs {
    		//将哈希函数计算结果对应的数组位置1
    		b.set.Set(f(seeds[i], value))
    	}
    }
    //判断元素是否存在
    func (b *BloomFilter) contains(value string) bool {
    	//调用每个哈希函数,并且判断数组对应位是否为1
    	//如果不为1,直接返回false,表明一定不存在
    	for i, f := range b.hashFuncs {
    		//result = result && b.set.Test(f(seeds[i], value))
    		if !b.set.Test(f(seeds[i], value)) {
    			return false
    		}
    	}
    	return true
    }
    func main() {
    	filter := NewBloomFilter()
    	filter.add("asd")
    	fmt.Println(filter.contains("asd"))
    	fmt.Println(filter.contains("2222"))
    	fmt.Println(filter.contains("155343"))
    }

    출력 결과는 다음과 같습니다.

    true
    false

    false

    위 내용은 Redis BloomFilter Bloom 필터 구현 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

    성명
    이 기사는 亿速云에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제
    Redis vs 데이터베이스 : 성능 비교Redis vs 데이터베이스 : 성능 비교May 14, 2025 am 12:11 AM

    redisoutperformstraditionaldatabasesinspeedforread/writeoperationsduetoitsin-memorynature, whiletraditionaldatabasesexexexexexexexexexexexexexexexexexexexexexexexexexexexexexexexexexexexexexexexexexexexexexexexexexexexexexexexexexexexexexexexexexexexexexexexexexexexexexexexexexexexexexexexexexceleclexquer

    기존 데이터베이스 대신 Redis를 언제 사용해야합니까?기존 데이터베이스 대신 Redis를 언제 사용해야합니까?May 13, 2025 pm 04:01 PM

    useredisinsteadofatraditionaldatabasewhenyorapplicationrequiresspeedandreal-timedataprocessing, suchasforcaching, sessionmanagement, orreal-timeanalytics.rediesxcelsin : 1) Caching, Retoadon-PrimaryDatabases; 2) 세션 관리, 단순화 datahandlon

    REDIS : SQL 너머 - NOSQL 관점REDIS : SQL 너머 - NOSQL 관점May 08, 2025 am 12:25 AM

    Redis는 고성능과 유연성으로 인해 SQL 데이터베이스를 뛰어 넘습니다. 1) Redis는 메모리 스토리지를 통해 매우 빠른 읽기 및 쓰기 속도를 달성합니다. 2) 복잡한 데이터 처리에 적합한 목록 및 컬렉션과 같은 다양한 데이터 구조를 지원합니다. 3) 단일 스레드 모델은 개발을 단순화하지만 높은 동시성은 병목 현상이 될 수 있습니다.

    REDIS : 기존 데이터베이스 서버와 비교REDIS : 기존 데이터베이스 서버와 비교May 07, 2025 am 12:09 AM

    Redis는 동시성이 높은 기존 데이터베이스보다 우수하고 대기 시간 시나리오가 낮지 만 복잡한 쿼리 및 트랜잭션 처리에는 적합하지 않습니다. 1.Redis는 메모리 저장, 빠른 읽기 및 쓰기 속도, 높은 동시성 및 낮은 대기 시간 요구 사항에 적합합니다. 2. 전통적인 데이터베이스는 디스크를 기반으로하며 복잡한 쿼리 및 트랜잭션 처리를 지원하며 데이터 일관성과 지속성이 강합니다. 3. Redis는 기존 데이터베이스의 보충 또는 대체물로 적합하지만 특정 비즈니스 요구에 따라 선택해야합니다.

    REDIS : 강력한 메모리 내 데이터 저장소 소개REDIS : 강력한 메모리 내 데이터 저장소 소개May 06, 2025 am 12:08 AM

    redisisahigh-performancein-memorydatrscructurestorestorethexcelscelsspeedandversitility

    Redis는 주로 데이터베이스입니까?Redis는 주로 데이터베이스입니까?May 05, 2025 am 12:07 AM

    Redis는 주로 데이터베이스이지만 단순한 데이터베이스 이상입니다. 1. 데이터베이스로서 Redis는 지속성을 지원하고 고성능 요구에 적합합니다. 2. 캐시로서 Redis는 응용 프로그램 응답 속도를 향상시킵니다. 3. 메시지 중개인으로서 Redis는 실시간 커뮤니케이션에 적합한 Publish-Subscribe 모드를 지원합니다.

    REDIS : 데이터베이스, 서버 또는 기타?REDIS : 데이터베이스, 서버 또는 기타?May 04, 2025 am 12:08 AM

    redisiSamultifacetedToolthatservesAsadatabase, Server 및 more.ItfunctionsAnin-memoryDatrastRuctureStore, SupportSvariousDatastructures, andCanbeusedAsacache, MessageBroker, SessionStorage, 및 FordiptributedLocking을 지원합니다.

    Redis : 목적과 주요 응용 프로그램을 공개합니다Redis : 목적과 주요 응용 프로그램을 공개합니다May 03, 2025 am 12:11 AM

    redisisanopen-source, in-memorydatructurestorestoreusedasadatabase, cache 및 messagebroker, excell

    See all articles

    핫 AI 도구

    Undresser.AI Undress

    Undresser.AI Undress

    사실적인 누드 사진을 만들기 위한 AI 기반 앱

    AI Clothes Remover

    AI Clothes Remover

    사진에서 옷을 제거하는 온라인 AI 도구입니다.

    Undress AI Tool

    Undress AI Tool

    무료로 이미지를 벗다

    Clothoff.io

    Clothoff.io

    AI 옷 제거제

    Video Face Swap

    Video Face Swap

    완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

    뜨거운 도구

    MinGW - Windows용 미니멀리스트 GNU

    MinGW - Windows용 미니멀리스트 GNU

    이 프로젝트는 osdn.net/projects/mingw로 마이그레이션되는 중입니다. 계속해서 그곳에서 우리를 팔로우할 수 있습니다. MinGW: GCC(GNU Compiler Collection)의 기본 Windows 포트로, 기본 Windows 애플리케이션을 구축하기 위한 무료 배포 가능 가져오기 라이브러리 및 헤더 파일로 C99 기능을 지원하는 MSVC 런타임에 대한 확장이 포함되어 있습니다. 모든 MinGW 소프트웨어는 64비트 Windows 플랫폼에서 실행될 수 있습니다.

    스튜디오 13.0.1 보내기

    스튜디오 13.0.1 보내기

    강력한 PHP 통합 개발 환경

    Dreamweaver Mac版

    Dreamweaver Mac版

    시각적 웹 개발 도구

    DVWA

    DVWA

    DVWA(Damn Vulnerable Web App)는 매우 취약한 PHP/MySQL 웹 애플리케이션입니다. 주요 목표는 보안 전문가가 법적 환경에서 자신의 기술과 도구를 테스트하고, 웹 개발자가 웹 응용 프로그램 보안 프로세스를 더 잘 이해할 수 있도록 돕고, 교사/학생이 교실 환경 웹 응용 프로그램에서 가르치고 배울 수 있도록 돕는 것입니다. 보안. DVWA의 목표는 다양한 난이도의 간단하고 간단한 인터페이스를 통해 가장 일반적인 웹 취약점 중 일부를 연습하는 것입니다. 이 소프트웨어는

    드림위버 CS6

    드림위버 CS6

    시각적 웹 개발 도구