>데이터 베이스 >Redis >Redis 단어 분할 색인 방법을 사용하는 방법

Redis 단어 분할 색인 방법을 사용하는 방법

王林
王林앞으로
2023-05-26 17:28:521076검색

단어 분할 인덱스 방법

이 방법은 이전 글에서 선배님들의 의견을 종합해본 결과 Redis의 특성에 더 적합하고 일관성이 있다고 생각되는 유일한 방법입니다. 아직은 메모리만큼 효율적이지 않습니다.

자세한 구현 아이디어는 Redis 작성자의 블로그(참조 1)를 참조하세요. 여기 예제는 여전히 UserName(영어)을 기반으로 하며 구문에 대해 길이가 3인 단어 분할만 수행합니다. .

먼저 AutoComplete의 문자 검색을 기반으로 한 다음 모든 이름에 대해 단어 분할을 수행해야 합니다. 즉:

abc => (a, ab, abc)

a가 입력되면 집합 a를 직접 얻습니다. 콘텐츠, ab를 입력하면 컬렉션 ab의 콘텐츠를 직접 얻을 수 있습니다. 그런 다음 변환을 시작합니다. 먼저 User 테이블에서 이름을 분할해야 합니다.

var redis = ConnectionMultiplexer.Connect("localhost");var db = redis.GetDatabase();for (var i = 1; i < 4; i++)
{    var data = dbCon.Lookup<string, int>(string.Format(@"select words, id from (
                                    select Row_number() over (partition by words order by name) as rn,id,words from (
                                        select  id, SUBSTRING(name, 1, {0}) as words, name from User 
                                    ) as t
                                    ) t2 where rn <= {1} and words != &#39;&#39; and words is not null", i, 20));

    data.ForEach((key, item) =>  {
         db.SetAdd("capqueen:Cache:user:" + key.ToLower(), item.Select<int, RedisValue>(j => j).ToArray());
      });
}

1단계: SQL을 사용하여 각 세그먼트에 대한 처음 20개의 데이터를 정렬하고 필터링합니다. 여기에서는 OrmLite 구문이 사용됩니다.

파트 2: RedisSet에 저장. 이는 단지 인덱스일 뿐이며 특정 사용자 콘텐츠를 저장하지 않습니다.

검색할 때 다음을 구현할 수 있습니다.

public List<User> SearchWords(string keywords)
{            var redis = ConnectionMultiplexer.Connect("localhost");            var db = redis.GetDatabase();            var result = db.SetMembers("capqueen:Cache:user:" + keywords.ToLower());            var users = new List<User>();            if (result.Any())
            {                //转换成ids                var ids = result.ToList().Select<RedisValue, RedisKey>(i => i.ToString());                //按照keys获取value ,事先已经存好了Usersvar values = db.StringGet(ids.ToArray());                //构造List Json以加速解析var portsJson = new StringBuilder("[");

                values.ToList().ForEach(item =>{                    if (!string.IsNullOrWhiteSpace(item))
                    {
                        portsJson.Append(item).Append(",");
                    }
                });

                portsJson.Append("]");

                users = JsonConvert.DeserializeObject<List<User>>(portsJson.ToString());
            }
}

실제 테스트 후에는 이 방법이 더 좋습니다. 이전 제품이 훨씬 나아졌지만 성능은 여전히 ​​만족스럽지 않습니다.

스캔 검색 방법

이 방법은 제가 Redis 문서를 참고하다가 발견한 방법인데, 테스트라고 하더라도 프로덕션 환경에서는 대규모 쿼리에는 사용할 수 없을 것으로 추정됩니다.

Scan은 다양한 데이터 구조에 따라 SCAN, HSCAN, SSCAN 및 ZSCAN으로 구분됩니다. 자세한 내용은 설명서를 참조하세요. 여기서는 ZSCAN을 사용합니다.

ZSCAN 키 커서 [MATCH 패턴] [COUNT 개수]

여기서 커서는 검색 반복을 위한 커서입니다. 패턴은 일치 규칙입니다.

StackExchange.Redis가 사용되고 이것이 제공하는 zscan 메서드는 다음과 같습니다.

IEnumerable SortedSetScan(RedisKey key, RedisValue 패턴 = null, int pageSize = 10, 긴 커서 = 0, int pageOffset = 0, CommandFlags 플래그 = CommandFlags.None);

public void CreateTerminalCache(List<User> users)
{            if (users == null) return;            var db = ConnectionMultiplexer.GetDatabase();            var sourceData = new List<KeyValuePair<RedisKey, RedisValue>>();            //构造集合数据var list = users.Select(item =>{                var value = JsonConvert.SerializeObject(item);                //构造原始数据sourceData.Add(new KeyValuePair<RedisKey, RedisValue>("capqueen:users:" + item.Id, value));                //构造数据    return new SortedSetEntry(item.Name, item.Id);
            });            //添加进有序集合,采用name - id db.SortedSetAdd("capqueen:users:index", list.ToArray());            //添加港口数据key-value            db.StringSet(sourceData.ToArray(), When.Always, CommandFlags.None);
}

그런 다음 다음과 같이 검색하세요.

public List<User> GetUserByWord(string words)
{            var db = ConnectionMultiplexer.GetDatabase();            //搜索var result = db.SortedSetScan("capqueen:users:index", words + "*", 10, 1, 30, CommandFlags.None).Take(30).ToList();           var users = new List<User>();            if (result.Any())
            {                //转换成ids                var ids = result.ToList().Select<SortedSetEntry, RedisKey>(i => i.ToString());                //按照keys获取valuevar values = db.StringGet(ids.ToArray());                //构造List Json以加速解析var portsJson = new StringBuilder("[");

                values.ToList().ForEach(item =>{                    if (!string.IsNullOrWhiteSpace(item))
                    {
                        portsJson.Append(item).Append(",");
                    }
                });

                portsJson.Append("]");

                users = JsonConvert.DeserializeObject<List<User>>(portsJson.ToString());
            }            return users;
}

위 내용은 Redis 단어 분할 색인 방법을 사용하는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 yisu.com에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제