Maison >base de données >Redis >Introduction détaillée aux scénarios d'application Redis
Redis a créé une nouvelle façon de stocker les données. Grâce à Redis, nous n'avons pas à nous concentrer sur la façon de mettre l'éléphant au réfrigérateur face à une base de données aux fonctions monotones. , nous utilisons les structures de données et les opérations de données flexibles de Redis pour construire différents réfrigérateurs pour différents éléphants. J'espère que vous aimez cette métaphore.
1. Types de données couramment utilisés dans Redis (recommandé : Tutoriel vidéo Redis)
Les types de données les plus couramment utilisés dans Redis incluent principalement les cinq types suivants :
String , Hash, List, Set, Sorted set
Avant de décrire ces types de données en détail, utilisons d'abord une image pour comprendre comment ces différents types de données sont décrits dans la gestion de la mémoire interne de Redis :
Tout d'abord, Redis utilise un objet redisObject en interne pour représenter toutes les clés et valeurs. Les informations principales de redisObject sont telles qu'indiquées dans la figure ci-dessus : le type représente le type de données spécifique. d'un objet de valeur, le codage C'est la façon dont les différents types de données sont stockés dans Redis.
Par exemple : type=string signifie que la valeur est stockée sous forme de chaîne ordinaire, alors l'encodage correspondant peut être brut ou int. S'il est int, cela signifie que le redis réel stocke et représente ce caractère en interne. selon la classe numérique, String, bien sûr, le principe est que la chaîne elle-même peut être représentée par une valeur numérique, telle que : "123" "456" de telles chaînes.
Une note spéciale doit être faite ici sur le champ vm. Ce n'est que lorsque la fonction de mémoire virtuelle de Redis est activée que ce champ peut réellement allouer de la mémoire. Cette fonction est désactivée par défaut.
À partir de la figure ci-dessus, nous pouvons constater que Redis utilise redisObject pour représenter toutes les données clé/valeur, ce qui constitue un gaspillage de mémoire. Bien entendu, ces coûts de gestion de la mémoire visent principalement à fournir une interface de gestion unifiée pour différentes données. types de Redis, l'auteur actuel propose également une variété de méthodes pour nous aider à économiser autant que possible l'utilisation de la mémoire, dont nous parlerons en détail plus tard.
2. Application et mise en œuvre de différents types de données
Analysons d'abord l'utilisation et la mise en œuvre interne de ces cinq types de données un par un :
1.
La structure de données String est un simple type clé-valeur. En fait, la valeur n'est pas seulement une chaîne, mais aussi un nombre. Commandes courantes : get, set, incr, decr, mget, etc. Scénarios d'application : la chaîne est le type de données le plus couramment utilisé, et le stockage clé/valeur ordinaire peut être classé dans cette catégorie, ce qui signifie que les fonctions Memcached actuelles peuvent être pleinement réalisées et plus efficaces. Vous pouvez également profiter des fonctions de persistance planifiée, de journaux d'opérations et de réplication de Redis. En plus de fournir les mêmes opérations get, set, incr, decr et autres que Memcached, Redis fournit également les opérations suivantes :<.>ID utilisateur Pour la clé de recherche, l'objet utilisateur de valeur stockée contient le nom, l'âge, la date de naissance et d'autres informations. S'il est stocké à l'aide d'une structure clé/valeur commune, il existe deux méthodes de stockage principales :
<.>
La première méthode utilise l'ID utilisateur comme clé de recherche, encapsule d'autres informations dans un objet et les stocke de manière sérialisée. L'inconvénient de cette méthode est qu'elle augmente la surcharge de sérialisation/désérialisation et. nécessite une modification. Lorsqu'une des informations est récupérée, l'objet entier doit être récupéré et l'opération de modification doit protéger la concurrence, introduisant des problèmes complexes tels que CAS.
La deuxième méthode consiste à stocker autant de paires clé-valeur qu'il y a de membres dans l'objet d'informations utilisateur, et à utiliser l'ID utilisateur + le nom de l'attribut correspondant comme un identifiant unique pour l'obtenir. Bien que les problèmes de surcharge de sérialisation et de concurrence soient éliminés pour la valeur de l'attribut correspondant, l'ID utilisateur est stocké de manière répétée. S'il existe une grande quantité de telles données, le gaspillage de mémoire reste très considérable.
Ensuite, le Hash fourni par Redis résout très bien ce problème. Le Hash de Redis stocke en fait la valeur en interne sous forme de HashMap, et fournit une interface pour un accès direct aux membres de cette Map, comme indiqué ci-dessous :
En d'autres termes, la clé est toujours l'ID utilisateur et la valeur est une Map. La clé de cette Map est le nom de l'attribut du membre, et la valeur est la valeur de l'attribut. l'accès aux données peut se faire directement via la clé de la carte interne. (Dans Redis, la clé de la carte interne est appelée champ), c'est-à-dire que vous pouvez utiliser les données d'attribut correspondantes via la clé (ID utilisateur) + champ ( étiquette d'attribut). Il n'est pas nécessaire de stocker les données à plusieurs reprises et cela ne provoquera pas de problèmes de sérialisation et de concurrence. Très bien résolu le problème.
Il convient également de noter ici que Redis fournit une interface (hgetall) pour obtenir directement toutes les données d'attribut. Cependant, s'il y a de nombreux membres de la Map interne, cela implique l'opération de parcourir toute la Map interne. En raison du modèle Redis à thread unique, cette opération de traversée peut prendre du temps et les autres demandes des clients ne répondront pas du tout. Cela nécessite une attention particulière.
Scénario d'utilisation : stockez certaines données modifiées, telles que les informations utilisateur, etc.
Méthode d'implémentation :
Comme mentionné ci-dessus, le Redis Hash correspondant à la Value est en fait un HashMap. En fait, il existe deux implémentations différentes. Lorsque le Hash a moins de membres, Redis l'utilisera. pour économiser de la mémoire. Il est stocké de manière compacte d'une manière similaire à un tableau unidimensionnel sans utiliser la véritable structure HashMap. Le codage de la valeur correspondante redisObject est zipmap. Lorsque le nombre de membres augmente, il sera automatiquement converti en un. vrai HashMap À l’heure actuelle, l’encodage est ht.
3. Liste
Commandes communes : lpush, rpush, lpop, rpop, lrange, etc.
Scénarios d'application :
Il existe de nombreux scénarios d'application pour la liste Redis, et c'est également l'une des structures de données les plus importantes de Redis. Par exemple, la liste de suivi de Twitter, la liste de fans, etc. peuvent tous être créés à l’aide de la structure de liste Redis.
La liste est une liste chaînée. Je pense que toute personne ayant une certaine connaissance de la structure des données devrait être capable de comprendre sa structure. En utilisant la structure Liste, nous pouvons facilement implémenter des fonctions telles que le classement des dernières nouvelles. Une autre application de List est la file d'attente de messages.
Vous pouvez utiliser l'opération PUSH de List pour stocker des tâches dans la liste, puis le thread de travail utilise l'opération POP pour supprimer les tâches à exécuter. Redis fournit également une API pour exploiter un certain segment dans la liste. Vous pouvez directement interroger et supprimer des éléments d'un certain segment dans la liste.
Méthode d'implémentation :
L'implémentation de la liste Redis est une liste chaînée bidirectionnelle, qui peut prendre en charge la recherche inversée et le parcours, ce qui est plus pratique à utiliser, mais cela entraîne une surcharge de mémoire supplémentaire .RedisinterneDe nombreuses implémentations, y compris les files d'attente de tampon d'envoi, etc., utilisent également cette structure de données.
La liste de Redis est une liste doublement chaînée dans laquelle chaque sous-élément est de type String. Vous pouvez ajouter ou supprimer des éléments de la tête ou de la queue de la liste via des opérations push et pop, afin que la liste puisse être. utilisé comme pile ou file d'attente.
Scénarios d'utilisation :
Système de file d'attente de messages
Vous pouvez créer un système de file d'attente à l'aide d'une liste, et vous pouvez même créer un système de file d'attente prioritaire à l'aide d'un ensemble trié.
Par exemple : utiliser Redis comme collecteur de journaux
Il s'agit en fait d'une file d'attente. Plusieurs points de terminaison écrivent les informations du journal sur Redis, puis un travailleur écrit uniformément tous les journaux sur le disque.
Opération pour obtenir les N dernières données
Enregistrez la liste des N premiers ID d'utilisateur connectés les plus récents, et la plage au-delà peut être obtenue à partir de la base de données.
//把当前登录人添加到链表里 ret = r.lpush("login:last_login_times", uid) //保持链表只有N位 ret = redis.ltrim("login:last_login_times", 0, N-1) //获得前N个最新登陆的用户Id列表 last_login_list = r.lrange("login:last_login_times", 0, N-1)
Par exemple, sina Weibo :
Dans Redis, notre dernier identifiant Weibo utilise un cache résident, qui est toujours mis à jour. Mais nous l'avons limité à 5 000 identifiants, donc notre fonction d'obtention d'identifiant demandera toujours à Redis. Ce n'est que lorsque les paramètres start/count dépassent cette plage que vous devez accéder à la base de données.
Notre système ne "vide" pas le cache comme la manière traditionnelle, les informations dans l'instance Redis sont toujours cohérentes. La base de données SQL (ou autre type de base de données sur le disque dur) ne sera déclenchée que lorsque l'utilisateur aura besoin d'obtenir des données "lointaines", et la page d'accueil ou la première page de commentaires ne gênera pas la base de données sur le disque dur.
4. Définir
Commandes communes :
sadd, spop, smembers, sunion, etc.
Scénarios d'application :
Les fonctions externes fournies par Redis set sont similaires à list, qui est une fonction de liste. La particularité est que set peut automatiquement dédupliquer une liste. de données, lorsque vous ne voulez pas de données en double, set est un bon choix et set fournit une interface importante pour déterminer si un certain membre fait partie d'une collection d'ensembles, ce que la liste ne peut pas fournir.
Set est un ensemble, et le concept d'un ensemble est une combinaison d'un ensemble de valeurs uniques. Certaines données collectives peuvent être stockées à l'aide de la structure de données Set fournie par Redis.
Cas :
Dans l'application Weibo, tous les abonnés d'un utilisateur peuvent être stockés dans une collection, et tous les fans peuvent être stockés dans une collection. Redis fournit également des opérations telles que l'intersection, l'union et la différence pour les collections, ce qui peut être très pratique pour implémenter des fonctions telles que l'attention commune, les préférences communes et les amis du deuxième degré. Pour toutes les opérations de collection ci-dessus, vous pouvez également utiliser différentes commandes. sélections. Renvoyez les résultats au client ou enregistrez-les dans une nouvelle collection.
Set est un ensemble, un ensemble non ordonné de type String. Set est implémenté via une table de hachage. Le concept est fondamentalement similaire à un ensemble en mathématiques. Il peut s'agir d'une intersection, d'une union, d'une différence, etc. Il n'y a pas d'ordre.
Méthode de mise en œuvre :
set 的内部实现是一个 value永远为null的HashMap,实际就是通过计算hash的方式来快速排重的,这也是set能提供判断一个成员是否在集合内的原因。
使用场景:
交集,并集,差集:(Set)
//book表存储book名称 set book:1:name ”The Ruby Programming Language” set book:2:name ”Ruby on rail” set book:3:name ”Programming Erlang” //tag表使用集合来存储数据,因为集合擅长求交集、并集 sadd tag:ruby 1 sadd tag:ruby 2 sadd tag:web 2 sadd tag:erlang 3 //即属于ruby又属于web的书? inter_list = redis.sinter("tag.web", "tag:ruby") //即属于ruby,但不属于web的书? inter_list = redis.sdiff("tag.ruby", "tag:web") //属于ruby和属于web的书的合集? inter_list = redis.sunion("tag.ruby", "tag:web")
获取某段时间所有数据去重值
这个使用Redis的set数据结构最合适了,只需要不断地将数据往set中扔就行了,set意为集合,所以会自动排重。
5、Sorted Set
常用命令:
zadd,zrange,zrem,zcard等
使用场景:
Redis sorted set的使用场景与set类似,区别是set不是自动有序的,而sorted set可以通过用户额外提供一个优先级(score)的参数来为成员排序,并且是插入有序的,即自动排序。当你需要一个有序的并且不重复的集合列表,那么可以选择sorted set数据结构,比如twitter 的public timeline可以以发表时间作为score来存储,这样获取时就是自动按时间排好序的。
和Set相比,Sorted Set增加了一个权重参数score,使得集合中的元素能够按score进行有序排列,比如一个存储全班同学成绩的Sorted Set,其集合value可以是同学的学号,而score就可以是其考试得分,这样在数据插入集合的时候,就已经进行了天然的排序。
另外还可以用Sorted Set来做带权重的队列,比如普通消息的score为1,重要消息的score为2,然后工作线程可以选择按score的倒序来获取工作任务。让重要的任务优先执行。
实现方式:
Redis sorted set的内部使用HashMap和跳跃表(SkipList)来保证数据的存储和有序,HashMap里放的是成员到score的映射,而跳跃表里存放的是所有的成员,排序依据是HashMap里存的score,使用跳跃表的结构可以获得比较高的查找效率,并且在实现上比较简单。
三、Redis实际应用场景
1、显示最新的项目列表
下面这个语句常用来显示最新项目,随着数据多了,查询毫无疑问会越来越慢。
SELECT * FROM foo WHERE ... ORDER BY time DESC LIMIT 10
在Web应用中,“列出最新的回复”之类的查询非常普遍,这通常会带来可扩展性问题。这令人沮丧,因为项目本来就是按这个顺序被创建的,但要输出这个顺序却不得不进行排序操作。类似的问题就可以用Redis来解决。比如说,我们的一个Web应用想要列出用户贴出的最新20条评论。
在最新的评论边上我们有一个“显示全部”的链接,点击后就可以获得更多的评论。我们假设数据库中的每条评论都有一个唯一的递增的ID字段。我们可以使用分页来制作主页和评论页,使用Redis的模板,每次新评论发表时,我们会将它的ID添加到一个Redis列表:
LPUSH latest.comments <id></id>
我们将列表裁剪为指定长度,因此Redis只需要保存最新的5000条评论:
LTRIM latest.comments 0 5000
每次我们需要获取最新评论的项目范围时,我们调用一个函数来完成(使用伪代码):
FUNCTION get_latest_comments(start, num_items): id_list = redis.lrange("latest.comments",start,start+num_items - 1) IF id_list.length <p>这里我们做的很简单。在Redis中我们的最新ID使用了常驻缓存,这是一直更新的。但是我们做了限制不能超过5000个ID,因此我们的获取ID函数会一直询问Redis。只有在start/count参数超出了这个范围的时候,才需要去访问数据库。</p><p>我们的系统不会像传统方式那样“刷新”缓存,Redis实例中的信息永远是一致的。SQL数据库(或是硬盘上的其他类型数据库)只是在用户需要获取“很远”的数据时才会被触发,而主页或第一个评论页是不会麻烦到硬盘上的数据库了。</p><p>2、排行榜应用,取TOP N操作</p><p>这个需求与上面需求的不同之处在于,取最新N个数据的操作以时间为权重,这个是以某个条件为权重,比如按顶的次数排序,这时候就需要我们的sorted set出马了,将你要排序的值设置成sorted set的score,将具体的数据设置成相应的value,每次只需要执行一条ZADD命令即可。</p><p>热门,排行榜应用:</p><pre class="brush:php;toolbar:false">//将登录次数和用户统一存储在一个sorted set里 zadd login:login_times 5 1 zadd login:login_times 1 2 zadd login:login_times 2 3 //当用户登录时,对该用户的登录次数自增1 ret = r.zincrby("login:login_times", 1, uid) //那么如何获得登录次数最多的用户呢,逆序排列取得排名前N的用户 ret = r.zrevrange("login:login_times", 0, N-1)
另一个很普遍的需求是各种数据库的数据并非存储在内存中,因此在按得分排序以及实时更新这些几乎每秒钟都需要更新的功能上数据库的性能不够理想。典型的比如那些在线游戏的排行榜,比如一个Facebook的游戏,根据得分你通常想要:
- 列出前100名高分选手
- 列出某用户当前的全球排名
这些操作对于Redis来说小菜一碟,即使你有几百万个用户,每分钟都会有几百万个新的得分。模式是这样的,每次获得新得分时,我们用这样的代码:
ZADD leaderboard
你可能用userID来取代username,这取决于你是怎么设计的。得到前100名高分用户很简单:
ZREVRANGE leaderboard 0 99
用户的全球排名也相似,只需要:
ZRANK leaderboard
3、删除与过滤
我们可以使用LREM来删除评论。如果删除操作非常少,另一个选择是直接跳过评论条目的入口,报告说该评论已经不存在。 有些时候你想要给不同的列表附加上不同的过滤器。如果过滤器的数量受到限制,你可以简单的为每个不同的过滤器使用不同的Redis列表。毕竟每个列表只有5000条项目,但Redis却能够使用非常少的内存来处理几百万条项目。
4、按照用户投票和时间排序
排行榜的一种常见变体模式就像Reddit或Hacker News用的那样,新闻按照类似下面的公式根据得分来排序:score = points / time^alpha 因此用户的投票会相应的把新闻挖出来,但时间会按照一定的指数将新闻埋下去。下面是我们的模式,当然算法由你决定。
模式是这样的,开始时先观察那些可能是最新的项目,例如首页上的1000条新闻都是候选者,因此我们先忽视掉其他的,这实现起来很简单。每次新的新闻贴上来后,我们将ID添加到列表中,使用LPUSH + LTRIM,确保只取出最新的1000条项目。
有一项后台任务获取这个列表,并且持续的计算这1000条新闻中每条新闻的最终得分。计算结果由ZADD命令按照新的顺序填充生成列表,老新闻则被清除。这里的关键思路是排序工作是由后台任务来完成的。
5、处理过期项目
另一种常用的项目排序是按照时间排序。我们使用unix时间作为得分即可。 模式如下:
- 每次有新项目添加到我们的非Redis数据库时,我们把它加入到排序集合中。这时我们用的是时间属性,current_time和time_to_live。
- 另一项后台任务使用ZRANGE…SCORES查询排序集合,取出最新的10个项目。如果发现unix时间已经过期,则在数据库中删除条目。
6、计数
Redis是一个很好的计数器,这要感谢INCRBY和其他相似命令。我相信你曾许多次想要给数据库加上新的计数器,用来获取统计或显示新信息,但是最后却由于写入敏感而不得不放弃它们。
好了,现在使用Redis就不需要再担心了。有了原子递增(atomic increment),你可以放心的加上各种计数,用GETSET重置,或者是让它们过期。例如这样操作:
INCR user:<id> EXPIRE</id>
你可以计算出最近用户在页面间停顿不超过60秒的页面浏览量,当计数达到比如20时,就可以显示出某些条幅提示,或是其它你想显示的东西。
7、特定时间内的特定项目
另一项对于其他数据库很难,但Redis做起来却轻而易举的事就是统计在某段特点时间里有多少特定用户访问了某个特定资源。比如我想要知道某些特定的注册用户或IP地址,他们到底有多少访问了某篇文章。每次我获得一次新的页面浏览时我只需要这样做:
SADD page:day1:<page_id> <user_id></user_id></page_id>
当然你可能想用unix时间替换day1,比如time()-(time()%3600*24)等等。 想知道特定用户的数量吗?只需要使用
SCARD page:day1:<page_id></page_id>
需要测试某个特定用户是否访问了这个页面?
SISMEMBER page:day1:<page_id></page_id>
8、查找某个值所在的区间(区间无重合) :(Sorted Set)
例如有下面两个范围,10-20和30-40
A_start 10, A_end 20
B_start 30, B_end 40
我们将这两个范围的起始位置存在Redis的Sorted Sets数据结构中,基本范围起始值作为score,范围名加start和end为其value值:
redis 127.0.0.1:6379> zadd ranges 10 A_start (integer) 1 redis 127.0.0.1:6379> zadd ranges 20 A_end (integer) 1 redis 127.0.0.1:6379> zadd ranges 30 B_start (integer) 1 redis 127.0.0.1:6379> zadd ranges 40 B_end (integer) 1
这样数据在插入Sorted Sets后,相当于是将这些起始位置按顺序排列好了。现在我需要查找15这个值在哪一个范围中,只需要进行如下的zrangbyscore查找:
redis 127.0.0.1:6379> zrangebyscore ranges (15 +inf LIMIT 0 1 1) "A_end"
这个命令的意思是在Sorted Sets中查找大于15的第一个值。(+inf在Redis中表示正无穷大,15前面的括号表示>15而非>=15)查找的结果是A_end,由于所有值是按顺序排列的,所以可以判定15是在A_start到A_end区间上,也就是说15是在A这个范围里。至此大功告成。
9、交集,并集,差集:(Set)
//book表存储book名称 set book:1:name ”The Ruby Programming Language” set book:2:name ”Ruby on rail” set book:3:name ”Programming Erlang” //tag表使用集合来存储数据,因为集合擅长求交集、并集 sadd tag:ruby 1 sadd tag:ruby 2 sadd tag:web 2 sadd tag:erlang 3 //即属于ruby又属于web的书? inter_list = redis.sinter("tag.web", "tag:ruby") //即属于ruby,但不属于web的书? inter_list = redis.sdiff("tag.ruby", "tag:web") //属于ruby和属于web的书的合集? inter_list = redis.sunion("tag.ruby", "tag:web")
更多redis相关文章请关注redis数据库教程栏目。
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!