데이터 불일치를 줄이기 위해서는 캐시와 데이터베이스를 업데이트하는 메커니즘이 특히 중요합니다. 다음으로 함정을 안내하겠습니다.
캐시 따로 보관
즉, 캐시 우회
는 일반적으로 사용되는 캐싱 전략입니다. Cache aside
也就是旁路缓存
,是比较常用的缓存策略。
(1)读请求
(1)읽기 요청
공통 프로세스
애플리케이션은 먼저 캐시에 데이터가 있는지 확인합니다. 캐시에 도달하면 데이터가 직접 반환됩니다. 캐시에 누락되면 캐시가 데이터베이스에 침투하여 데이터를 쿼리합니다. 데이터베이스에서 가져온 다음 다시 캐시에 쓰고 마지막으로 데이터를 클라이언트에 반환합니다.
(2)쓰기 요청
공통 프로세스写请求
常见流程
首先更新数据库,然后从缓存中删除该数据。
看了写请求的图之后,有些同学可能要问了:为什么要删除缓存,直接更新不就行了?这里涉及到几个坑,我们一步一步踩下去。
Cache aside策略如果用错就会遇到深坑,下面我们来逐个踩。
踩坑一:先更新数据库,再更新缓存
如果同时有两个写请求
需要更新数据,每个写请求都先更新数据库再更新缓存,在并发场景可能会出现数据不一致的情况。
如上图的执行过程:
(1)写请求1
更新数据库,将 age 字段更新为18;
(2)写请求2
쓰기 요청
은 데이터를 업데이트해야 합니다. 각 쓰기 요청은 먼저 데이터베이스를 업데이트한 다음 캐시를 업데이트합니다. 동시 시나리오에서 데이터 불일치가 발생할 수 있습니다. 🎜🎜🎜먼저 데이터베이스를 업데이트한 다음 캐시를 업데이트하세요🎜🎜🎜다음과 같이 실행 위에 표시된 프로세스: 🎜🎜(1)쓰기 요청 1데이터베이스를 업데이트하고 연령 필드를 18로 업데이트합니다. 🎜🎜(2)<code style="font-size: 14px;padding: 2px 4px;border-radius: 4px;margin-right: 2px;margin-left : 2px; 배경색: rgba(27, 31, 35, 0.05); 글꼴 계열: " operator mono consolas monaco menlo monospace break-all rgb>쓰기 요청 2
데이터베이스를 업데이트하고 연령 필드를 20으로 업데이트합니다.🎜(3)쓰기 요청 2
캐시 업데이트 , 캐시 수명은 20으로 설정됩니다. 写请求2
更新缓存,缓存 age 设置为20;
(4)写请求1
更新缓存,缓存 age 设置为18;
执行完预期结果是数据库 age 为20,缓存 age 为20,结果缓存 age为18,这就造成了缓存数据不是最新的,出现了脏数据。
踩坑二:先删缓存,再更新数据库
如果写请求
的处理流程是先删缓存再更新数据库
,在一个读请求
和一个写请求
并发场景下可能会出现数据不一致情况。
如上图的执行过程:
(1)写请求
删除缓存数据;
(2)读请求
查询缓存未击中(Hit Miss),紧接着查询数据库,将返回的数据回写到缓存中;
(3)写请求
Write Request 1
은 캐시를 업데이트하고 캐시 수명은 18로 설정됩니다. 🎜🎜실행 후 예상 결과는 데이터베이스 수명이 20, 캐시 수명이 20, 결과 캐시 수명이 18입니다. 이로 인해 캐시 데이터가 최신이 아니며 더티 데이터가 나타납니다. 🎜🎜함정 2: 먼저 캐시를 삭제한 다음 데이터베이스를 업데이트하세요🎜🎜If쓰기 요청 처리 흐름
은 캐시를 먼저 삭제한 다음 데이터베이스를 업데이트
하세요. 읽기 요청
및 쓰기 요청
동시 시나리오에서 데이터 불일치가 발생할 수 있습니다. 🎜쓰기 요청
캐시된 데이터 삭제; 🎜🎜(2)읽기 요청
캐시 누락(Hit Miss) 쿼리, 그런 다음 데이터베이스 쿼리 , 반환된 데이터를 캐시에 다시 씁니다. 🎜🎜(3)쓰기 요청
입니다. 🎜전체 과정을 거친 후 데이터베이스의 수명는 20, <code style="font-size: 14px;padding: 2px 4px;border-radius: 4px;margin-right: 2px;margin-left: 2px; background-color: rgba(27, 31, 35, 0.05) ;font-family: " operator mono consolas monaco menlo monospace break-all rgb>캐시
연령 18, 캐시 데이터베이스 데이터와 일치하지 않으며 더티 데이터가 캐시에 나타납니다. 数据库
中age为20,缓存
中age为18,缓存和数据库数据不一致,缓存出现了脏数据。
踩坑三:先更新数据库,再删除缓存
在实际的系统中针对写请求
还是推荐先更新数据库再删除缓存
,但是在理论上还是存在问题,以下面这个例子说明。
如上图的执行过程:
(1)读请求
先查询缓存,缓存未击中,查询数据库返回数据;
(2)写请求
更新数据库,删除缓存;
(3)读请求
回写缓存;
整个流程操作下来发现数据库age为20
,缓存age为18
쓰기 요청
또는 권장데이터베이스를 먼저 업데이트한 후 캐시를 삭제
하지만 다음 예와 같이 이론상 여전히 문제가 있습니다. 🎜읽기 요청
은 먼저 캐시를 쿼리하고, 캐시에 적중되지 않은 경우 쿼리합니다. 데이터를 반환하는 데이터베이스; 27, 31, 35, 0.05 );font-family: "Operator Mono", Consolas, Monaco, Menlo, monospace;word-break: break-all;color: rgb(0, 0, 153);">쓰기 요청데이터베이스 업데이트, 캐시 삭제 🎜🎜(3)읽기 요청
다시 쓰기 캐시; 🎜🎜전체 프로세스 후에 데이터베이스 기간은 20
, 캐시 수명은 18
입니다. 즉, 데이터베이스와 캐시가 일치하지 않아 애플리케이션이 캐시에서 읽은 데이터가 오래된 데이터가 됩니다. 🎜🎜하지만 잘 생각해 보면 위의 문제가 발생할 확률은 실제로 매우 낮습니다. 왜냐하면 데이터베이스 업데이트 작업은 일반적으로 메모리 작업보다 몇 배 더 많은 시간이 걸리기 때문입니다. 위 그림의 마지막 단계는 데이터를 다시 작성하는 것입니다. 캐시(18세 설정)는 일반적으로 데이터베이스를 업데이트하기 전에 수행됩니다. 🎜이런 극단적인 상황이 발생한다면? 우리는 해결책을 생각해야 합니다: 캐시 데이터 설정 만료 시간
. 일반적으로 시스템에서는 소량의 데이터가 짧은 시간 동안 불일치할 수 있습니다. 缓存数据设置过期时间
。通常在系统中是可以允许少量的数据短时间不一致的场景出现。
在 Cache Aside 更新模式中,应用代码需要维护两个数据源头:一个是缓存,一个是数据库。而在 Read-Through
策略下,应用程序无需管理缓存和数据库,只需要将数据库的同步委托给缓存提供程序 Cache Provider
即可。所有数据交互都是通过抽象缓存层
完成的。
如上图,应用程序只需要与Cache Provider
交互,不用关心是从缓存取还是数据库。
在进行大量读取时,Read-Through
可以减少数据源上的负载,也对缓存服务的故障具备一定的弹性。如果缓存服务挂了,则缓存提供程序仍然可以通过直接转到数据源来进行操作。
Read-Through 适用于多次请求相同数据的场景
Read-Through
전략, 적용됨 프로그램은 캐시와 데이터베이스를 관리할 필요가 없으며 데이터베이스 동기화를 캐시 공급자에게 맡기기만 하면 됩니다.캐시 제공자
. 모든 데이터 상호작용은 추상 캐시 레이어
완료됨 . 🎜캐시 제공자
상호 작용(캐시에서 가져오든 데이터베이스에서 가져오든 관계 없음). 🎜🎜읽기량이 많은 경우 읽기 데이터 소스의 로드를 줄일 수 있으며 캐시 서비스 오류에 대한 복원력도 뛰어납니다. 캐시 서비스가 중단되더라도 캐시 공급자는 데이터 원본으로 직접 이동하여 계속 작동할 수 있습니다. 🎜🎜Read-Through는 동일한 내용에 대한 여러 요청에 적합합니다. 데이터 시나리오
, 이는 캐시 배제 전략과 매우 유사하지만 둘 사이에는 여전히 몇 가지 차이점이 있으므로 다시 강조합니다. 🎜쓰기
전략에 따라 데이터 업데이트(쓰기)가 발생하면 캐시 공급자 캐시 제공자
는 기본 데이터 소스 및 캐시 업데이트를 담당합니다. Write-Through
策略下,当发生数据更新(Write)时,缓存提供程序 Cache Provider
负责更新底层数据源和缓存。
缓存与数据源保持一致,并且写入时始终通过抽象缓存层
到达数据源。
Cache Provider
类似一个代理的作用。
Write behind
在一些地方也被成为Write back
, 简单理解就是:应用程序更新数据时只更新缓存, Cache Provider
每隔一段时间将数据刷新到数据库中。说白了就是延迟写入
뒤에 쓰기
는 다시 쓰기
, 간단히 이해하면 애플리케이션이 데이터를 업데이트할 때 캐시만 업데이트합니다. 캐시 공급자
는 정기적으로 데이터베이스에 데이터를 새로 고칩니다. 직설적으로 말하면 지연 쓰기
. 🎜위 그림과 같이 애플리케이션이 두 개의 데이터를 업데이트하면 Cache Provider는 이를 즉시 캐시에 쓰지만 일정 시간이 지나면 일괄적으로 데이터베이스에 쓰게 됩니다.
이 방법에는 장점과 단점이 있습니다.
장점
은 데이터 쓰기 속도가 매우 빠르고 빈번한 쓰기 시나리오에 적합하다는 것입니다. 优点
是数据写入速度非常快,适用于频繁写的场景。
缺点
단점
은 캐싱입니다. 이는 데이터베이스와 강력하게 일치하지 않으므로 일관성 요구 사항이 높은 시스템에서는 주의해서 사용해야 합니다.
위 내용은 동시성이 높은 시나리오에서는 캐시 또는 데이터베이스를 먼저 업데이트해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!