首頁  >  文章  >  運維  >  十分鐘可以跟著Docker學分層復用思想

十分鐘可以跟著Docker學分層復用思想

WBOY
WBOY轉載
2022-01-19 17:37:322537瀏覽

這篇文章為大家帶來了docker中映像分層、容器分層和容器在磁碟佔用空間的相關問題,希望對大家有幫助。

十分鐘可以跟著Docker學分層復用思想

Docker是如何組織儲存的

dokcer在組織儲存內容時很巧妙的應用了分層復用的想法。所以我們可以以此為案例學習一下該想法。

1.映像分層

一個Docker映像在建置的過程中分了很多層,每一層都是唯讀的。結合下面範例進行說明:

# syntax=docker/dockerfile:1
FROM ubuntu:18.04
LABEL org.opencontainers.image.authors="org@example.com"
COPY . /app
RUN make /app
RUN rm -r $HOME/.cache
CMD python /app/app.py

這個Dockerfile中會有4個指令改變了檔案系統並建立了新圖層。

  • FROM指令從ubuntu:18.04的映像中建立了基礎層。
  • LABEL指令僅僅修改了鏡像的元數據,不會建立新層。
  • COPY指令將執行本次建置的目前目錄中的內容新增至鏡像當中,會建立一個新層記錄變更。
  • 第一個RUN指令,建立了程式並將結果輸出到映像中,會建立一個新層記錄變更。
  • 第二個RUN指令,刪除了快取目錄,會建立一個新層記錄改變。
  • CMD指令定義了容器中執行的指令,只是修改了鏡像的元數據,並不會建立新層。

這裡每層都只記錄與其上一層的不同。當我們創建一個容器的時候,這是就會創建一層可寫層,也叫容器層。對於正在運作中的容器的內容的變化都會記錄在該層中。下圖描述了該關係:

2.容器分層

容器和鏡像的不同主要是最頂層的可寫層的不同,所有對於容器的寫入操作都會記錄在這層中,如果容器被刪除,那麼這個可寫層也會被刪除,但是鏡像會被保留。

注意:如果想要多個容器共享相同的數據,可以透過Docker Volumes實作。

每個容器都有自己的可寫層,所有的變換都會被存放在其中,所以多個容器可共用同一個映像。下圖描述了該關係:

注意 :這裡還有個細節,多個鏡像可能共用相同的層,例如兩個鏡像中有相同的層,那麼在建造或是拉取的時候發現本地以存在,則不會再次建造或拉取。所以計算鏡像大小的時候,不能只透過 docker images指令顯示出的大小來匯總求和,該值有可能大於實際值。

3.容器在磁碟所佔用的空間

可以透過docker ps -s指令,來看正在執行中的容器所佔用的空間(部分值)。兩個欄位的不同代表的內容:

  • size: 容器的可寫層所佔用的磁碟大小
  • virtual size: 包含了容器可寫層和唯讀鏡像的大小。

容器佔用磁碟空間的其它途徑:

  • 容器產生的日誌檔案。
  • 使用Volume和bind mounts掛載的內容。
  • 容器的設定檔
  • 記憶體中的內容(如果開啟了swapping)
  • Checkpoints(如果使用了該功能)

4.Copy-on-Write(CoW)策略

Docker中的儲存驅動程式都是採用該策略。

CoW策略能夠最大效率的共享和複製檔案。如果一個檔案在鏡像的較低層存在,那麼其上層(包括可寫層)需要讀取該內容則可以直接使用該檔案。當需要對其進行修改時,會複製該檔案到該圖層並進行修改。這最大限度的減少了IO和每個後續層的大小。

4.1共享使映像更小

當我們使用docker pull拉取映像或是使用一個本地沒有的映像建立容器的時候,該鏡像會被分層的儲存到本機Dockers儲存區域。在linux中通常是 /var/lib/docker

我們可以去 /var/lib/docker/<storage-driver></storage-driver>目錄下看我們已拉取各層映像。例如使用 overlay2儲存驅動程式。

這麼多層,我們可以透過docker image inspect來查看某個映像包含哪些層

docker image inspect --format "{{json .RootFS.Layers}}" redis

docker image inspect --format "{{json .RootFS.Layers}}" mysql:5.7

十分鐘可以跟著Docker學分層復用思想

#透過上面查看我們可以看到redis和mysql5.7運用了同一層,這樣共享相同層就大大節省了儲存鏡像的空間,同時也提升了拉取鏡像的速度。

我们可以通过 docker image history命令来查看镜像分层情况,以redis为例

docker history redis

注意 :

  • 有些步骤的大小为0,是因为他们只改变了元数据,并不会产生新层,也不会占用额外的空间(除元数据本身)。所以上述redis镜像中包含了5层。

  • <missing></missing>步骤,这些步骤可能是以下情况中的一种

    • 在另一个系统上构建的
    • 从Docker Hub中提取的
    • 使用BuildKit作为构建器构建的。

4.2复制让容器更有效率

当我们启动一个容器的时候,会添加一个可写层在镜像之上,用于存储所有的变化。当对已有文件进行修改的时候采用CoW策略。首先会到各层寻找到该文件,然后复制该文件到可写层,然后进行修改并存储。

这么做能够让我们最大限度地减少I/O操作。

但是,很明显的是当一个容器中的应用需要进行频繁的写操作,那么会造成可写层越来越庞大,此时我们可以通过Volume来帮助我们分担压力。

容器的元数据和日志是单独存放的,一般是存放在 /var/lib/docker/containers中,我们可以使用 du -sh /var/lib/docker/containers/*来查看各个容器占用多少。(容器ID其实就是文件夹名称的前12位)。

推荐学习:《docker视频教程

以上是十分鐘可以跟著Docker學分層復用思想的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文轉載於:csdn.net。如有侵權,請聯絡admin@php.cn刪除