首頁 >後端開發 >Python教學 >YOLOv 文件佈局分析的新突破

YOLOv 文件佈局分析的新突破

Barbara Streisand
Barbara Streisand原創
2024-10-30 23:19:29626瀏覽

介紹

如上一篇部落格文章中所提到的,YOLOv8 在文件版面分析中表現非常出色。我透過 DocLayNet 資料集訓練了 YOLOv8 系列的所有模型,發現即使是最小的模型,整體 mAP50-95 也達到了 71.8,而最大的模型達到了令人印象深刻的 78.7。

最近,Ultralytics 發布了 YOLOv11,這是其 YOLO 系列即時物體偵測器的最新版本。這個新版本對架構和訓練方法都帶來了重大改進。

YOLOv A New Breakthrough in Document Layout Analysis

?結果看起來很有希望!我決定再次在 DocLayNet 資料集上訓練所有 YOLOv11 模型,並與先前的 YOLOv8 系列進行比較。

訓練方法

對於這個實驗,我繼續使用我的儲存庫 https://github.com/ppaangggg/yolo-doclaynet 來準備資料並使用我的自訂腳本訓練模型。這種方法確保了資料準備和訓練過程的一致性,從而可以公平地比較 YOLOv8 和 YOLOv11 模型。

YOLOv11 模型的訓練與評估過程非常簡單,可以使用簡單的命令列指令執行:

# To train the model
python train.py {base-model}

# To evaluate the model
python eval.py {path-to-your-trained-model}

比較結果

這是YOLOv8模型與YOLOv11比較的詳細評估表:

label boxes yolov8n yolov11n yolov8s yolov11s yolov8m yolov11m yolov8l yolov11l yolov8x yolov11x
Params (M) 3.2 2.6 11.2 9.4 25.9 20.1 43.7 25.3 68.2 56.9
Caption 1542 0.682 0.717 0.721 0.744 0.746 0.746 0.75 0.772 0.753 0.765
Footnote 387 0.614 0.634 0.669 0.683 0.696 0.701 0.702 0.715 0.717 0.71
Formula 1966 0.655 0.673 0.695 0.705 0.723 0.729 0.75 0.75 0.747 0.765
List-item 10521 0.789 0.81 0.818 0.836 0.836 0.843 0.841 0.847 0.841 0.845
Page-footer 3987 0.588 0.591 0.61 0.621 0.64 0.653 0.641 0.678 0.655 0.684
Page-header 3365 0.707 0.704 0.754 0.76 0.769 0.778 0.776 0.788 0.784 0.795
Picture 3497 0.723 0.758 0.762 0.783 0.789 0.8 0.796 0.805 0.805 0.802
Section-header 8544 0.709 0.713 0.727 0.745 0.742 0.753 0.75 0.75 0.748 0.751
Table 2394 0.82 0.846 0.854 0.874 0.88 0.88 0.885 0.891 0.886 0.89
Text 29917 0.845 0.851 0.86 0.869 0.876 0.878 0.878 0.88 0.877 0.883
Title 334 0.762 0.793 0.806 0.817 0.83 0.832 0.846 0.844 0.84 0.848
All 66454 0.718 0.735 0.752 0.767 0.775 0.781 0.783 0.793 0.787 0.794

我還建立了一個圖表來說明這兩個系列的模型大小和分數之間的關係:

YOLOv A New Breakthrough in Document Layout Analysis

結論

根據上面的表格和圖,我們可以得出結論

根據上面的表格和圖表,我們可以得出結論,YOLOv11 模型在所有尺寸上始終優於 YOLOv8 模型。這些改進在較小的模型中尤其明顯,與 YOLOv8n 相比,YOLOv11n 的 mAP50-95 提高了 1.7%。此外,YOLOv11 模型通常比 YOLOv8 模型具有更少的參數,這表明除了更好的性能之外,效率也得到了提高。

我最喜歡的模型是 YOLOv11l。它的大小與 YOLOv8m 差不多,但它的性能甚至超過了 YOLOv8x!

然而,儘管模型大小是 YOLOv11l 的兩倍,YOLOv11x 僅比 YOLOv11l 略有改進。

更多的

您對 YOLOv11 的結果有何看法?您有使用 YOLO 模型進行文件佈局分析的經驗嗎?我很想在下面的評論中聽到您的見解和經驗!

參考

  1. YOLOv11 文件:https://docs.ultralytics.com/models/yolo11/
  2. DocLayNet GitHub 儲存庫:https://github.com/DS4SD/DocLayNet
  3. 我的 YOLO-DocLayNet GitHub 專案:https://github.com/ppaanngggg/yolo-doclaynet

以上是YOLOv 文件佈局分析的新突破的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn