清華大學發布首個課程學習開源庫CurML-人工智慧-PHP中文網

首頁

科技週邊

人工智慧

清華大學發布首個課程學習開源庫CurML

PHPz

Apr 09, 2023 am 08:41 AM

機器學習開源

在機器學習的發展過程中，人類的學習方式常常會對各種演算法的設計產生啟發。而作為人類學習的重要範式，透過課程進行學習，已經被借鑒到機器學習中形成了名為課程學習（Curriculum Learning）的研究方向。

普遍而言，人類的教育是透過高度組織化的課程來完成的。每一門課或每一個學科，都會從簡單的內容開始，逐步向學生呈現更複雜的概念。例如，在大學接受微積分的概念之前，一名學生應先在小學學習算術，在初中學習函數，在高中學習導數。然而與人類教育不同的是，傳統機器學習模型的訓練都是將資料樣本隨機輸入模型，忽略了資料樣本之間不同的複雜性以及模型目前的學習狀態。因此，課程學習在機器學習領域的提出，正是為了模仿人類由易到難的學習方式，為模型提供更好的訓練策略，進而提升模型的表現。

清華大學發布首個課程學習開源庫CurML

課程學習概念圖

##目前課程學習已經廣泛應用在機器學習的各個任務中，包括圖片分類、目標檢測、語義分割、機器翻譯、音頻識別、音頻增強、視頻問答等等，同時也在有監督、無監督和半監督學習以及強化學習等場景下受到大量關注與研究。

隨著課程學習的應用和場景日益豐富，特別需要對這一領域進行細緻的梳理和歸納，從而推動研究者的深入探索、提升使用者的應用體驗。

因此，清華大學朱文武教授所帶領的媒體與網路大數據實驗室在發表了多篇課程學習學術論文的積累和基礎上，實驗室成員王鑫在IEEE TPAMI 發表了關於課程學習的綜述論文，實驗室進一步發布了全球首個課程學習開源程式庫CurML (Curriculum Machine Leanring)。

朱文武教授與王鑫助理研究員的課程學習研究工作包括應用於城市興趣地點推薦的課程元學習方法、基於帶噪多反饋信息的課程解耦商品推薦、基於課程學習的共享參數神經架構搜尋、以及基於課程難度自適應的組合最佳化問題求解等等。研究成果發表於 SIGKDD、NeurIPS、ACM MM 等高水準國際機器學習會議。

清華大學發布首個課程學習開源庫CurML

部分研究成果架構圖

課程學習綜述論文則全面回顧了課程學習的產生、定義、理論和應用等各個方面，設計了統一的課程學習框架，並根據框架內的核心組成將課程學習演算法分為兩個大類和多個小類，區分了課程學習與其他機器學習概念之間的不同和關聯，指出了這一領域所面臨的挑戰和未來可能的研究方向。

清華大學發布首個課程學習開源庫CurML

課程學習方法分類

##課程學習開源庫CurML 是課程學習演算法的支援平台，已經整合十多種課程學習演算法，同時支援帶噪和非帶噪兩種應用場景，便於研究者和使用者復現、評估、比較以及選擇課程學習演算法.

CurML 的主體模組是CL Trainer，它由兩個子模組Model Trainer 和CL Algorithm 組成，兩者間透過五個介面函數進行交互，從而實現課程學習指導的機器學習過程。

清華大學發布首個課程學習開源庫CurML

CurML 框架圖

」主體模組：CL Trainer

這模組是整個開源函式庫的主體部分。透過呼叫此模組，使用者僅需幾行程式碼即可實現課程學習演算法。在給定資料集、模型和超參數後，模組將進行一定時間的訓練，並輸出訓練後的模型參數和任務的測試結果。這個模組的設計主要是為了滿足易用性的要求，因此進行了高度的封裝，提供給想要使用課程學習演算法但並不在乎具體實現細節的使用者。

子模組1：Model Trainer

#這個模組用來完成一般的機器學習過程，例如訓練一個圖片分類器或一個語言模型。同時，它預留了五個介面函數的位置，用於和第二個子模組 CL Algorithm 進行交互，也支援自訂的輸入函數。

子模組2：CL Algorithm

這模組封裝了CurML 所支援的全部課程學習演算法，如下表所示：

清華大學發布首個課程學習開源庫CurML

模組的實作是透過五個介面函數，分別用於從機器學習過程中獲取資料和模型信息，以及指導模型的學習策略，如下圖所示。

清華大學發布首個課程學習開源庫CurML

CurML 流程圖

介面函數：data_prepare

此函數用於從Model Trainer 模組向CL Algorithm 模組提供資料集資訊。很多課程學習演算法需要對資料集有一個整體的了解，才能更好地判斷資料樣本難度，因此這個介面函數是很有必要的。

介面函數：model_prepare

這函數與data_prepare 很類似，差別在於傳遞的不是資料集訊息而是模型訓練的相關訊息，例如模型架構、參數優化器、學習率調整器等等，許多課程學習演算法透過調節這些要素來指導機器學習。

介面函數：data_curriculum

#此函數用於計算資料樣本難度，並根據資料難度和當前模型狀態為模型提供合適的數據，大部分的課程學習都有類似的想法。

介面函數：model_curriculum

#此函數用於更新模型，調節模型從資料樣本中取得的資訊量，間接指導模型的學習，目前這類演算法的數量還較少，但CurML 也同樣支持這類演算法的實作。

介面函數：loss_curriculum

#此函數用於對損失函數值進行重加權，間接調整不同數據對於模型的影響，這類演算法在課程學習中較為常見，因為損失值的加權在本質上是一種對數據的軟採樣。

透過十多種近年來課程學習方法的總結，採用上述的模組和介面參數可以統一化實現不同類型的課程學習演算法，從而能在公平的場景和任務下對課程學習演算法進行評估、比較和選擇。

未來展望

CurML 的研發團隊表示，在未來他們將持續更新這項開源程式庫，為課程學習的發展和應用提供進一步的支援。

相關連結：

CurML 開源程式庫連結：https://github.com/THUMNLab/CurML
CurML 開源軟體論文連結： https://dl.acm.org/doi/pdf/10.1145/3503161.3548549
課程學習綜述論文連結： https://ieeexplore.ieee.org/abstract/document/9392296/
課程元學習論文連結：https://dl.acm.org/doi/abs/10.1145/ 3447548.3467132
課程解耦學習論文連結：https://proceedings.neurips.cc/paper/2021/file/e242660df1b69b74dcc7fde711f924ff##.pdf 課程神經架構搜尋論文連結：https://dl.acm.org/doi/abs/10.1145/3503161.3548271
課程難度自適應論文連結：https:// ojs.aaai.org/index.php/AAAI/article/download/20899/version/19196/20658

以上是清華大學發布首個課程學習開源庫CurML的詳細內容。更多資訊請關注PHP中文網其他相關文章！

陳述

本文轉載於：51CTO.COM。如有侵權，請聯絡admin@php.cn刪除

AI內部部署的隱藏危險：治理差距和災難性風險Apr 28, 2025 am 11:12 AM

Apollo Research的一份新報告顯示，先進的AI系統的不受檢查的內部部署構成了重大風險。在大型人工智能公司中缺乏監督，普遍存在，允許潛在的災難性結果

構建AI測謊儀Apr 28, 2025 am 11:11 AM

傳統測謊儀已經過時了。依靠腕帶連接的指針，打印出受試者生命體徵和身體反應的測謊儀，在識破謊言方面並不精確。這就是為什麼測謊結果通常不被法庭採納的原因，儘管它曾導致許多無辜者入獄。相比之下，人工智能是一個強大的數據引擎，其工作原理是全方位觀察。這意味著科學家可以通過多種途徑將人工智能應用於尋求真相的應用中。一種方法是像測謊儀一樣分析被審問者的生命體徵反應，但採用更詳細、更精確的比較分析。另一種方法是利用語言標記來分析人們實際所說的話，並運用邏輯和推理。俗話說，一個謊言會滋生另一個謊言，最終

AI是否已清除航空航天行業的起飛？Apr 28, 2025 am 11:10 AM

航空航天業是創新的先驅，它利用AI應對其最複雜的挑戰。現代航空的越來越複雜性需要AI的自動化和實時智能功能，以提高安全性，降低操作

觀看北京的春季機器人比賽Apr 28, 2025 am 11:09 AM

機器人技術的飛速發展為我們帶來了一個引人入勝的案例研究。來自Noetix的N2機器人重達40多磅，身高3英尺，據說可以後空翻。 Unitree公司推出的G1機器人重量約為N2的兩倍，身高約4英尺。比賽中還有許多體型更小的類人機器人參賽，甚至還有一款由風扇驅動前進的機器人。數據解讀這場半程馬拉松吸引了超過12,000名觀眾，但只有21台類人機器人參賽。儘管政府指出參賽機器人賽前進行了“強化訓練”，但並非所有機器人均完成了全程比賽。冠軍——由北京類人機器人創新中心研發的Tiangong Ult

鏡子陷阱：人工智能倫理和人類想像力的崩潰Apr 28, 2025 am 11:08 AM

人工智能以目前的形式並不是真正智能的。它擅長模仿和完善現有數據。我們不是在創造人工智能，而是人工推斷 - 處理信息的機器，而人類則

新的Google洩漏揭示了方便的Google照片功能更新Apr 28, 2025 am 11:07 AM

一份報告發現，在谷歌相冊Android版7.26版本的代碼中隱藏了一個更新的界面，每次查看照片時，都會在屏幕底部顯示一行新檢測到的面孔縮略圖。新的面部縮略圖缺少姓名標籤，所以我懷疑您需要單獨點擊它們才能查看有關每個檢測到的人員的更多信息。就目前而言，此功能除了谷歌相冊已在您的圖像中找到這些人之外，不提供任何其他信息。此功能尚未上線，因此我們不知道谷歌將如何準確地使用它。谷歌可以使用縮略圖來加快查找所選人員的更多照片的速度，或者可能用於其他目的，例如選擇要編輯的個人。我們拭目以待。就目前而言