德國弗萊堡大學機器學習實驗室負責人Frank Hutter 說,所有這些人類決策的結果是,複雜的模型最終是被"憑直覺設計",而不是系統地設計的。
一個名為自動機器學習(autoML)的不斷發展的領域旨在消除這種猜測。其想法是讓演算法接管研究人員目前在設計模型時必須做出的決定。最終,這些技術可以使機器學習變得更容易獲得。
儘管自動機器學習已經存在了近十年,但研究人員仍在努力改進它。近日,在巴爾的摩舉行的一次新會議,展示了為提高autoML的準確性和簡化其性能而做出的努力。
人們對 autoML 簡化機器學習的潛力產生了濃厚的興趣。亞馬遜和谷歌等公司已經提供了利用 autoML 技術的低程式碼機器學習工具。如果這些技術變得更有效,它可以加速研究並讓更多人使用機器學習。
這樣做的目的是為了讓人們可以選擇他們想問的問題,將 autoML 工具指向它,並獲得他們想要的結果。
這個願景是"電腦科學的聖杯",懷俄明大學的電腦科學助理教授兼會議組織者Lars Kotthoff說,"你指定了問題,電腦就知道如何解決它,這就是你要做的一切。"但首先,研究人員必須弄清楚如何使這些技術更省時、更節能。
自動機器學習可以解決什麼?
乍一看,autoML 的概念似乎是多餘的——畢竟,機器學習已經是關於自動化從資料中獲取洞察力的過程。但由於 autoML 演算法在底層機器學習模型之上的抽象層級上運行,僅依賴這些模型的輸出作為指導,因此它們可以節省時間和計算量。
研究人員可以將 autoML 技術應用於預先訓練的模型以獲得新的見解,而不會浪費運算能力來重複現有的研究。
例如,美國富士通研究所的研究科學家 Mehdi Bahrami 和他的合著者介紹了最近的工作,關於如何將BERT-sort演算法與不同的預訓練模型一起使用以適應新的目的。
BERT-sort 是一種演算法,可以在對資料集進行訓練時找出所謂的"語義順序"。例如,給定的電影評論數據,它知道"偉大的"電影的排名要高於"好"和"壞"的電影。
借助 autoML 技術,還可以將學習到的語義順序推廣到對癌症診斷甚至外語文本進行分類,從而減少時間和計算量。
"BERT 需要數月的計算,而且非常昂貴,例如要花費100 萬美元來生成該模型並重複這些過程。"Bahrami 說,"因此,如果每個人都想做同樣的事情,那很昂貴——它不節能,對世界的可持續發展不利。"
儘管該領域顯示出希望,但研究人員仍在尋找使autoML 技術的計算效率更高的方法。例如,透過像神經架構搜尋(NAS)這樣的方法,建立和測試許多不同的模型以找到最合適的模型,完成所有這些迭代所需的能量可能很大。
自動機器學習也可以應用於不涉及神經網路的機器學習演算法,例如建立隨機決策森林或支援向量機來對資料進行分類。這些領域的研究正在持續進行中,已經有許多編碼庫可供想要將 autoML 技術整合到他們的專案中的人們使用。
Hutter表示,下一步是使用autoML量化不確定性並解決演算法中的可信度和公平性問題。在這個願景中,關於可信賴性和公平性的標準將類似於任何其他機器學習的約束條件,例如準確性。而autoML可以在這些演算法發布之前捕獲並自動修正這些演算法中發現的偏差。
神經架構搜尋的持續進展
但是對於像深度學習這類應用,autoML還有很長的路要走。用於訓練深度學習模型的數據,如圖像、文件和錄製的語音,通常是密集且複雜的。它需要巨大的運算能力來處理。除了在財力雄厚的大企業工作的研究人員之外,訓練這些模型的成本和時間可能會讓任何人望而卻步。
該會議上的一項競賽要求是參與者開發用於神經架構搜尋的節能替代演算法。這是一個相當大的挑戰,因為這種技術具有"臭名昭著"的計算需求。它會自動循環遍歷無數的深度學習模型,以幫助研究人員為他們的應用選擇合適的模型,但該過程可能需要數月時間,成本超過一百萬美元。
這些被稱為零成本神經架構搜尋代理的替代演算法的目標是,透過大幅削減其對運算的需求,使神經架構搜尋更容易取得、更環保。其結果只需要幾秒鐘就能運行,而不是幾個月。目前,這些技術仍處於發展的早期階段並且通常不可靠,但機器學習研究人員預測,它們有可能使模型選擇過程更有效率。
以上是使用 autoML 技術更容易開發AI的詳細內容。更多資訊請關注PHP中文網其他相關文章!

嘿,編碼忍者!您當天計劃哪些與編碼有關的任務?在您進一步研究此博客之前,我希望您考慮所有與編碼相關的困境,這是將其列出的。 完畢? - 讓&#8217

AI增強食物準備 在新生的使用中,AI系統越來越多地用於食品製備中。 AI驅動的機器人在廚房中用於自動化食物準備任務,例如翻轉漢堡,製作披薩或組裝SA

介紹 了解Python函數中變量的名稱空間,範圍和行為對於有效編寫和避免運行時錯誤或異常至關重要。在本文中,我們將研究各種ASP

介紹 想像一下,穿過美術館,周圍是生動的繪畫和雕塑。現在,如果您可以向每一部分提出一個問題並獲得有意義的答案,該怎麼辦?您可能會問:“您在講什麼故事?

繼續使用產品節奏,本月,Mediatek發表了一系列公告,包括新的Kompanio Ultra和Dimenty 9400。這些產品填補了Mediatek業務中更傳統的部分,其中包括智能手機的芯片

#1 Google推出了Agent2Agent 故事:現在是星期一早上。作為AI驅動的招聘人員,您更聰明,而不是更努力。您在手機上登錄公司的儀表板。它告訴您三個關鍵角色已被採購,審查和計劃的FO

我猜你一定是。 我們似乎都知道,心理障礙由各種chat不休,這些chat不休,這些chat不休,混合了各種心理術語,並且常常是難以理解的或完全荒謬的。您需要做的一切才能噴出fo

根據本週發表的一項新研究,只有在2022年製造的塑料中,只有9.5%的塑料是由回收材料製成的。同時,塑料在垃圾填埋場和生態系統中繼續堆積。 但是有幫助。一支恩金團隊


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

mPDF
mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),

SecLists
SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。

EditPlus 中文破解版
體積小,語法高亮,不支援程式碼提示功能

SublimeText3 Linux新版
SublimeText3 Linux最新版

Dreamweaver Mac版
視覺化網頁開發工具