微軟研究院(Microsoft Research)和普林斯頓大學的研究人員於11月13日提出了一個通用框架,用於設計無監督學習問題的有效演算法,如高斯分佈和子空間聚類的混合
研究人員提出的框架,使用了一個元演算法來解決雜訊問題,該元演算法採用下界學習計算公式的計算方法。這個框架是基於Garg、Kayal和Saha(FOCS'20)最近的工作而設計的,他們提出了這個框架,用於在沒有任何噪音的情況下學習算術公式。元演算法的一個關鍵因素是有效演算法,用於解決稱為「穩健向量空間分解」的新問題
研究證明,當某些矩陣具有足夠大的最小非零奇異值時,元演算法效果很好。 「我們推測這個條件適用於我們問題的平滑實例,因此我們的框架將為平滑設定中的這些問題產生有效的演算法。」
##該研究的題目是《在在存在噪音的情況下學習算術公式:無監督學習的通用框架和應用》(Learning Arithmetic Formulas in the Presence of Noise: A General Framework and Applications to Unsupervised Learning),於11月13日在arXiv預印平台上發布
無監督學習涉及發現資料中隱藏的模式和結構,而不使用任何標籤或直接的人類監督。
在這裡,研究人員考慮具有良好數學結構或從數學上明確定義的分佈所產生的資料。前者的一個例子是,可以根據某些相似性模式將資料點分組為有意義的集群,並且目標是找到底層集群。後者的一個例子是混合建模,它假設資料是由簡潔描述的機率分佈(例如高斯分佈)的混合生成的,目標是從樣本中學習這些分佈的參數。
解決許多無監督學習問題的通用框架是矩方法,它利用資料的統計矩來推斷模型的底層結構或底層參數。對於許多無監督學習問題場景,其中基礎資料具有一些很好的數學結構,資料的矩是參數的明確定義的函數。啟發式論證表明,相反的情況通常應該成立,即結構/分佈的參數通常由數據的一些低階矩唯一確定。在這個大方向上,主要的挑戰是設計演算法來(近似地)從(經驗)力矩中恢復潛在的參數。
我們也希望演算法高效、耐雜訊(即,即使僅近似而不是精確地知道矩,也能很好地工作),甚至是異常容忍度(即,即使少數數據點不符合底層結構/分佈也能很好地工作)。但即使是該領域最簡單的問題也往往是 NP 困難的,並且即使沒有噪音和異常值也仍然如此。
因此,人們實際上不能指望一種具有可證明的最壞情況保證的演算法。但人們可以希望演算法能夠保證通常運作良好,即對於隨機問題實例,或者更理想的是對於以平滑方式選擇的實例。因此,針對無監督學習中的每個此類問題設計了許多不同的演算法,具有不同程度的效率、噪音容忍度、離群值容忍度和可證明的保證。
在這項工作中,研究人員給出了一個適用於許多此類無監督學習問題的元演算法。研究的出發點是觀察到許多此類問題都歸結為學習算術公式的適當子類的任務。
以上是通用的無監督學習問題解決方案:基於元演算法的框架的詳細內容。更多資訊請關注PHP中文網其他相關文章!

使用Gemma範圍探索語言模型的內部工作 了解AI語言模型的複雜性是一個重大挑戰。 Google發布的Gemma Scope是一種綜合工具包,為研究人員提供了一種強大的探索方式

解鎖業務成功:成為商業智能分析師的指南 想像一下,將原始數據轉換為驅動組織增長的可行見解。 這是商業智能(BI)分析師的力量 - 在GU中的關鍵作用

SQL的Alter表語句:動態地將列添加到數據庫 在數據管理中,SQL的適應性至關重要。 需要即時調整數據庫結構嗎? Alter表語句是您的解決方案。本指南的詳細信息添加了Colu

介紹 想像一個繁華的辦公室,兩名專業人員在一個關鍵項目中合作。 業務分析師專注於公司的目標,確定改進領域,並確保與市場趨勢保持戰略一致。 simu

Excel 數據計數與分析:COUNT 和 COUNTA 函數詳解 精確的數據計數和分析在 Excel 中至關重要,尤其是在處理大型數據集時。 Excel 提供了多種函數來實現此目的,其中 COUNT 和 COUNTA 函數是用於在不同條件下統計單元格數量的關鍵工具。雖然這兩個函數都用於計數單元格,但它們的設計目標卻針對不同的數據類型。讓我們深入了解 COUNT 和 COUNTA 函數的具體細節,突出它們獨特的特性和區別,並學習如何在數據分析中應用它們。 要點概述 理解 COUNT 和 COU

Google Chrome的AI Revolution:個性化和高效的瀏覽體驗 人工智能(AI)正在迅速改變我們的日常生活,而Google Chrome正在領導網絡瀏覽領域的負責人。 本文探討了興奮

重新構想影響:四倍的底線 長期以來,對話一直以狹義的AI影響來控制,主要集中在利潤的最低點上。但是,更全面的方法認識到BU的相互聯繫

事情正穩步發展。投資投入量子服務提供商和初創企業表明,行業了解其意義。而且,越來越多的現實用例正在出現以證明其價值超出


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

SecLists
SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。

PhpStorm Mac 版本
最新(2018.2.1 )專業的PHP整合開發工具

DVWA
Damn Vulnerable Web App (DVWA) 是一個PHP/MySQL的Web應用程序,非常容易受到攻擊。它的主要目標是成為安全專業人員在合法環境中測試自己的技能和工具的輔助工具,幫助Web開發人員更好地理解保護網路應用程式的過程,並幫助教師/學生在課堂環境中教授/學習Web應用程式安全性。 DVWA的目標是透過簡單直接的介面練習一些最常見的Web漏洞,難度各不相同。請注意,該軟體中

Dreamweaver Mac版
視覺化網頁開發工具

Dreamweaver CS6
視覺化網頁開發工具