搜尋
首頁科技週邊人工智慧KDD2024最佳學生論文解讀,中科大、華為諾亞:序列推薦新典範DR4SR

KDD2024最佳學生論文解讀,中科大、華為諾亞:序列推薦新典範DR4SR

AIxiv專欄是本站發布學術、技術內容的欄位。過去數年,本站AIxiv專欄接收通報了2,000多篇內容,涵蓋全球各大專院校與企業的頂尖實驗室,有效促進了學術交流與傳播。如果您有優秀的工作想要分享,歡迎投稿或聯絡報道。投稿信箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com


本實驗室工作由認知智慧陳恩紅團隊與華為諾亞方舟實驗室完成。陳恩紅教授團隊深耕資料探勘、機器學習領域,在頂尖期刊與會議發表多篇論文,Google學術論文引用超兩萬次。諾亞方舟實驗室是華為公司從事人工智慧基礎研究的實驗室,秉持理論研究與應用創新並重的理念,致力於推動人工智慧領域的技術創新與發展。
8 月25 日- 29 日在西班牙巴塞隆納舉行的第30 屆ACM 知識發現與資料探勘大會(KDD2024) 上,中國科學技術大學認知智能全國重點實驗室陳恩紅教授、 IEEE Fellow,和華為諾亞聯合發表的論文“Dataset Regeneration for Sequential Recommendation”,獲2024 年大會Research Track 唯一最佳學生論文獎。論文第一作者為中科大認知智能全國重點實驗室陳恩紅教授,連德富教授,與王皓特任副研究員共同指導的博士生尹銘佳同學,華為諾亞劉勇、郭威研究員也參與了論文的相關工作。這是自 KDD 於 2004 年設立該獎項以來,陳恩紅教授團隊的學生第二次榮獲該獎項。

  • 論文連結: https://arxiv.org/abs/2405.17795
  • 程式碼連結: https://github.
程式碼連結: https://github.com/USTC -StarTeam/DR4SR

研究動機
研究動機

研究動機KDD2024最佳學生論文解讀,中科大、華為諾亞:序列推薦新典範DR4SRKDD2024最佳學生論文解讀,中科大、華為諾亞:序列推薦新典範DR4SRKDD2024最佳學生論文解讀,中科大、華為諾亞:序列推薦新典範DR4SRKDD2024最佳學生論文解讀,中科大、華為諾亞:序列推薦新典範DR4SR研究動機KDD2024最佳學生論文解讀,中科大、華為諾亞:序列推薦新典範DR4SRKDD2024最佳學生論文解讀,中科大、華為諾亞:序列推薦新典範DR4SRKDD2024最佳學生論文解讀,中科大、華為諾亞:序列推薦新典範DR4SRKDD2024最佳學生論文解讀,中科大、華為諾亞:序列推薦新典範DR4SR研究動機

KDD2024最佳學生論文解讀,中科大、華為諾亞:序列推薦新典範DR4SR研究動機

研究動機為了獲得最佳的訓練數據,研究團隊的關鍵思路是學習一個明確包含物品轉移模式的新數據集。具體來說,他們將推薦系統的建模過程分為兩個階段:從原始資料集中提取轉移模式 ,並基於 學習使用者偏好。由於學習從 的映射涉及兩個隱含的映射: ,因此這個過程具有挑戰性。為此,研究團隊探索了開發一個明確表示中的物品轉移模式的資料集的可能性,這使得我們可以將學習過程明確地分為兩個階段,其中 相對更容易學習。因此,他們的主要關注點是學習一個有效的的映射函數,這是一個一對多的映射。研究團隊將這個學習過程定義為資料集重生成範式,如圖 1 所示,其中 「重生成」 意味著他們不引入任何額外信息,僅依賴原始資料集。                                       中下時  生成,研究團隊提出了一種新穎的以數據為中心的範式- 用於序列推薦的資料集重生成(DR4SR),旨在將原始資料集重生成一個資訊豐富且具有通用性的資料集。具體來說,研究團隊首先建立了一個預訓練任務,使得資料集重生成成為可能。接著,他們提出了一種多樣性增強的重生成器,以在重生成過程中建模序列和模式之間的一對多關係。最後,他們提出了一種混合推理策略,以在探索與利用之間取得平衡,產生新的資料集。

資料集重生成過程雖具通用性,但可能不完全適合特定目標模型。為解決這個問題,研究團隊提出了 DR4SR+,這是一個模型感知的重生成過程,它根據目標模型的特性自訂資料集。 DR4SR + 透過雙層優化問題和隱式微分技術,個人化評分並優化重生成資料集中的模式,以增強資料集效果。

研究方法

在本項研究中,研究團隊提出了一個名為「用於序列推薦的資料重生成」(DR4SR)的以資料為中心的框架,旨在將原始資料集重生成一個資訊豐富且具有通用性的資料集,如圖2 所示。由於資料重生成過程是獨立於目標模型的,因此重生成的資料集可能不一定符合目標模型的需求。因此,研究團隊將 DR4SR 擴展為模型感知版本,即 DR4SR+,以針對特定的目標模型自訂重生成的資料集。

模型無感知的資料集重生成

KDD2024最佳學生論文解讀,中科大、華為諾亞:序列推薦新典範DR4SR

                                     中對中之後吧
資料重產生預訓練任務的建構:‍

                                      中下對上進行之前訓練🎜>能夠將  重產生對應的模式  。研究團隊將整個預訓練資料集記作 

KDD2024最佳學生論文解讀,中科大、華為諾亞:序列推薦新典範DR4SRKDD2024最佳學生論文解讀,中科大、華為諾亞:序列推薦新典範DR4SR促進多樣性的重生成器:KDD2024最佳學生論文解讀,中科大、華為諾亞:序列推薦新典範DR4SRKDD2024最佳學生論文解讀,中科大、華為諾亞:序列推薦新典範DR4SR


借助預訓練任務,研究團隊現在可以預先訓練一個資料集重生成器。本文中,他們採用 Transformer 模型作為重生成器的主要架構,其生成能力已被廣泛驗證。資料集重生成器由三個模組組成:一個用於獲取原始資料集中序列表示的編碼器、一個用於重生成模式的解碼器,以及一個用於捕捉一對多映射關係的多樣性增強模組。接下來,研究團隊將分別介紹這些模組。

編碼器由多個堆疊的多頭自註意力(MHSA)和前饋網路(FFN)層組成。至於解碼器,它將重生成資料集 X' 中的模式作為輸入。解碼器的目標是在給定編碼器產生的序列表示的情況下重構模式

KDD2024最佳學生論文解讀,中科大、華為諾亞:序列推薦新典範DR4SR

然而,從一個序列中可以提取多個模式,這在訓練過程中會帶來挑戰。為了解決這一一對多映射問題,研究團隊進一步提出了一個多樣性增強模組。

具體而言,研究團隊透過將目標模式的訊息整合到解碼階段,來自適應地調節原始序列的影響。首先,他們將編碼器產生的記憶 
投影到
KDD2024最佳學生論文解讀,中科大、華為諾亞:序列推薦新典範DR4SR個不同的向量空間中,也就是 。理想情況下,不同的目標模式應與不同的記憶相符。為此,他們還引入了一個 Transformer 編碼器來編碼目標模式並取得 。他們將 KDD2024最佳學生論文解讀,中科大、華為諾亞:序列推薦新典範DR4SR壓縮成一個機率向量:KDD2024最佳學生論文解讀,中科大、華為諾亞:序列推薦新典範DR4SRKDD2024最佳學生論文解讀,中科大、華為諾亞:序列推薦新典範DR4SR

KDD2024最佳學生論文解讀,中科大、華為諾亞:序列推薦新典範DR4SR

其中
是選擇第 k 個記憶的機率。為了確保每個記憶空間得到充分訓練,我們不執行硬選擇,而是透過加權求和得到最終的記憶:KDD2024最佳學生論文解讀,中科大、華為諾亞:序列推薦新典範DR4SRKDD2024最佳學生論文解讀,中科大、華為諾亞:序列推薦新典範DR4SR

最終,可以利用所獲得的記憶來促進解碼過程,並有效捕捉序列與模式之間複雜的一對多關係。

模型感知的資料集重生成

由於前面的重生成過程與目標模型無關,因此重生成的資料集可能對於特定的目標模型來說並不是最優的。因此,他們將模型無關的資料集重生成過程擴展為模型感知的重生成過程。為此,在資料集重生成器的基礎上,他們引入了一個資料集個性化器,用於評估重生成資料集中每個資料樣本的評分。然後,研究團隊進一步透過隱式微分有效地優化資料集個人化器。

資料集個人化器:

研究團隊的目標是訓練一個參數為KDD2024最佳學生論文解讀,中科大、華為諾亞:序列推薦新典範DR4SR的基於MLP 實現的資料集個人化器KDD2024最佳學生論文解讀,中科大、華為諾亞:序列推薦新典範DR4SR,用於評估每個資料樣本W 對於目標模型的評分。為了確保框架的通用性,研究團隊利用計算得到的評分來調整訓練損失的權重,這不需要對目標模型進行額外的修改。他們從定義原始的下一個物品預測損失開始:

KDD2024最佳學生論文解讀,中科大、華為諾亞:序列推薦新典範DR4SR

隨後,個人化資料集的訓練損失函數可以定義為:

KDD2024最佳學生論文解讀,中科大、華為諾亞:序列推薦新典範DR4SR

實驗結論

主要🎜>

研究團隊比較了每個目標模型與「DR4SR」 和「DR4SR+」 變異體的效能,以驗證所提出框架的有效性。

KDD2024最佳學生論文解讀,中科大、華為諾亞:序列推薦新典範DR4SR

                                       >
從圖4 展示的整體在效能中,可以得出以下結論:


DR4SR 能夠重產生一個資訊豐富且具有普遍適用性的資料集
  • 不同的目標模型偏好不同的資料集
  • 去噪只是資料重生成問題的子集

以上是KDD2024最佳學生論文解讀,中科大、華為諾亞:序列推薦新典範DR4SR的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
一個提示可以繞過每個主要LLM的保障措施一個提示可以繞過每個主要LLM的保障措施Apr 25, 2025 am 11:16 AM

隱藏者的開創性研究暴露了領先的大語言模型(LLM)的關鍵脆弱性。 他們的發現揭示了一種普遍的旁路技術,稱為“政策木偶”,能夠規避幾乎所有主要LLMS

5個錯誤,大多數企業今年將犯有可持續性5個錯誤,大多數企業今年將犯有可持續性Apr 25, 2025 am 11:15 AM

對環境責任和減少廢物的推動正在從根本上改變企業的運作方式。 這種轉變會影響產品開發,製造過程,客戶關係,合作夥伴選擇以及採用新的

H20芯片禁令震撼中國人工智能公司,但長期以來一直在為影響H20芯片禁令震撼中國人工智能公司,但長期以來一直在為影響Apr 25, 2025 am 11:12 AM

最近對先進AI硬件的限制突出了AI優勢的地緣政治競爭不斷升級,從而揭示了中國對外國半導體技術的依賴。 2024年,中國進口了價值3850億美元的半導體

如果Openai購買Chrome,AI可能會統治瀏覽器戰爭如果Openai購買Chrome,AI可能會統治瀏覽器戰爭Apr 25, 2025 am 11:11 AM

從Google的Chrome剝奪了潛在的剝離,引發了科技行業中的激烈辯論。 OpenAI收購領先的瀏覽器,擁有65%的全球市場份額的前景提出了有關TH的未來的重大疑問

AI如何解決零售媒體的痛苦AI如何解決零售媒體的痛苦Apr 25, 2025 am 11:10 AM

儘管總體廣告增長超過了零售媒體的增長,但仍在放緩。 這個成熟階段提出了挑戰,包括生態系統破碎,成本上升,測量問題和整合複雜性。 但是,人工智能

'AI是我們,比我們更多''AI是我們,比我們更多'Apr 25, 2025 am 11:09 AM

在一系列閃爍和惰性屏幕中,一個古老的無線電裂縫帶有靜態的裂紋。這堆易於破壞穩定的電子產品構成了“電子廢物之地”的核心,這是沉浸式展覽中的六個裝置之一,&qu&qu

Google Cloud在下一個2025年對基礎架構變得更加認真Google Cloud在下一個2025年對基礎架構變得更加認真Apr 25, 2025 am 11:08 AM

Google Cloud的下一個2025:關注基礎架構,連通性和AI Google Cloud的下一個2025會議展示了許多進步,太多了,無法在此處詳細介紹。 有關特定公告的深入分析,請參閱我的文章

IR的秘密支持者透露,Arcana的550萬美元的AI電影管道說話,Arcana的AI Meme,Ai Meme的550萬美元。IR的秘密支持者透露,Arcana的550萬美元的AI電影管道說話,Arcana的AI Meme,Ai Meme的550萬美元。Apr 25, 2025 am 11:07 AM

本週在AI和XR中:一波AI驅動的創造力正在通過從音樂發電到電影製作的媒體和娛樂中席捲。 讓我們潛入頭條新聞。 AI生成的內容的增長影響:技術顧問Shelly Palme

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

Safe Exam Browser

Safe Exam Browser

Safe Exam Browser是一個安全的瀏覽器環境,安全地進行線上考試。該軟體將任何電腦變成一個安全的工作站。它控制對任何實用工具的訪問,並防止學生使用未經授權的資源。

PhpStorm Mac 版本

PhpStorm Mac 版本

最新(2018.2.1 )專業的PHP整合開發工具

MinGW - Minimalist GNU for Windows

MinGW - Minimalist GNU for Windows

這個專案正在遷移到osdn.net/projects/mingw的過程中,你可以繼續在那裡關注我們。 MinGW:GNU編譯器集合(GCC)的本機Windows移植版本,可自由分發的導入函式庫和用於建置本機Windows應用程式的頭檔;包括對MSVC執行時間的擴展,以支援C99功能。 MinGW的所有軟體都可以在64位元Windows平台上運作。

MantisBT

MantisBT

Mantis是一個易於部署的基於Web的缺陷追蹤工具,用於幫助產品缺陷追蹤。它需要PHP、MySQL和一個Web伺服器。請查看我們的演示和託管服務。

VSCode Windows 64位元 下載

VSCode Windows 64位元 下載

微軟推出的免費、功能強大的一款IDE編輯器