單幀標註影片就能學到片段特徵，達到全監督性能！華科拿下時序行為檢測新SOTA-人工智慧-PHP中文網

首頁

科技週邊

人工智慧

單幀標註影片就能學到片段特徵，達到全監督性能！華科拿下時序行為檢測新SOTA

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jan 11, 2024 pm 10:39 PM

ai訓練

如何從一段影片中找出感興趣的片段？時序行為偵測（Temporal Action Localization，TAL）是一種常用方法。

利用影片內容建模之後，就可以在整段影片當中自由搜尋了。

而華中科技大學與密西根大學的聯合團隊最近又為這項技術帶來了新的進展——

過去TAL中的建模是片段甚至實例級的，而現在只要影片裡的一幀就能實現，效果媲美全監督。

單幀標註影片就能學到片段特徵，達到全監督性能！華科拿下時序行為檢測新SOTA

來自華中科技大學的團隊提出了一個名為HR-Pro的新框架，用於點標註監督的時序行為檢測。

透過多層級的reliability propagation，HR-Pro可以網路學習到更具辨別力的片段級特徵和更可靠的實例級邊界。

HR-Pro由兩個可靠性感知的階段組成，它能夠有效地從片段層級和實例層級的點標註中傳播高置信度的線索，從而使網路學習到更具區分性的片段表示和更可靠的提議。

在多個基準資料集上進行的實驗表明，HR-Pro優於現有方法，結果最先進，證明了其有效性和點標註的潛力。

表現比肩全監督方式

下圖展示了HR-Pro與LACP在THUMOS14測試影片上進行時序行為檢測表現比較。

HR-Pro展現出更了準確的動作實例檢測，具體來說：

對於「高爾夫揮桿」行為，HR-Pro有效地區分了行為和背景片段，減輕了LACP難以處理的False Positive預測；
對於鐵餅投擲行為，HR-Pro檢測到比LACP更完整的片段，後者在非區分性動作片段上具有較低的激活值。

單幀標註影片就能學到片段特徵，達到全監督性能！華科拿下時序行為檢測新SOTA

資料集上的測試結果，也印證了這一直觀感受。

將THUMOS14資料集上的檢測結果視覺化後可以觀察到，在實例層級完整性學習之後，高品質預測和低品質預測之間的差異顯著增大。

（左側是實例層級完整性學習之前的結果，右側是學習之後的結果。橫軸和縱軸分別表示時間和可靠性分數。）

單幀標註影片就能學到片段特徵，達到全監督性能！華科拿下時序行為檢測新SOTA

整體來看，在常用4個資料集中，HR-Pro的效能都大幅超越最先進的點監督方法，在THUMOS14資料集上的平均mAP達到60.3%，相較之前的SoTA方法(53.7%)的提升為6.5%，並且能與一些全監督方法達到相當的效果。

在THUMOS14測試集上與下表中的先前最先進方法相比，對於IoU閾值在0.1到0.7之間，HR-Pro的平均mAP為60.3%，比先前最先進方法CRRC- Net高6.5%。

且HR-Pro能夠與具有競爭力的全監督方法達到相當的表現，例如AFSD（對於IoU閾值在0.3到0.7之間，平均mAP為51.1% vs. 52.0%）。

△HR-Pro與前SOTA方法在THUMOS14資料集上的比較

在各種基準資料集上的通用性和優越性方面，HR-Pro也明顯優於現有方法，在GTEA、BEOID和ActivityNet 1.3上分別取得了3.8%、7.6%和2.0%的提高。

△HR-Pro與前SOTA方法在GTEA等資料集上的比較

那麼，HR-Pro具體是如何實現的呢？

學習分兩階段進行

研究團隊提出了多層級可靠傳播方法，在片段級引入可靠片段記憶模組並利用交叉注意力的方法向其他片段傳播，在實例級提出基於點監督的提議產生來關聯片段和實例，用於產生不同可靠性的proposals，進一步在實例層級優化proposals的置信度和邊界。

HR-Pro的模型架構如下圖所示：時序行為偵測被分割為兩階段的學習過程，即片段層級的判別性學習和實例層級的完整性學習。

單幀標註影片就能學到片段特徵，達到全監督性能！華科拿下時序行為檢測新SOTA

階段一：片段級判別學習

研究團隊引入可靠性感知的片段級判別學習，提出為每個類別儲存可靠原型，並透過影片內和視訊間的方式將這些原型中的高置信度線索傳播到其他片段。

片段級可靠原型建構

為了建立片段層級的可靠原型，團隊創建了一個線上更新的原型memory，用於儲存各類行為的可靠原型mc（其中c = 1, 2, …, C），以便能夠利用整個資料集的特徵資訊。

研究團隊選擇了具有點標註的片段特徵初始化原型：

單幀標註影片就能學到片段特徵，達到全監督性能！華科拿下時序行為檢測新SOTA

#接下來，研究人員使用偽標記的行為片段特徵來更新每個類別的原型，具體表述如下：

單幀標註影片就能學到片段特徵，達到全監督性能！華科拿下時序行為檢測新SOTA

片段級可靠性感知最佳化

為了將片段級可靠原型的特徵資訊傳遞到其他片段，研究團隊設計了一個Reliabilty-aware Attention Block（RAB），透過交叉注意力的方式實現了將原型中的可靠資訊注入到其他的片段中，從而增強片段特徵的魯棒性，並增加對較不具判別力片段的關注。

單幀標註影片就能學到片段特徵，達到全監督性能！華科拿下時序行為檢測新SOTA

為了學習到更有判別裡的片段特徵，團隊也建構了可靠性感知的片段對比損失：

單幀標註影片就能學到片段特徵，達到全監督性能！華科拿下時序行為檢測新SOTA

階段二：實例層級完整性學習

為了充分探索實例層級行為的時序結構並優化提議的得分排名，團隊引入了實例層級的動作完整性學習。

這種方法旨在透過可靠的實例原型的指導，透過實例層級的特徵學習來精化提議的置信度分數和邊界。

實例層級可靠原型建構

為了在訓練過程中利用點標註的實例層級先驗訊息，團隊提出了一種基於點標註的提議生成方法用於產生不同Reliability的proposals。

根據其可靠性分數和相對點標註的時序位置，這些提議可以分為兩種類型：

可靠提議（Reliable Proposals, RP ）：對於每個類別中的每個點，提議包含了這個點，並具有最高的可靠性；
正樣本提議（Positive Proposals, PP）：所有其餘的候選提議。

為確保正樣本和負樣本數量平衡，研究團隊將那些具有類別無關的注意力分數低於預定義值的片段分組為負樣本提議（Negative Proposals, NP）。

實例層級可靠性感知最佳化

為了預測每個提議的完整性分數，研究團隊將敏感邊界的提議特徵輸入至得分預測頭φs:

單幀標註影片就能學到片段特徵，達到全監督性能！華科拿下時序行為檢測新SOTA

然後用正/負樣本提議與可靠提議的IoU作為指導，監督提議的完整性分數預測：

單幀標註影片就能學到片段特徵，達到全監督性能！華科拿下時序行為檢測新SOTA

為了獲得更準確邊界的行為proposal，研究者將每個PP中的proposal的起始區域特徵和結束區域特徵輸入到回歸預測頭φr中，以預測proposal開始和結束時間的偏移量。

進一步計算得到精細化的proposals，並希望精細化後的proposals與可靠proposal重疊。

單幀標註影片就能學到片段特徵，達到全監督性能！華科拿下時序行為檢測新SOTA

總之，HR-Pro只需很少的標註就能很好的效果大幅度降低了取得標籤的成本，同時又擁有較強的泛化能力，為實際部署應用提供了有利條件。

據此，作者預計，HR-Pro將在行為分析、人機互動、駕駛分析等領域擁有廣闊的應用前景。

論文網址：https://arxiv.org/abs/2308.12608

以上是單幀標註影片就能學到片段特徵，達到全監督性能！華科拿下時序行為檢測新SOTA的詳細內容。更多資訊請關注PHP中文網其他相關文章！

陳述

本文轉載於：51CTO.COM。如有侵權，請聯絡admin@php.cn刪除

ai合并图层的快捷键是什么Jan 07, 2021 am 10:59 AM

ai合并图层的快捷键是“Ctrl+Shift+E”，它的作用是把目前所有处在显示状态的图层合并，在隐藏状态的图层则不作变动。也可以选中要合并的图层，在菜单栏中依次点击“窗口”-“路径查找器”，点击“合并”按钮。

ai橡皮擦擦不掉东西怎么办Jan 13, 2021 am 10:23 AM

ai橡皮擦擦不掉东西是因为AI是矢量图软件，用橡皮擦不能擦位图的，其解决办法就是用蒙板工具以及钢笔勾好路径再建立蒙板即可实现擦掉东西。

谷歌超强AI超算碾压英伟达A100！TPU v4性能提升10倍，细节首次公开Apr 07, 2023 pm 02:54 PM

虽然谷歌早在2020年，就在自家的数据中心上部署了当时最强的AI芯片——TPU v4。但直到今年的4月4日，谷歌才首次公布了这台AI超算的技术细节。论文地址：https://arxiv.org/abs/2304.01433相比于TPU v3，TPU v4的性能要高出2.1倍，而在整合4096个芯片之后，超算的性能更是提升了10倍。另外，谷歌还声称，自家芯片要比英伟达A100更快、更节能。与A100对打，速度快1.7倍论文中，谷歌表示，对于规模相当的系统，TPU v4可以提供比英伟达A100强1.

ai可以转成psd格式吗Feb 22, 2023 pm 05:56 PM

ai可以转成psd格式。转换方法：1、打开Adobe Illustrator软件，依次点击顶部菜单栏的“文件”-“打开”，选择所需的ai文件；2、点击右侧功能面板中的“图层”，点击三杠图标，在弹出的选项中选择“释放到图层（顺序）”；3、依次点击顶部菜单栏的“文件”-“导出”-“导出为”；4、在弹出的“导出”对话框中，将“保存类型”设置为“PSD格式”，点击“导出”即可；

ai顶部属性栏不见了怎么办Feb 22, 2023 pm 05:27 PM

ai顶部属性栏不见了的解决办法：1、开启Ai新建画布，进入绘图页面；2、在Ai顶部菜单栏中点击“窗口”；3、在系统弹出的窗口菜单页面中点击“控制”，然后开启“控制”窗口即可显示出属性栏。

GPT-4的研究路径没有前途？Yann LeCun给自回归判了死刑Apr 04, 2023 am 11:55 AM

Yann LeCun 这个观点的确有些大胆。「从现在起 5 年内，没有哪个头脑正常的人会使用自回归模型。」最近，图灵奖得主 Yann LeCun 给一场辩论做了个特别的开场。而他口中的自回归，正是当前爆红的 GPT 家族模型所依赖的学习范式。当然，被 Yann LeCun 指出问题的不只是自回归模型。在他看来，当前整个的机器学习领域都面临巨大挑战。这场辩论的主题为「Do large language models need sensory grounding for meaning and u

ai移动不了东西了怎么办Mar 07, 2023 am 10:03 AM

ai移动不了东西的解决办法：1、打开ai软件，打开空白文档；2、选择矩形工具，在文档中绘制矩形；3、点击选择工具，移动文档中的矩形；4、点击图层按钮，弹出图层面板对话框，解锁图层；5、点击选择工具，移动矩形即可。

AI抢饭碗成真！近500家美国企业用ChatGPT取代员工，有公司省下超10万美元Apr 07, 2023 pm 02:57 PM

自从ChatGPT掀起浪潮，不少人都在担心AI快要抢人类饭碗了。然鹅，现实可能更残酷QAQ......据就业服务平台Resume Builder调查统计，在1000多家受访美国企业中，用ChatGPT取代部分员工的，比例已达到惊人的48%。在这些企业中，有49%已经启用ChatGPT，还有30%正在赶来的路上。就连央视财经也为此专门发过一个报道：相关话题还曾一度冲上了知乎热榜，众网友表示，不得不承认，现在ChatGPT等AIGC工具已势不可挡——浪潮既来，不进则退。有程序员还指出：用过Copil

See all articles