接地恐龍:零拍物檢測變得容易
圖像中的精確對象檢測,尤其是那些形狀不規則的對象檢測提出了挑戰。但是,諸如DINO接地的尖端模型為零擊對象檢測提供了有效的解決方案。該模型擅長使用文本提示識別圖像中的對象,將其功能擴展到封閉設置和開放集對象檢測。讓我們探索其功能和應用程序。
關鍵功能:
- 零射擊檢測:識別對象而無需標記的培訓數據,依靠文本描述為輸入。
- 基於文本的查詢:允許用戶使用自然語言提示指定目標對象。
- 開放和閉合檢測:處理已知和未知對像類。
接地Dino的工作原理:
接地Dino通過分析文本提示並將其與圖像中的視覺特徵相匹配來運行。該過程涉及:
- 對象標識:該模型標識文本提示中描述的對象。
- 對象提案生成:它基於顏色和形狀等視覺提示創建“對象建議”。
- 概率評分:每個提案都會獲得一個概率分數,表明視覺功能和文本描述之間匹配的可能性。較高的分數表明匹配更強。
模型體系結構:
接地Dino利用了兩流體系結構,結合了視覺和文字信息:
- 特徵提取:視覺主鏈(如Swin Transformer)提取圖像特徵,而文本編碼器(如Bert)處理文本提示。
- 功能增強功能:功能增強器使用自我發項機制來創建圖像和文本特徵的統一表示。
- 語言指導的查詢選擇:此階段使用文本輸入來選擇相關的圖像功能,幫助對象本地化和標籤分配。
- 跨模式集成:注意層和前饋網絡結合了視覺和文本信息以完善對象檢測。
跑步恐龍:
該模型可以使用Python中的transformers
庫運行。以下是一個簡化的示例,展示了該過程:
導入請求 導入火炬 從PIL導入圖像 從變形金剛導入自動化處理器,AutoModeForzeroshotObjectDetection model_id =“思想研究/接地 - 基礎” 設備=“ cuda”如果torch.cuda.is_available()else“ cpu” processor = autopersesor.from_pretrated(model_id) model = automodelforzeroshotobjectDetection.from_pretrated(model_id).to(設備) image_url =“ http://images.cocodataset.org/val2017/000000039769.jpg” image = image.open(requests.get(image_url,stream = true).raw) text =“貓。遙控器。” 輸入=處理器(images = image,text = text,return_tensors =“ pt”)。到(設備) 使用Torch.no_grad(): 輸出=模型(**輸入) 結果=處理器 輸出, inputs.input_ids, box_threshold = 0.4, text_threshold = 0.3, target_sizes = [image.size [:: - 1]] ) 打印(結果)
現實世界應用:
接地Dino的零拍功能使其適合各種應用:
- 機器人技術:機器人助手的對象識別。
- 自動駕駛汽車:檢測車輛,交通信號和行人。
- 圖像分析:出於各種目的識別圖像中的對象和人員。
結論:
接地Dino代表了零彈對象檢測的顯著進步。它可以使用文本提示準確識別對象的能力,而無需廣泛的標記數據,從而在各個領域開闢了許多可能性。該模型的體系結構和功能使其成為廣泛應用程序的強大工具。
(注意:提供的代碼片段是簡化的說明。有關更詳細的說明和高級用法,請參閱官方文檔。)
以上是使用接地恐龍基地的零拍物檢測的詳細內容。更多資訊請關注PHP中文網其他相關文章!

Meta攜手Nvidia、IBM和Dell等合作夥伴,拓展了Llama Stack的企業級部署整合。在安全方面,Meta推出了Llama Guard 4、LlamaFirewall和CyberSecEval 4等新工具,並啟動了Llama Defenders計劃,以增強AI安全性。此外,Meta還向10個全球機構(包括致力於改善公共服務、醫療保健和教育的初創企業)發放了總額150萬美元的Llama Impact Grants。 由Llama 4驅動的全新Meta AI應用,被設想為Meta AI

公司開創性的人類互動公司Joi AI介紹了“ AI-Iatsionship”一詞來描述這些不斷發展的關係。 Joi AI的關係治療師Jaime Bronstein澄清說,這並不是要取代人類C

在線欺詐和機器人攻擊對企業構成了重大挑戰。 零售商與機器人ho積產品,銀行戰斗帳戶接管以及社交媒體平台與模仿者鬥爭。 AI的興起加劇了這個問題,Rende

AI代理人有望徹底改變營銷,並可能超過以前技術轉變的影響。 這些代理代表了生成AI的重大進步,不僅是處理諸如chatgpt之類的處理信息,而且還採取了Actio

人工智能對關鍵NBA遊戲4決策的影響 兩場關鍵遊戲4 NBA對決展示了AI在主持儀式中改變遊戲規則的角色。 首先,丹佛的尼古拉·喬基奇(Nikola Jokic)錯過了三分球,導致亞倫·戈登(Aaron Gordon)的最後一秒鐘。 索尼的鷹

傳統上,擴大重生醫學專業知識在全球範圍內要求廣泛的旅行,動手培訓和多年指導。 現在,AI正在改變這一景觀,克服地理局限性並通過EN加速進步

英特爾正努力使其製造工藝重回領先地位,同時努力吸引無晶圓廠半導體客戶在其晶圓廠製造芯片。為此,英特爾必須在業界建立更多信任,不僅要證明其工藝的競爭力,還要證明合作夥伴能夠以熟悉且成熟的工作流程、一致且高可靠性地製造芯片。今天我聽到的一切都讓我相信英特爾正在朝著這個目標前進。 新任首席執行官譚立柏的主題演講拉開了當天的序幕。譚立柏直率而簡潔。他概述了英特爾代工服務的若干挑戰,以及公司為應對這些挑戰、為英特爾代工服務的未來規劃成功路線而採取的措施。譚立柏談到了英特爾代工服務正在實施的流程,以更以客

全球專業再保險公司Chaucer Group和Armilla AI解決了圍繞AI風險的日益嚴重的問題,已聯手引入了新型的第三方責任(TPL)保險產品。 該政策保護業務不利


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

SecLists
SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。

SublimeText3漢化版
中文版,非常好用

Dreamweaver Mac版
視覺化網頁開發工具