搜尋
首頁科技週邊人工智慧GPT-4剛發布就有手機APP接入,上傳照片影片一鍵解讀,還當起了美版知乎的問答bot

這個基於GPT-4的新功能名叫Virtual Volunteer,來自應用Be My Eyes。

GPT-4剛發布,就已經有手機應用程式接入了!

只需要上傳影像,再用語音提出需求,GPT-4就能幫助視障人士「看清」眼前的世界。

隨時隨地,即時解讀,就像聊天對話一樣自然。

例如想換裝,卻不知道手上的衣服是什麼顏色:

GPT-4剛發布就有手機APP接入,上傳照片影片一鍵解讀,還當起了美版知乎的問答bot

#只需要拍照上傳給GPT-4,它很快就能將衣服紋理描述出來,材質、顏色和形狀一清二楚:

GPT-4剛發布就有手機APP接入,上傳照片影片一鍵解讀,還當起了美版知乎的問答bot

#△翻譯by有道

在此之前,視障人士除了用手觸摸以外,辨別物體往往需要依靠身邊的人或是志工的幫助。

有網友看到後讚歎:這是目前見過最令人驚嘆的GPT-4應用程式之一!

GPT-4剛發布就有手機APP接入,上傳照片影片一鍵解讀,還當起了美版知乎的問答bot

所以,加入了影像理解功能的GPT-4,究竟展現了哪些能力?

基於GPT-4讀圖能力打造

這個基於GPT-4的新功能名叫Virtual Volunteer,來自應用Be My Eyes# 。

目前來看,包含問路、導覽、讀取選單、搜尋等功能,接入GPT-4的Virtual Volunteer都能很好地幫用戶完成。

例如問路

GPT-4剛發布就有手機APP接入,上傳照片影片一鍵解讀,還當起了美版知乎的問答bot

只需要拍一張所在地點的照片,再透過語音詢問GPT-4如何到達指定地點,它就會輸出一條完整路線圖,「讀」給使用者聽:

GPT-4剛發布就有手機APP接入,上傳照片影片一鍵解讀,還當起了美版知乎的問答bot

△翻譯by有道

又例如讀圖翻譯#。

GPT-4剛發布就有手機APP接入,上傳照片影片一鍵解讀,還當起了美版知乎的問答bot

只需要給GPT-4看眼物品描述、甚至只是物件形狀,它就能搜尋並輸出這個產品的功能、具體說明和使用方法。

GPT-4剛發布就有手機APP接入,上傳照片影片一鍵解讀,還當起了美版知乎的問答bot

△翻譯by有道

再例如公眾場合導航

想去健身房、卻無法掌握空閒的器材位置,只需要拍攝所在場景照片,GPT-4就能指引你走到無人的器材面前。

GPT-4剛發布就有手機APP接入,上傳照片影片一鍵解讀,還當起了美版知乎的問答bot

△翻譯by有道

當然,還有一點菜、使用自動販賣機買飲料、搜尋某種植物的姓名、給予時尚建議…

GPT-4剛發布就有手機APP接入,上傳照片影片一鍵解讀,還當起了美版知乎的問答bot

只要將需求告訴GPT-4,它就能幫助視障人士解決對應的問題。

不過,目前這項功能還在測試中,蘋果商店可以加入等待列表,至於安卓版也快來了。

GPT-4剛發布就有手機APP接入,上傳照片影片一鍵解讀,還當起了美版知乎的問答bot

搭載它的應用Be My Eyes,是一個為盲人開發的公益應用。

它最早是一個2012年成立的互助社區,並於2015年上線iOS版本應用,隨後又上線了安卓版應用。

這個應用程式分為志願者和盲人兩個群體,志願者會接受盲人傳過來的照片或視頻,透過語音溝通(打電話)幫助他們解決困難,目前已經有接近45w 視障人士和630w 志工使用。

GPT-4剛發布就有手機APP接入,上傳照片影片一鍵解讀,還當起了美版知乎的問答bot

如果成為志願者,則只需要保持在線,確保隨時可以接聽到視障人士的電話。

如果是視障人士使用,則可以在需要協助時撥打志工電話,或是尋求一些專業人士的協助:

GPT-4剛發布就有手機APP接入,上傳照片影片一鍵解讀,還當起了美版知乎的問答bot

##現在加入Virtual Volunteer之後,盲人也可以呼叫「虛擬志工」GPT-4的幫助,不用擔心深夜無人回應的問題。

官方也玩了諧音梗,AI→Eyes,「讓AI成為你的眼睛」:

GPT-4剛發布就有手機APP接入,上傳照片影片一鍵解讀,還當起了美版知乎的問答bot

還當起美版知乎問答bot

當然,除了Be My Eyes應用以外,不少其他APP也在爭先恐後地接入GPT-4。

例如,在美版知乎

Quora出的Poe上,現在已經可以和GPT-4聊天(限免一句話):

GPT-4剛發布就有手機APP接入,上傳照片影片一鍵解讀,還當起了美版知乎的問答bot

又像AI律師軟體

DoNotPay,同樣已經接入了GPT-4,並計畫用它來推出「一鍵訴訟」服務。

GPT-4剛發布就有手機APP接入,上傳照片影片一鍵解讀,還當起了美版知乎的問答bot

基於這個服務,你看不順眼的電話詐騙,一鍵就能檢舉投訴。

如果接到電話詐騙,只需要點擊一個按鈕,對應的電話內容就會被全程錄音,並產生1000字的訴訟內容,索賠1500美元的金額。 (不過目前還只有美國地區適用)

值得一提的是,DoNotPay的CEO Joshua Browder表示,他們之前也用GPT-3.5做過類似的功能,但效果不太行,GPT-4則已經能好好hold住這項要求。

GPT-4剛發布就有手機APP接入,上傳照片影片一鍵解讀,還當起了美版知乎的問答bot

甚至已經有網友嘗試用GPT-4來搞藥物發現了…

GPT-4剛發布就有手機APP接入,上傳照片影片一鍵解讀,還當起了美版知乎的問答bot

除了上述應用和功能以外,還有網友察覺到了GPT-4開發小遊戲的前景。

新的GPT-4似乎在程式設計可靠度上也有所提升,無論是在60秒內做一個打乒乓球小遊戲:

GPT-4剛發布就有手機APP接入,上傳照片影片一鍵解讀,還當起了美版知乎的問答bot

還是20分鐘內搞出一個完整的貪吃蛇:

GPT-4剛發布就有手機APP接入,上傳照片影片一鍵解讀,還當起了美版知乎的問答bot

都可以說是游刃有餘,提出更改需求也可以及時完成,編寫的簡單程序中基本上沒有遇到需要修改的bug。

以上是GPT-4剛發布就有手機APP接入,上傳照片影片一鍵解讀,還當起了美版知乎的問答bot的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:51cto。如有侵權,請聯絡admin@php.cn刪除
閱讀AI索引2025:AI是您的朋友,敵人還是副駕駛?閱讀AI索引2025:AI是您的朋友,敵人還是副駕駛?Apr 11, 2025 pm 12:13 PM

斯坦福大學以人為本人工智能研究所發布的《2025年人工智能指數報告》對正在進行的人工智能革命進行了很好的概述。讓我們用四個簡單的概念來解讀它:認知(了解正在發生的事情)、欣賞(看到好處)、接納(面對挑戰)和責任(弄清我們的責任)。 認知:人工智能無處不在,並且發展迅速 我們需要敏銳地意識到人工智能發展和傳播的速度有多快。人工智能係統正在不斷改進,在數學和復雜思維測試中取得了優異的成績,而就在一年前,它們還在這些測試中慘敗。想像一下,人工智能解決複雜的編碼問題或研究生水平的科學問題——自2023年

開始使用Meta Llama 3.2 -Analytics Vidhya開始使用Meta Llama 3.2 -Analytics VidhyaApr 11, 2025 pm 12:04 PM

Meta的Llama 3.2:多模式和移動AI的飛躍 Meta最近公佈了Llama 3.2,這是AI的重大進步,具有強大的視覺功能和針對移動設備優化的輕量級文本模型。 以成功為基礎

AV字節:Meta' llama 3.2,Google的雙子座1.5等AV字節:Meta' llama 3.2,Google的雙子座1.5等Apr 11, 2025 pm 12:01 PM

本週的AI景觀:進步,道德考慮和監管辯論的旋風。 OpenAI,Google,Meta和Microsoft等主要參與者已經釋放了一系列更新,從開創性的新車型到LE的關鍵轉變

與機器交談的人類成本:聊天機器人真的可以在乎嗎?與機器交談的人類成本:聊天機器人真的可以在乎嗎?Apr 11, 2025 pm 12:00 PM

連接的舒適幻想:我們在與AI的關係中真的在蓬勃發展嗎? 這個問題挑戰了麻省理工學院媒體實驗室“用AI(AHA)”研討會的樂觀語氣。事件展示了加油

了解Python的Scipy圖書館了解Python的Scipy圖書館Apr 11, 2025 am 11:57 AM

介紹 想像一下,您是科學家或工程師解決複雜問題 - 微分方程,優化挑戰或傅立葉分析。 Python的易用性和圖形功能很有吸引力,但是這些任務需要強大的工具

3種運行Llama 3.2的方法-Analytics Vidhya3種運行Llama 3.2的方法-Analytics VidhyaApr 11, 2025 am 11:56 AM

Meta's Llama 3.2:多式聯運AI強力 Meta的最新多模式模型Llama 3.2代表了AI的重大進步,具有增強的語言理解力,提高的準確性和出色的文本生成能力。 它的能力t

使用dagster自動化數據質量檢查使用dagster自動化數據質量檢查Apr 11, 2025 am 11:44 AM

數據質量保證:與Dagster自動檢查和良好期望 保持高數據質量對於數據驅動的業務至關重要。 隨著數據量和源的增加,手動質量控制變得效率低下,容易出現錯誤。

大型機在人工智能時代有角色嗎?大型機在人工智能時代有角色嗎?Apr 11, 2025 am 11:42 AM

大型機:AI革命的無名英雄 雖然服務器在通用應用程序上表現出色並處理多個客戶端,但大型機是專為關鍵任務任務而建立的。 這些功能強大的系統經常在Heavil中找到

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
3 週前By尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解鎖Myrise中的所有內容
3 週前By尊渡假赌尊渡假赌尊渡假赌

熱工具

EditPlus 中文破解版

EditPlus 中文破解版

體積小,語法高亮,不支援程式碼提示功能

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SecLists

SecLists

SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。

MinGW - Minimalist GNU for Windows

MinGW - Minimalist GNU for Windows

這個專案正在遷移到osdn.net/projects/mingw的過程中,你可以繼續在那裡關注我們。 MinGW:GNU編譯器集合(GCC)的本機Windows移植版本,可自由分發的導入函式庫和用於建置本機Windows應用程式的頭檔;包括對MSVC執行時間的擴展,以支援C99功能。 MinGW的所有軟體都可以在64位元Windows平台上運作。

ZendStudio 13.5.1 Mac

ZendStudio 13.5.1 Mac

強大的PHP整合開發環境