搜尋
首頁科技週邊人工智慧為Gemini AI大模型找場景 谷歌Project Ellman專案曝光

为Gemini AI大模型找场景 谷歌Project Ellman项目曝光

Google團隊提出一個設想,用AI技術處理用戶照片及搜尋引擎查詢信息,全面分析出用戶的生活是怎樣的,這個項目名叫「Project Ellmann」。

依照最初的設想,Project Ellmann會用LLM(例如Gemini)提取訊息,從使用者的照片中找到特定模式,然後製作一個聊天機器人,讓它精準回答問題。谷歌宣稱Ellmann將會成為「個人生活故事講述者」。

聽起來很有趣,不過Google到底是想將Ellmann功能植入GooglePhotos,還是放進其它產品?目前還不得而知。谷歌Photos擁有10多億用戶,儲存了4兆張照片或影片。

Google目前正在利用AI技術來優化其產品線,Ellmann只是其中一種利用方式。幾天前,Google推出了Gemini,在某些情況下,Gemini甚至已經超過了OpenAI GPT-4

Google有意將Gemini授權給谷歌雲端(Google Cloud)用戶使用,用戶可以藉助Gemini開發自己想要的功能。 Gemini最突出的優勢在於“多模態”,也就是說它可以理解文字、圖片、視訊、音訊等多種類型的信息。

在最近的一次內部會議上,GooglePhotos部門一位高階主管展示了Project Ellman。內部文件顯示,Google團隊認為可以藉助大語言模式以「鳥瞰」方式展示使用者在現實世界中的生活故事。

透過閱讀傳記、先前的記錄和照片等資料,Ellman能夠更深入地理解情境。舉例來說,透過分析一系列片段,Ellman可以確定這些資訊是否涉及大學生活的主題

在簡報幻燈片中有一句話寫道:「如果不能從鳥瞰的角度來審視個人生活,我們就無法解決難題,也無法講好故事。」

另一個張則提到:「我們會查看您的照片,查看其標籤和位置,然後確定它們是否屬於某個有意義的時刻。當我們全面了解您的生活時,您的個人故事將變得更加清晰。」

Google團隊也談到了Ellmann Chat。什麼是Ellmann Chat?團隊描述說:「你不妨設想一下,當你打開它,它已經知道與個人生活有關的一切,你會向它提什麼問題呢?」

例如,用戶問Ellmann Chat一個問題: 「我有沒有養狗。」AI回答說主人有一隻狗,還說出了狗的名字,還說家裡有兩人最喜歡和狗在一起,家人的名字叫什麼。

另一個問題則是主人想搬家,讓AI提供一些與現有居住環境相似的小鎮供選擇。這些問題Ellmann都能回答。不只如此,Ellmann還知道使用者的飲食習慣是怎樣的。

舉個例子,當用戶想要購買某樣東西、對什麼感興趣、有什麼工作和旅行計劃時,Ellmann可以透過分析照片來找到答案。而用戶喜歡造訪哪些網站、使用哪些App,Ellmann也能瞭如指掌

Google新聞發言人透露:「Google照片一直希望利用人工智慧技術來幫助用戶搜尋照片和影片。有了LLM,我們能夠提供更實用的體驗。目前,Ellmann仍處於內部早期探索階段,是否最終推出還需要時間來確定。Google要確保Ellmann對用戶真正有幫助,同時也要考慮用戶的隱私和安全。」

有很多科技企業都想利用新科技為使用者創造更個人化的個人記憶,Project Ellmann只是其中之一。

不管是GooglePhotos還是蘋果相冊,它們都在分析照片,從中找到規律,然後製作相簿。 GooglePhotos可以自動將相似照片集合在一起變成相冊,方便使用者尋找。蘋果6月曾說,軟體升級之後可以辨識出相片中的人、狗或貓,用戶只需要說出人的名字,軟體就可以幫你找他的照片。

聽起來很不錯,可是谷歌和蘋果的技術仍然存在不完美的地方,有時也會出現錯誤。在2015年,蘋果和谷歌的人工智慧曾經將黑人錯誤地識別為黑猩猩,這個錯誤引起了很多的笑話。即使到了現在,這種錯誤仍然難以避免

以上是為Gemini AI大模型找場景 谷歌Project Ellman專案曝光的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:51CTO.COM。如有侵權,請聯絡admin@php.cn刪除
所有有關打開AI最新的GPT 4.1家庭的信息 - 分析Vidhya所有有關打開AI最新的GPT 4.1家庭的信息 - 分析VidhyaApr 26, 2025 am 10:19 AM

Openai推出了強大的GPT-4.1系列:一個專為現實世界應用設計的三種高級語言模型家族。 這種巨大的飛躍提供了更快的響應時間,增強的理解和大幅降低了成本

什麼是LLM基準?什麼是LLM基準?Apr 26, 2025 am 10:13 AM

大型語言模型(LLM)已成為現代AI應用不可或缺的一部分,但是評估其功能仍然是一個挑戰。長期以來,傳統的基準一直是測量LLM性能的標準,但隨著RA

Gemini 2.5 Pro的7個任務比任何其他聊天機器人都更好!Gemini 2.5 Pro的7個任務比任何其他聊天機器人都更好!Apr 26, 2025 am 10:00 AM

AI聊天機器人變得越來越聰明,並且越來越複雜。 Google DeepMind的最新實驗模型Gemini 2.5 Pro代表了AI Chatbot功能中的一個重大飛躍。具有改進的CONTEX

6 O3提示您今天必須嘗試 - 分析Vidhya6 O3提示您今天必須嘗試 - 分析VidhyaApr 26, 2025 am 09:56 AM

Openai的O3:推理和多模式能力的飛躍 OpenAI的O3模型代表了AI推理能力的重大進步。 O3專為複雜解決問題,分析任務和自主工具的使用而設計

我嘗試了Canva代碼,並在此處進行了。我嘗試了Canva代碼,並在此處進行了。Apr 26, 2025 am 09:53 AM

Canva Create 2025:用Canva Code和AI革新設計 Canva的Create 2025活動推出了重大進步,將其平台擴展到AI驅動的工具,企業解決方案,尤其是開發人員工具。 關鍵更新包括ENH

AI聊天機器人用於任務:AI代理如何悄悄替換應用程序AI聊天機器人用於任務:AI代理如何悄悄替換應用程序Apr 26, 2025 am 09:50 AM

簡單任務的應用程序躍跳時的時代即將結束。 想像一下,通過一次對話預訂假期,或者自動進行賬單。 這是AI代理商的力量 - 您期望您需求的新數字助手,而不是JUS

O3和O4-Mini:Openai最先進的推理模型O3和O4-Mini:Openai最先進的推理模型Apr 26, 2025 am 09:46 AM

Openai的開創性O3和O4-Mini推理模型:向Agi邁出的巨大飛躍 在GPT 4.1 Family發射之後,Openai在AI:O3和O4-Mini推理模型中推出了其最新進步。 這些不僅僅是AI模型;這

用Llama 4和Autogen建立AI代理用Llama 4和Autogen建立AI代理Apr 26, 2025 am 09:44 AM

利用駱駝4和自動基因的力量建立智能AI代理 Meta的Llama 4模型家族正在改變AI景觀,提供了本地的多模式能力來徹底改變智能係統的發展。 本文探索

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

SecLists

SecLists

SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

VSCode Windows 64位元 下載

VSCode Windows 64位元 下載

微軟推出的免費、功能強大的一款IDE編輯器

MantisBT

MantisBT

Mantis是一個易於部署的基於Web的缺陷追蹤工具,用於幫助產品缺陷追蹤。它需要PHP、MySQL和一個Web伺服器。請查看我們的演示和託管服務。

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器