首頁  >  文章  >  科技週邊  >  為Gemini AI大模型找場景 谷歌Project Ellman專案曝光

為Gemini AI大模型找場景 谷歌Project Ellman專案曝光

PHPz
PHPz轉載
2023-12-15 09:46:011072瀏覽

为Gemini AI大模型找场景 谷歌Project Ellman项目曝光

Google團隊提出一個設想,用AI技術處理用戶照片及搜尋引擎查詢信息,全面分析出用戶的生活是怎樣的,這個項目名叫「Project Ellmann」。

依照最初的設想,Project Ellmann會用LLM(例如Gemini)提取訊息,從使用者的照片中找到特定模式,然後製作一個聊天機器人,讓它精準回答問題。谷歌宣稱Ellmann將會成為「個人生活故事講述者」。

聽起來很有趣,不過Google到底是想將Ellmann功能植入GooglePhotos,還是放進其它產品?目前還不得而知。谷歌Photos擁有10多億用戶,儲存了4兆張照片或影片。

Google目前正在利用AI技術來優化其產品線,Ellmann只是其中一種利用方式。幾天前,Google推出了Gemini,在某些情況下,Gemini甚至已經超過了OpenAI GPT-4

Google有意將Gemini授權給谷歌雲端(Google Cloud)用戶使用,用戶可以藉助Gemini開發自己想要的功能。 Gemini最突出的優勢在於“多模態”,也就是說它可以理解文字、圖片、視訊、音訊等多種類型的信息。

在最近的一次內部會議上,GooglePhotos部門一位高階主管展示了Project Ellman。內部文件顯示,Google團隊認為可以藉助大語言模式以「鳥瞰」方式展示使用者在現實世界中的生活故事。

透過閱讀傳記、先前的記錄和照片等資料,Ellman能夠更深入地理解情境。舉例來說,透過分析一系列片段,Ellman可以確定這些資訊是否涉及大學生活的主題

在簡報幻燈片中有一句話寫道:「如果不能從鳥瞰的角度來審視個人生活,我們就無法解決難題,也無法講好故事。」

另一個張則提到:「我們會查看您的照片,查看其標籤和位置,然後確定它們是否屬於某個有意義的時刻。當我們全面了解您的生活時,您的個人故事將變得更加清晰。」

Google團隊也談到了Ellmann Chat。什麼是Ellmann Chat?團隊描述說:「你不妨設想一下,當你打開它,它已經知道與個人生活有關的一切,你會向它提什麼問題呢?」

例如,用戶問Ellmann Chat一個問題: 「我有沒有養狗。」AI回答說主人有一隻狗,還說出了狗的名字,還說家裡有兩人最喜歡和狗在一起,家人的名字叫什麼。

另一個問題則是主人想搬家,讓AI提供一些與現有居住環境相似的小鎮供選擇。這些問題Ellmann都能回答。不只如此,Ellmann還知道使用者的飲食習慣是怎樣的。

舉個例子,當用戶想要購買某樣東西、對什麼感興趣、有什麼工作和旅行計劃時,Ellmann可以透過分析照片來找到答案。而用戶喜歡造訪哪些網站、使用哪些App,Ellmann也能瞭如指掌

Google新聞發言人透露:「Google照片一直希望利用人工智慧技術來幫助用戶搜尋照片和影片。有了LLM,我們能夠提供更實用的體驗。目前,Ellmann仍處於內部早期探索階段,是否最終推出還需要時間來確定。Google要確保Ellmann對用戶真正有幫助,同時也要考慮用戶的隱私和安全。」

有很多科技企業都想利用新科技為使用者創造更個人化的個人記憶,Project Ellmann只是其中之一。

不管是GooglePhotos還是蘋果相冊,它們都在分析照片,從中找到規律,然後製作相簿。 GooglePhotos可以自動將相似照片集合在一起變成相冊,方便使用者尋找。蘋果6月曾說,軟體升級之後可以辨識出相片中的人、狗或貓,用戶只需要說出人的名字,軟體就可以幫你找他的照片。

聽起來很不錯,可是谷歌和蘋果的技術仍然存在不完美的地方,有時也會出現錯誤。在2015年,蘋果和谷歌的人工智慧曾經將黑人錯誤地識別為黑猩猩,這個錯誤引起了很多的笑話。即使到了現在,這種錯誤仍然難以避免

以上是為Gemini AI大模型找場景 谷歌Project Ellman專案曝光的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文轉載於:51cto.com。如有侵權,請聯絡admin@php.cn刪除