看過昨天OpenAI的春季發布後,不難猜到,在今天的谷歌I/O大會上,必然會有關於AI助理的介紹。
畢竟,搶在谷歌I/O大會前發布GPT-4o的Altman,已經顯示出了十足的針對性,憑藉Altman的手段,自然也有著十足的把握做到精準打擊,將這場「紅藍對抗」進行到底。
果不其然,大會上,GoogleCEO Pichai請來了DeepMind創始人Demis,Google全新的AI助手Project Astra正是由首次登台谷歌I/O大會的Demis揭開的神秘面紗。

什麼是Project Astra?
Project Astra是一個由GoogleGemini作為基礎引擎的即時、多模態通用人工智慧助手,相當於Google Assistant的繼任者。
與Siri、Alexa等以往我們使用的AI助理相同的是,你依然可以用語音與它進行交互;不同的是,借助生成式AI獨有的特性,它現在擁有了更好的理解能力、可以做更多事情,更重要的是,這次它還有了視覺辨識能力,讓AI助理得以睜眼看世界。
在大會上Google的影片示範中,著重示範的正是這位AI助理的視覺智慧。
在示範影片中,一位Google工程師拿著打開相機的手機,讓Gemini辨識空間中能發出聲音的物體、辨識顯示器螢幕上顯示的程式碼的功能,甚至透過戶外街景辨識示範者現在所在地址。

除了將AI助理應用到手機上,Google還將AI助理應用到了AR眼鏡上,當這位工程師將搭載這款AI助理的智慧眼鏡對準黑板上設計的系統並提出如何改善此系統時,AI助理甚至能給出系統設計的改善建議。

這是Google在AI助理上展現出的視覺智能,在Gemini加持下,這樣的AI助手在互動能力上已經得到了極大的增強。
不過,在實際互動的自然度上,這樣的AI助手依然與昨天OpenAI GPT-4o所展現的效果形成了不小的差距。
OpenAI「截胡」成功
就在GoogleI/O大會前一天,OpenAI召開了一場聲勢浩大的春季發布會,GPT-4o是這次春發的主角,部署在手機上的AI助理則是這次發表會重點展示的功能。
從OpenAI發布會上演示的AI助手能力來看,無論是在演示內容的親民程度、互動過程的自然度,還是這一AI助手多模態能力上,演示效果都要更好。
這是因為OpenAI將GPT-4o裝載到手機上時,不僅加入了視覺智能,還讓這個AI助手能夠實時響應(官方給出的平均響應延時是320毫秒) ,可以隨時被打斷,甚至還能理解人類的情緒。
在視覺智能方面能力演示過程中,OpenAI在紙上寫了一道數學方程式讓AI助理一步一步解題,像極了一位小學老師。

而當你和GPT-4o打「視訊電話」時,它又可以辨識你的臉部表情,理解你的情緒,知道你現在看起來是開心還是難過,活脫就是一個human being。

不難發現,在如今大模型技術加持下,Google和OpenAI都在試圖將原來粗糙不堪的AI助理進行回爐再造,想讓AI助理能像真人一樣與我們自然互動。
而從前後兩個發布會視頻演示結果來看,以大模型作為基礎引擎的AI助手,也確實讓我們明顯感受到了,現在的AI助手與此前的Siri、Alexa有了明顯的世代差。
實際上,在生成式AI、大模型技術發展如火如荼的當下,蘋果也在試圖讓Siri脫胎換骨,此前彭博社就曾援引知情人士消息報道稱,蘋果正與OpenAI和谷歌分別在談合作,想要將他們的大模型用到iOS 18作業系統中。
至於這樣的AI助理是否能讓Siri再次翻紅,成為AI手機的殺手級應用,接下來,就看蘋果能否再次為AI助理順利「附魔」了。
以上是OpenAI和Google接連兩天的大動作,都想讓AI助理成'精”的詳細內容。更多資訊請關注PHP中文網其他相關文章!

斯坦福大學以人為本人工智能研究所發布的《2025年人工智能指數報告》對正在進行的人工智能革命進行了很好的概述。讓我們用四個簡單的概念來解讀它:認知(了解正在發生的事情)、欣賞(看到好處)、接納(面對挑戰)和責任(弄清我們的責任)。 認知:人工智能無處不在,並且發展迅速 我們需要敏銳地意識到人工智能發展和傳播的速度有多快。人工智能係統正在不斷改進,在數學和復雜思維測試中取得了優異的成績,而就在一年前,它們還在這些測試中慘敗。想像一下,人工智能解決複雜的編碼問題或研究生水平的科學問題——自2023年

Meta的Llama 3.2:多模式和移動AI的飛躍 Meta最近公佈了Llama 3.2,這是AI的重大進步,具有強大的視覺功能和針對移動設備優化的輕量級文本模型。 以成功為基礎

本週的AI景觀:進步,道德考慮和監管辯論的旋風。 OpenAI,Google,Meta和Microsoft等主要參與者已經釋放了一系列更新,從開創性的新車型到LE的關鍵轉變

連接的舒適幻想:我們在與AI的關係中真的在蓬勃發展嗎? 這個問題挑戰了麻省理工學院媒體實驗室“用AI(AHA)”研討會的樂觀語氣。事件展示了加油

介紹 想像一下,您是科學家或工程師解決複雜問題 - 微分方程,優化挑戰或傅立葉分析。 Python的易用性和圖形功能很有吸引力,但是這些任務需要強大的工具

Meta's Llama 3.2:多式聯運AI強力 Meta的最新多模式模型Llama 3.2代表了AI的重大進步,具有增強的語言理解力,提高的準確性和出色的文本生成能力。 它的能力t

數據質量保證:與Dagster自動檢查和良好期望 保持高數據質量對於數據驅動的業務至關重要。 隨著數據量和源的增加,手動質量控制變得效率低下,容易出現錯誤。

大型機:AI革命的無名英雄 雖然服務器在通用應用程序上表現出色並處理多個客戶端,但大型機是專為關鍵任務任務而建立的。 這些功能強大的系統經常在Heavil中找到


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

Atom編輯器mac版下載
最受歡迎的的開源編輯器

mPDF
mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),

MantisBT
Mantis是一個易於部署的基於Web的缺陷追蹤工具,用於幫助產品缺陷追蹤。它需要PHP、MySQL和一個Web伺服器。請查看我們的演示和託管服務。

Dreamweaver Mac版
視覺化網頁開發工具

記事本++7.3.1
好用且免費的程式碼編輯器