日前在新品發表會上,Google正式發表新一代安卓旗艦手機Pixel 8 / Pro系列,搭載Tensor G3晶片,該晶片可運行更複雜的ML(機器學習)模型,為新機新增多項AI增強功能,例如用不同語言與「更自然」的聲音為使用者朗讀網頁,虛擬助理說話也更自然。
Google指出,Pixel 8 Pro是第一款直接在裝置上運行Google基礎大模型的手機,其計算量是Pixel 7上最大的ML模型的150倍。
與此同時,Google宣布面向安卓與iOS設備,推出“Bard助理(Assistant with Bard)”,將手機的個人助理功能與生成式AI相結合,用戶可透過文字、語音或圖像與Bard助理互動-換言之,其具備多模態功能。
當使用者詢問「本週我錯過了哪些重要郵件」時,Bard助理會提供以下服務:首先,它會列出各個重要郵件的要點和具體內容,並提供相應郵件的連結。其次,它還能夠幫助用戶提取活動地址,並在Google地圖中顯示
若用戶想將一張小狗的照片發佈到社群媒體上,只需召喚出Bard助理浮動對話框,並要求其撰寫發佈內容。 Bard助理將在辨識影像後,撰寫對應內容。
Google表示,接下來很快將向早期測試人員推出Bard助理,以獲取回饋;並在未來幾個月內向公眾推出。
另外,DeepMind共同創辦人Mustafa Suleyman日前受訪時表示,現階段的生成式AI只是一個過渡性的技術階段,接下來將進入互動式AI時代,AI將根據用戶的不同任務需求,安排其他軟體和或聯絡真人來完成工作。
他認為,第一波人工智慧浪潮主要集中在分類方面——深度學習表明,人類可以訓練人工智慧,對圖像、視訊、音訊、語言等輸入資料進行分類。目前人類正處於第二波浪潮「生成式人工智慧」中,即「輸入資料並產生新資料」。而未來的第三波浪潮將屬於“互動式人工智慧”,“對話是未來的互動介面”,用戶不僅僅是點擊按鈕和鍵入文字,而是與人工智慧直接對話,屆時互動式人工智慧將能夠自主採取行動
天風證券指出,C端AI應用落地階段場景重要性凸顯,聊天機器人、AI伴侶和內容生產工具場景最先落地,這些場景中的AI應用開發速度和商業化進展或超預期。
根據分析師的預測,人工智慧的迭代和後期事件的催化作用將持續加速。下半年,海外巨頭公司的應用和模型迭代速度將明顯提升,通用聊天機器人的能力可望進一步加強。這可能會帶動使用者體驗的提升,並進一步增加使用者數量
另外,華金證券補充稱,大模型從通用走向垂直場景更多的是對商業化落地的探索,是大模型從訓練走向推理的動能。 伴隨著垂直大模型的發展完善,大模型的應用才是打開更大成長空間的關鍵。邊緣運算是一個明確的龐大的增量市場,目前已經發展到產業落地階段,雲端運算公司、電信業者、設備廠商、CDN公司等都在積極推動產業落地。
重寫的內容是:來源:財聯社
以上是谷歌發布多模態Bard助理:邁向互動式AI時代的另一個里程碑的詳細內容。更多資訊請關注PHP中文網其他相關文章!

該博客將三個領先的AI模型(O3,O4-Mini和Gemini 2.5 Pro)置於嚴格的推理挑戰中。 我們在物理,數學,編碼,網頁設計和圖像分析中測試它們的能力,揭示了它們的優勢

YOLO,SSD和DETR等實時對象檢測工具對於監視對象運動和動作至關重要。 交通管理和安全等行業利用這些工具來跟踪和分析。但是,一個主要挑戰是維護

生成AI(Genai)數據科學家:蓬勃發展的職業道路 執行摘要: 生成AI的新興領域需要專業人員熟練的大型數據集導航,LLM加速模型開發和現實世界中的AI部署。 蒂

AI正在改變我們構建軟件的方式。 MCP(模型上下文協議)和光標AI等工具正在領導這一轉變。光標AI使您可以使用自然語言編寫代碼,而MCP則在頂部添加了智能處理和自動化。 tog

Python 3.14.0a6:π日發布的重大更新 2025年3月14日(π日),Python 3.14.0a6發布,這是3.14系列的倒數第二個alpha版本,預示著beta階段即將到來。此次發布包含大量新功能,讓我們一探究竟。 目錄 什麼是Python 3.14 Alpha版本? Python 3.14更新中的主要功能(目前為止) PEP 649 – 延遲求值註解(第二版) PEP 741 – 新的Python配置C API PEP 761 – 不再使用PGP簽名發布(Sigstore登

本指南展示了使用Langchain和模型上下文協議(MCP)構建強大的AI代理。 MCP允許大型語言模型(LLM)與外部工具和實時數據進行交互,從而顯著增強其功能。我們會

理解交叉熵損失:大型語言模型的關鍵指標 交叉熵損失是評估語言模型的基石指標之一,它既是訓練目標,也是評估指標。本文將深入探討交叉熵損失的含義、在大型語言模型 (LLM) 中的工作原理及其重要性。無論您是機器學習從業者、研究人員,還是希望了解現代人工智能係統如何訓練和評估的人員,本文都將為您提供對交叉熵損失及其在語言建模領域意義的全面理解。 目錄 交叉熵損失是什麼? 交叉熵損失的關鍵特性 二元交叉熵與公式 交叉熵作為損失函數 交叉熵在大型語言模型中的作用 工作原理? 公式和解釋 PyT

Google VEO 2:深入了解Google的高級生成視頻模型 Google揭示了Google VEO 2,這是迄今為止最複雜的生成視頻模型。 這個功能強大的工具將詳細的文本描述轉換為電影質量視頻,


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

DVWA
Damn Vulnerable Web App (DVWA) 是一個PHP/MySQL的Web應用程序,非常容易受到攻擊。它的主要目標是成為安全專業人員在合法環境中測試自己的技能和工具的輔助工具,幫助Web開發人員更好地理解保護網路應用程式的過程,並幫助教師/學生在課堂環境中教授/學習Web應用程式安全性。 DVWA的目標是透過簡單直接的介面練習一些最常見的Web漏洞,難度各不相同。請注意,該軟體中

WebStorm Mac版
好用的JavaScript開發工具

Atom編輯器mac版下載
最受歡迎的的開源編輯器

EditPlus 中文破解版
體積小,語法高亮,不支援程式碼提示功能

MinGW - Minimalist GNU for Windows
這個專案正在遷移到osdn.net/projects/mingw的過程中,你可以繼續在那裡關注我們。 MinGW:GNU編譯器集合(GCC)的本機Windows移植版本,可自由分發的導入函式庫和用於建置本機Windows應用程式的頭檔;包括對MSVC執行時間的擴展,以支援C99功能。 MinGW的所有軟體都可以在64位元Windows平台上運作。