儘管圍繞高級AI功能炒作,但企業AI部署中潛伏的巨大挑戰:數據處理瓶頸。在CEO慶祝AI的進步時,工程師會努力應對緩慢的查詢時間,過載管道和停滯的模型。
生成的AI繁榮為大型模型提供了需求,但是這種激增忽略了一個關鍵問題:效率低下的數據準備。組織難以管理大量複雜的數據集。 GPU加速了模型培訓,但是數據準備,即準備輸入數據的關鍵步驟,仍被CPU結合的架構不適合目前的規模而受到阻礙。數據量增長超過了我們的處理能力。
正如Neuroblade的首席執行官兼聯合創始人Elad Sity指出,CPU傳統上用於數據準備,已成為主要的瓶頸,消耗了AI管道的30%以上。這導致工作流緩慢,成本不斷上升以及AI潛力和實際收益之間的差距擴大。這一挑戰引發了向創新解決方案的轉變。該行業正在從人類驅動的見解過渡到AI模型處理越來越多的數據集,從而創造了加速數據收集和處理的周期。
以色列半導體創業公司Neuroblade提出了一種解決方案:專門的硬件,旨在加速數據分析。他們的分析加速器為現代數據庫工作負載提供了根本不同的體系結構,超出了更快的CPU的功能。但是,這真的會重塑企業AI的經濟學嗎?
數據準備放緩
企業意識到AI瓶頸通常不是源於模型本身,而是源於上游數據挑戰。務實的研究所報告強調,數據專業人員將其80%的時間用於數據發現,清潔和組織。儘管估計有所不同,但共識很明顯:大量時間用於數據製備,遮蓋分析和建模。
數據製備涉及提取,轉換和連接大量結構化和半結構化數據,通常位於復雜的湖泊環境中。問題在於對這些任務的通用CPU的依賴。
AMD估計目前約有200萬個CPU插座支持分析工作負載,預計到2027年將增加到4-500萬。這種通用硬件硬件鬥爭與PB級查詢進行了大規模部署。
傳統的CPU規模正在達到其限制,迫使公司擴大集群大小,從而增加了高標準和雲提供商的成本。但是,擴展群集成倍增加節點之間的通信開銷,創造性能,功率和成本障礙。除了一定的一點,這些成本超過了性能的增長,在AI中尤其重要,在AI中,延遲和數據新鮮度直接影響模型的準確性。
專業分析處理器:一種新方法
Neuroblade的加速器通過大大減少查詢時間來顯著增強數據分析平台性能。通過將從CPU到專門硬件(下降)的操作卸載,它可以提高每個服務器的計算能力,從而更快地使用較小的群集對大型數據集進行處理。
與通用CPU的局限性不同,專門構建的硬件增加了每個服務器的處理能力,減少了對大量群集的需求,並減輕了瓶頸,例如網絡開銷,功耗和操作複雜性。
TPC-H基準測試表明,神經薄膜的促進劑大約是領先的矢量化CPU實現(如Presto-Velox)的性能的四倍。通過將分析從CPU轉移到專用的矽,Neuroblade旨在提高性能,同時大大減少基礎設施需求,降低成本,能源消耗和復雜性。
雲採用和行業競爭
Neuroblade與Amazon Web Services(AWS)EC2 F2實例的集成將可訪問性擴展到基於雲的客戶,尤其是在財務分析和AI模型更新等領域。這種趨勢反映了AI中的GPU革命,高分標準領先,隨後採用了更廣泛的市場。
主要的半導體公司也進入了這個空間。 NVIDIA在AI加速器中的主導地位正在推動Intel和AMD等競爭對手探索相鄰的計算區域,從而使專業的分析硬件成為潛在的主要戰場。
AI和分析的收斂性
數據湖區現在可以為儀表板和機器學習模型提供單個數據源,從而提高了效率,但也引入了新的風險。不一致或過時的數據可以減慢商業智能和AI的性能。
傳統的BI工具設計用於預定的人類使用,而AI系統則需要規模恆定的實時數據。有效的數據準備和處理對於維持模型的準確性,洞察力相關性和快速決策至關重要。更快的數據準備可以實現更頻繁的模型更新,較短的反饋循環以及改進各個行業的實時決策。
重新構想分析基礎架構
雖然分析加速度市場是偏生的,但預計採用將增長。企業基礎架構的變化是逐漸的,但是關鍵指標 - 雲集成,基準結果以及對數據效率重要性的認識的越來越多 - 正在進行轉變。 AI的未來不僅取決於模型大小,還取決於有效的數據處理。
與GPU轉換AI的方式相似,分析處理器解決了特定的查詢執行瓶頸,並在一個專業計算的新時代迎來了。對於尋求有形AI ROI的公司,解決數據處理瓶頸是至關重要的。 AI的未來取決於有效地將正確的數據傳遞給模型。
以上是數據分析加速度如何求解AI的隱藏瓶頸的詳細內容。更多資訊請關注PHP中文網其他相關文章!

在約翰·羅爾斯1971年具有開創性的著作《正義論》中,他提出了一種思想實驗,我們應該將其作為當今人工智能設計和使用決策的核心:無知的面紗。這一理念為理解公平提供了一個簡單的工具,也為領導者如何利用這種理解來公平地設計和實施人工智能提供了一個藍圖。 設想一下,您正在為一個新的社會制定規則。但有一個前提:您事先不知道自己在這個社會中將扮演什麼角色。您最終可能富有或貧窮,健康或殘疾,屬於多數派或邊緣少數群體。在這種“無知的面紗”下運作,可以防止規則制定者做出有利於自身的決策。相反,人們會更有動力製定公

許多公司專門從事機器人流程自動化(RPA),提供機器人以使重複的任務自動化 - UIPATH,在任何地方自動化,藍色棱鏡等。 同時,過程採礦,編排和智能文檔處理專業

AI的未來超越了簡單的單詞預測和對話模擬。 AI代理人正在出現,能夠獨立行動和任務完成。 這種轉變已經在諸如Anthropic的Claude之類的工具中很明顯。 AI代理:研究

快速的技術進步需要對工作未來的前瞻性觀點。 當AI超越生產力並開始塑造我們的社會結構時,會發生什麼? Topher McDougal即將出版的書Gaia Wakes:

產品分類通常涉及復雜的代碼,例如諸如統一系統(HS)等系統的“ HS 8471.30”,對於國際貿易和國內銷售至關重要。 這些代碼確保正確的稅收申請,影響每個INV

數據中心能源消耗與氣候科技投資的未來 本文探討了人工智能驅動的數據中心能源消耗激增及其對氣候變化的影響,並分析了應對這一挑戰的創新解決方案和政策建議。 能源需求的挑戰: 大型超大規模數據中心耗電量巨大,堪比數十萬個普通北美家庭的總和,而新興的AI超大規模中心耗電量更是數十倍於此。 2024年前八個月,微軟、Meta、谷歌和亞馬遜在AI數據中心建設和運營方面的投資已達約1250億美元(摩根大通,2024)(表1)。 不斷增長的能源需求既是挑戰也是機遇。據Canary Media報導,迫在眉睫的電

生成式AI正在徹底改變影視製作。 Luma的Ray 2模型,以及Runway的Gen-4、OpenAI的Sora、Google的Veo等眾多新模型,正在以前所未有的速度提升生成視頻的質量。這些模型能夠輕鬆製作出複雜的特效和逼真的場景,甚至連短視頻剪輯和具有攝像機感知的運動效果也已實現。雖然這些工具的操控性和一致性仍有待提高,但其進步速度令人驚嘆。 生成式視頻正在成為一種獨立的媒介形式。一些模型擅長動畫製作,另一些則擅長真人影像。值得注意的是,Adobe的Firefly和Moonvalley的Ma

ChatGPT用户体验下降:是模型退化还是用户期望? 近期,大量ChatGPT付费用户抱怨其性能下降,引发广泛关注。 用户报告称模型响应速度变慢,答案更简短、缺乏帮助,甚至出现更多幻觉。一些用户在社交媒体上表达了不满,指出ChatGPT变得“过于讨好”,倾向于验证用户观点而非提供批判性反馈。 这不仅影响用户体验,也给企业客户带来实际损失,例如生产力下降和计算资源浪费。 性能下降的证据 许多用户报告了ChatGPT性能的显著退化,尤其是在GPT-4(即将于本月底停止服务)等旧版模型中。 这


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

Dreamweaver Mac版
視覺化網頁開發工具

mPDF
mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),

SublimeText3 Linux新版
SublimeText3 Linux最新版

Atom編輯器mac版下載
最受歡迎的的開源編輯器

PhpStorm Mac 版本
最新(2018.2.1 )專業的PHP整合開發工具