儘管人工智慧 (AI) 由於指數級的發展而變得更加先進,但這種現代技術的局限性仍然存在。
那麼,合成資料能否成為所有與人工智慧相關的問題的解決方案?
在第四次工業革命中,每個產業都發現了現代科技的潛力;例如人工智慧(AI)和機器學習(ML)。
幾乎所有其他組織都在部署 AI 以創建更有效率的業務流程並確保更好的客戶滿意度。但是,新創公司、SOHO 和中小型企業 (SMB) 在採用 AI 時面臨一個重大問題——這就是所謂的 冷啟動問題。雖然新創公司和中小企業一般沒有資源收集大數據,但冷啟動問題基本上是缺乏此類相關數據。
另一方面,產業巨頭已經擁有資源來收集真實世界的資料並將這些資料應用於訓練他們的人工智慧系統。因此,對中小型企業的勝算很大。在這種情況下,合成資料可能是必要的啟動器。
合成數據可以成為數據驅動的商業模式背後的驅動力。此外,研究顯示 合成資料產生與真實資料相同的結果。 與真實資料相比,合成資料被認為較便宜且處理時間較短。因此,合成數據的出現可以平衡目前由大公司主導的競爭環境,有利於中小企業和新創公司。
發現合成數據的好處
合成數據是基於使用者指定參數的電腦產生的人工數據,以確保數據盡可能接近真實世界的歷史數據。通常,Unreal 引擎和 Unity 等遊戲引擎通常用作模擬環境,用於測試和訓練基於 AI 的應用,例如自動駕駛汽車。基於合成數據開發人工智慧驅動的應用程式有很多優點。其中一些優點包括:
1.開發原型
查找、聚合和建模大量相關的真實資料是一個乏味的過程。因此,產生合成數據可能是最佳解決方案。此類數據將能夠在大規模生產之前建立原型並測試此類原型以獲得所需的結果。與真實數據相比,使用合成數據建構原型更有效率、更具成本效益。
非營利人工智慧研究公司 Open AI 正在開發大量基於人工智慧的應用。在這些應用中,研究人員開發了用合成資料訓練的機器人,可以在看到一個動作只執行一次後學習一項新任務。一家美國加州科技新創公司正在開發一個人工智慧平台,其願景類似於 Amazon Go。這家新創公司旨在藉助合成數據為便利商店和零售商提供免結帳解決方案。他們還引入了人工智慧驅動的智慧系統來監控商店中的每位購物者,以識別和分析他們的學習模式。
2. 確保資料隱私
2018 年 11 月, 5 億萬豪客戶在一次備受矚目的資料外洩事件中受到影響。在這 5 億人中,有 3.27 億用戶的護照資料、電子郵件地址、郵寄地址和信用卡資料等資料被盜。由於此類事件,人們擔心其資料的安全性和隱私性。
合成資料可以有效解決此類隱私問題。合成資料不包括任何個人資料。因此,可以輕鬆確保資料隱私。合成資料在為醫療保健應用訓練 AI 系統方面非常有用。人工智慧系統通常需要真實的患者資料。這威脅到病患的隱私。合成數據允許在醫療保健領域開發先進的人工智慧應用程序,同時保持患者的機密性。
例如,來自 Nvidia 的研究人員正在與明尼蘇達州的 Mayo Clinic 以及波士頓的 MGH 和 BWH 臨床資料科學中心合作,正在 使用產生對抗網路來產生用於訓練神經網路的合成資料。 產生的合成資料包含來自阿茲海默症神經影像學倡議資料集的 3,400 個 MRI 和來自多模態腦腫瘤影像分割基準資料集的 200 個 4D 腦部 MRI 和腫瘤。同樣,模擬 X 光也可以與實際 X 光一起使用,以訓練 AI 系統識別多種健康狀況。
3. 前所未有的場景測試和訓練
開發 AI 驅動的應用最重要的過程之一是測試系統效能。如果系統沒有產生所需的輸出,則需要重新訓練。在這種情況下,合成數據可以證明是有益的。合成資料可以產生場景來測試 AI 系統,而不是使用真實資料或在真實環境中測試系統。這種方法比獲取真實數據便宜且耗時更少。
同樣,合成資料還可以針對未來可能出現的缺乏真實資料或事件的場景訓練新的或現有的系統。透過這種方法,研究人員可以開發更具未來感的人工智慧應用。此外,使用合成資料重新訓練 AI 系統更簡單,因為產生合成資料比收集準確的真實資料要簡單。
由於這些好處,合成資料已成為測試和訓練自動駕駛汽車的一種可訪問的替代方案。許多自動駕駛汽車開發人員正在使用 GTA V 等模擬遊戲環境來訓練他們的基於人工智慧的系統。同樣,May Mobility 正在透過使用合成數據訓練他們的車輛來建造自動駕駛微型交通服務。
另一家名為 Waymo 的自動駕駛汽車開發商已經通過在模擬道路上行駛 50 億英里和在真實道路上再行駛 800 萬英里來測試其自動駕駛汽車。合成數據方法允許開發人員在模擬道路上測試他們的自動駕駛汽車,這比在實際道路上直接測試要安全得多。
4. 提高資料彈性
取得真實資料是一個乏味的過程,包括支付註解費用並確保避免任何侵犯版權的行為。此外,真實資料只能用於在特定領域具有足夠歷史資料的特定場景。與真實資料不同,合成資料可以立即呈現物件、場景、事件和人員的任意組合。合成資料可以產生能夠發現利基應用的通用資料集。因此,研究人員可以利用合成資料來探索無限的可能性。幾家新創公司 透過開發滿足客戶要求的訓練資料集, 創造了開放的資料經濟。
5. 探索合成資料的限制
儘管合成資料可以幫助 AI 到達未被發現的領域,但其限制可能成為其主流部署的主要障礙。對於初學者來說,合成資料模擬了真實世界資料的多個屬性,但它不會完全複製原始資料。 在對此類合成資料進行建模時,人工智慧系統只會在真實資料中尋找共同的趨勢和情況。因此,現實世界資料中極端案例中包含的罕見場景可能永遠不會包含在合成資料中。
此外,研究人員尚未發展出一種機制來檢查資料是否準確。發現真實數據中的缺陷並減少它們比使用合成數據更簡單。人工智慧驅動的系統已經有 陰暗面 這會助長無意的偏見。使用合成數據,預測這種偏見的範圍和影響可能還為時過早。
6. 克服挑戰
企業組織需要了解合成資料是一個相當新的發現。此類數據的效率和準確性尚未根據目前的行業標準進行評估。因此,合成資料不應被視為獨立的資料來源。尤其是在面臨安全問題的應用中,例如醫療保健應用和自動駕駛汽車,合成數據必須與現實世界數據結合,以開發 AI 系統。但零售業的應用具有較低的風險因素,且容易依賴合成數據。
出於測試目的,合成資料是一種可行且成本低廉的解決方案。但是,出於其他目的,在採用合成數據作為獨立解決方案之前,需要徹底研究和分析人工智慧系統的結果。隨著進一步的研究,合成數據對於多種操作可能會變得更加可靠。
以上是合成數據能讓人工智慧變得更好嗎?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

机器学习是一个不断发展的学科,一直在创造新的想法和技术。本文罗列了2023年机器学习的十大概念和技术。 本文罗列了2023年机器学习的十大概念和技术。2023年机器学习的十大概念和技术是一个教计算机从数据中学习的过程,无需明确的编程。机器学习是一个不断发展的学科,一直在创造新的想法和技术。为了保持领先,数据科学家应该关注其中一些网站,以跟上最新的发展。这将有助于了解机器学习中的技术如何在实践中使用,并为自己的业务或工作领域中的可能应用提供想法。2023年机器学习的十大概念和技术:1. 深度神经网

实现自我完善的过程是“机器学习”。机器学习是人工智能核心,是使计算机具有智能的根本途径;它使计算机能模拟人的学习行为,自动地通过学习来获取知识和技能,不断改善性能,实现自我完善。机器学习主要研究三方面问题:1、学习机理,人类获取知识、技能和抽象概念的天赋能力;2、学习方法,对生物学习机理进行简化的基础上,用计算的方法进行再现;3、学习系统,能够在一定程度上实现机器学习的系统。

本文将详细介绍用来提高机器学习效果的最常见的超参数优化方法。 译者 | 朱先忠审校 | 孙淑娟简介通常,在尝试改进机器学习模型时,人们首先想到的解决方案是添加更多的训练数据。额外的数据通常是有帮助(在某些情况下除外)的,但生成高质量的数据可能非常昂贵。通过使用现有数据获得最佳模型性能,超参数优化可以节省我们的时间和资源。顾名思义,超参数优化是为机器学习模型确定最佳超参数组合以满足优化函数(即,给定研究中的数据集,最大化模型的性能)的过程。换句话说,每个模型都会提供多个有关选项的调整“按钮

截至3月20日的数据显示,自微软2月7日推出其人工智能版本以来,必应搜索引擎的页面访问量增加了15.8%,而Alphabet旗下的谷歌搜索引擎则下降了近1%。 3月23日消息,外媒报道称,分析公司Similarweb的数据显示,在整合了OpenAI的技术后,微软旗下的必应在页面访问量方面实现了更多的增长。截至3月20日的数据显示,自微软2月7日推出其人工智能版本以来,必应搜索引擎的页面访问量增加了15.8%,而Alphabet旗下的谷歌搜索引擎则下降了近1%。这些数据是微软在与谷歌争夺生

荣耀的人工智能助手叫“YOYO”,也即悠悠;YOYO除了能够实现语音操控等基本功能之外,还拥有智慧视觉、智慧识屏、情景智能、智慧搜索等功能,可以在系统设置页面中的智慧助手里进行相关的设置。

阅读论文可以说是我们的日常工作之一,论文的数量太多,我们如何快速阅读归纳呢?自从ChatGPT出现以后,有很多阅读论文的服务可以使用。其实使用ChatGPT API非常简单,我们只用30行python代码就可以在本地搭建一个自己的应用。 阅读论文可以说是我们的日常工作之一,论文的数量太多,我们如何快速阅读归纳呢?自从ChatGPT出现以后,有很多阅读论文的服务可以使用。其实使用ChatGPT API非常简单,我们只用30行python代码就可以在本地搭建一个自己的应用。使用 Python 和 C

人工智能在教育领域的应用主要有个性化学习、虚拟导师、教育机器人和场景式教育。人工智能在教育领域的应用目前还处于早期探索阶段,但是潜力却是巨大的。

人工智能在生活中的应用有:1、虚拟个人助理,使用者可通过声控、文字输入的方式,来完成一些日常生活的小事;2、语音评测,利用云计算技术,将自动口语评测服务放在云端,并开放API接口供客户远程使用;3、无人汽车,主要依靠车内的以计算机系统为主的智能驾驶仪来实现无人驾驶的目标;4、天气预测,通过手机GPRS系统,定位到用户所处的位置,在利用算法,对覆盖全国的雷达图进行数据分析并预测。


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

PhpStorm Mac 版本
最新(2018.2.1 )專業的PHP整合開發工具

Atom編輯器mac版下載
最受歡迎的的開源編輯器

mPDF
mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),

Dreamweaver Mac版
視覺化網頁開發工具