生成式人工智慧是使用演算法生成、操作或合成資料的任何自動化過程的總稱,通常以圖像或人類可讀文字的形式出現。之所以稱之為生成,是因為人工智慧創造了以前不存在的東西。這就是它與判別式人工智慧的不同之處,後者會區分不同類型的輸入。換句話說,辨別性人工智慧試圖回答這樣的問題:「這張圖片是一隻兔子還是一隻獅子?」而生成式人工智慧則會回應「給我畫一張獅子和一隻兔子坐在一起的圖片」這樣的提示。
主要介紹生成式AI及其與ChatGPT和DALL-E等流行模型的使用。我們還將考慮這項技術的局限性,包括為什麼「太多的手指」已經成為人工生成藝術的死贈品。
生成式人工智慧的出現
自從1966年麻省理工學院(MIT)開發出模擬與治療師交談的聊天機器人ELIZA以來,生成式人工智慧已經存在多年。但是,隨著新的生成式人工智慧系統的發布,人工智慧和機器學習領域多年的工作最近取得了成果。人們肯定聽過ChatGPT,這是一種基於文字的人工智慧聊天機器人,可以產生非常像人類的散文。 DALL-E和StableDiffusion也因其基於文字提示創建充滿活力和逼真的圖像的能力而引起關注。我們經常將這些系統和其他類似的系統稱為模型,因為它們代表了基於一個子集(有時是一個非常大的子集)的資訊來模擬或建模現實世界的某些方面的嘗試。
這些系統的輸出是如此的不可思議,以至於許多人對意識的本質提出了哲學問題,並擔心生成式人工智慧對人類工作的經濟影響。但是,儘管所有這些人工智慧創造都是不可否認的大新聞,但表面之下的事情可能比一些人想像的要少。我們稍後會討論這些大問題。首先,讓我們看看像ChatGPT和DALL-E這樣的模型下面發生了什麼。
生成式人工智慧是如何運作的?
生成式人工智慧使用機器學習來處理大量的視覺或文字數據,其中大部分是從網路上抓取的,然後確定哪些東西最有可能出現在其他東西附近。生成式人工智慧的大部分程式設計工作都是為了創建演算法,這些演算法可以區分人工智慧創造者感興趣的「事物」——像是像ChatGPT這樣的聊天機器人的單字和句子,或是DALL-E的視覺元素。但從根本上說,生成式人工智慧是透過評估一個龐大的資料語料庫來創造它的輸出的,然後用語料庫確定的機率範圍內的東西來回應提示。
自動補全——當你的手機或Gmail提示你正在輸入的單字或句子的剩餘部分可能是什麼——是一種低階形式的生成式人工智慧。像ChatGPT和DALL-E這樣的模型只是把這個想法帶到了更先進的高度
訓練生成式人工智慧模型
開發模型以適應所有這些資料的過程稱為訓練。對於不同類型的模型,這裡使用了一些基礎技術。 ChatGPT使用所謂的轉換器(T就是這個意思)。轉換器從長文本序列中獲取意義,以理解不同的單字或語義組件之間的關係,然後確定它們彼此接近出現的可能性。這些變形器在一個被稱為預訓練(PinChatGPT)的過程中,在無人監督的情況下在大量自然語言文本的語料庫上運行,然後由人類與模型交互進行微調。
另一種用於訓練模型的技術稱為生成對抗網路(GAN)。在這種技術中,有兩種演算法相互競爭。一種是基於從大數據集獲得的機率生成文字或圖像;另一種是判別人工智慧,它經過人類的訓練,可以評估輸出是真實的還是人工智慧生成的。生成式AI會反覆嘗試「欺騙」具有辨別能力的AI,自動適應成功的結果。一旦生成式人工智慧持續「贏得」這場競爭,具有辨別能力的人工智慧就會被人類微調,這個過程就會重新開始。
這裡要記住的最重要的事情之一是,儘管在訓練過程中存在人工幹預,但大多數學習和適應都是自動發生的。為了使模型產生有趣的結果,需要進行許多迭代,因此自動化是必不可少的。這個過程需要大量的計算。
生成式人工智慧有感知能力嗎?
用於創建和訓練生成AI模型的數學和編碼相當複雜,遠遠超出了本文的範圍。但如果你與這個過程的最終結果模型互動,這種體驗肯定是不可思議的。你可以讓戴爾-e生產出看起來像真正的藝術品的東西。您可以與ChatGPT進行對話,就像與另一個人進行對話一樣。研究者真的創造了一台會思考的機器嗎?
Chris Phipps is the former director of natural language processing at IBM and participated in the development of Watson artificial intelligence products. He described ChatGPT as a "very good prediction machine."
It's very good at predicting what humans will find coherent. It's not always coherent (most of the time it is), but that's not because ChatGPT "understands" it. The opposite is true: the people consuming the output are really good at making whatever implicit assumptions we need to make the output meaningful.
Phipps, who is also a comedian, compared it to a common improv game called MindMeld.
Two people each think of a word and then say it out loud at the same time - you can say "boot", I say "tree". We came up with the words completely independently, and initially, they had no relationship to each other. The next two participants take the two words and try to find what they have in common while saying them out loud. The game continues until both participants say the same word.
Maybe both people said "lumberjack". This may seem magical, but it's actually us using the human brain to reason about the input ("boot" and "tree") and find connections. We are in the business of understanding, not machines. There's a lot more going on in ChatGPT and DALL-E than people admit. ChatGPT can write a story, but it takes a lot of work for us humans to make it meaningful.
Testing the Limits of Computer Intelligence
People can give these AI models some hints that will make Phipps' point quite obvious. For example, consider this puzzle: "Which is heavier, a pound of lead or a pound of feathers?" The answer is, of course, that they weigh the same (one pound), even though our instinct or common sense might tell us that feathers are lighter.
ChatGPT will answer this puzzle correctly, and you might think it does so because it's a cold, logical computer with no "common sense" tripping it up. But that's not what happens behind the scenes. ChatGPT does not logically reason out an answer; it simply produces output based on predictions from a question about a pound of feathers and a pound of lead. Because its training set contains a bunch of text explaining the puzzle, it assembles a version of the correct answer. However, if you ask ChatGPT if two pounds of feathers weigh more than one pound of lead, it will confidently tell you that they weigh the same because, based on its training set, this is still the most likely result to output to a prompt about feathers and lead. .
以上是重新表述: 什麼是生成式人工智慧,以及人工智慧的演進過程?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

動盪遊戲:與AI代理商的遊戲開發徹底改變 Roupheaval是一家遊戲開發工作室,由暴風雪和黑曜石等行業巨頭的退伍軍人組成,有望用其創新的AI驅動的Platfor革新遊戲創作

Uber的Robotaxi策略:自動駕駛汽車的騎車生態系統 在最近的Curbivore會議上,Uber的Richard Willder推出了他們成為Robotaxi提供商的乘車平台的策略。 利用他們在

事實證明,視頻遊戲是最先進的AI研究的寶貴測試理由,尤其是在自主代理商和現實世界機器人的開發中,甚至有可能促進人工通用情報(AGI)的追求。 一個

不斷發展的風險投資格局的影響在媒體,財務報告和日常對話中顯而易見。 但是,對投資者,初創企業和資金的具體後果經常被忽略。 風險資本3.0:範式

Adobe Max London 2025對Creative Cloud和Firefly進行了重大更新,反映了向可訪問性和生成AI的戰略轉變。 該分析結合了事件前簡報中的見解,並融合了Adobe Leadership。 (注意:Adob

Meta的Llamacon公告展示了一項綜合的AI策略,旨在直接與OpenAI等封閉的AI系統競爭,同時為其開源模型創建了新的收入流。 這個多方面的方法目標bo

人工智能領域對這一論斷存在嚴重分歧。一些人堅稱,是時候揭露“皇帝的新衣”了,而另一些人則強烈反對人工智能僅僅是普通技術的觀點。 讓我們來探討一下。 對這一創新性人工智能突破的分析,是我持續撰寫的福布斯專欄文章的一部分,該專欄涵蓋人工智能領域的最新進展,包括識別和解釋各種有影響力的人工智能複雜性(請點擊此處查看鏈接)。 人工智能作為普通技術 首先,需要一些基本知識來為這場重要的討論奠定基礎。 目前有大量的研究致力於進一步發展人工智能。總目標是實現人工通用智能(AGI)甚至可能實現人工超級智能(AS

公司AI模型的有效性現在是一個關鍵的性能指標。自AI BOOM以來,從編寫生日邀請到編寫軟件代碼的所有事物都將生成AI使用。 這導致了語言mod的擴散


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

SecLists
SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。

Atom編輯器mac版下載
最受歡迎的的開源編輯器

EditPlus 中文破解版
體積小,語法高亮,不支援程式碼提示功能

PhpStorm Mac 版本
最新(2018.2.1 )專業的PHP整合開發工具

DVWA
Damn Vulnerable Web App (DVWA) 是一個PHP/MySQL的Web應用程序,非常容易受到攻擊。它的主要目標是成為安全專業人員在合法環境中測試自己的技能和工具的輔助工具,幫助Web開發人員更好地理解保護網路應用程式的過程,並幫助教師/學生在課堂環境中教授/學習Web應用程式安全性。 DVWA的目標是透過簡單直接的介面練習一些最常見的Web漏洞,難度各不相同。請注意,該軟體中