人工智慧能夠像人類一樣展現創造力嗎？-人工智慧-PHP中文網

首頁

科技週邊

人工智慧

人工智慧能夠像人類一樣展現創造力嗎？

王林

Jan 08, 2024 pm 01:33 PM

模型

創造力是人類的一種獨特的能力，它使我們能夠創造出新穎、有價值、有意義的作品，如藝術、文學、科學、技術等。創造力也是人類社會的一種重要的驅動力，它促進了文化、經濟、教育等領域的發展和進步。創造力到底是什麼？它是如何產生的？它又如何被評估和提升的？這些問題一直困擾著心理學家、認知科學家、哲學家等多個學科的研究者。隨著人工智慧（AI）技術的快速發展，這些問題也引起了AI領域的關注。 AI是否可以像人類一樣有創造力？如果可以，那麼如何定義、測量和培養AI的創造力？這些問題不僅具有理論的意義，也具有實踐的價值，因為AI的創造力將影響AI在各領域的應用與發展。

科技學術論壇arxiv.org於1月3日發表了最新的論文《Can AI Be as Creative as Humans?》，該論文由來自美國、英國、新加坡等國家的多位知名的AI研究者共同撰寫，該論文是對AI創造力的一次深入的探索，提出了一種新穎的創造力評估的範式，即相對創造力（Relative Creativity），並建立了一個可量化的創造力框架，即統計創造力（Statistical Creativity）。論文不僅推進了理論的討論，而且提供了評估和提升AI創造潛力的實用工具和方法。論文的主要貢獻和創新點如下：

提出了相對創造力的概念，將AI系統的創造力評估從絕對的標準轉變為與特定的人類創造者的比較，從而認識到創造過程中的固有主觀性，並藉鑒了圖靈測試（Turing Test）評估智能的比較方法。這項創新方法將AI的創造力與人類的創造力進行比較，使得我們更能理解AI系統在創作過程中的表現和能力。透過將主觀性納入評估體系，我們能夠更全面地評估AI系統的創造力，並將其與人類創造者進行對比，從而更

為了評估AI的創造力，引入了統計創造力的概念，結合理論建構和實證評估的方法。此方法著重於AI是否可以模仿特定族群的創造性輸出，從而量化評估AI的創造力，並提升了理論架構的實際適用性。

將統計創造力應用於自迴歸模型是一種廣泛使用的語言模型技術。這種技術被認為具有一定的創造能力，並且在評估模型的統計創造力方面有了實用的度量標準。特別是在下一個標記預測方面，這種度量標準能夠適應當代AI模型的需求，並展現出與技術進步保持同步的潛力。

研究引入了一種名為統計創造力損失（Statistical Creativity Loss）的目標函數，用於訓練具有創造力的AI模型。研究也分析了統計創造力損失的上界，以及它與深度學習中的泛化相關的概念，如Rademacher複雜度、互資訊和ε-覆蓋數等。這些理論指導和實際措施為培養AI模型的創造能力提供了重要的幫助。

01 相對創造力的概念和定義

#創造力是一種難以定義和測量的能力，因為它涉及主觀的、情境的、多維度的和動態的因素。對於什麼是創造力，什麼是有創造力的作品，可能有不同的看法和標準。因此要給創造力一個絕對的定義，或是給AI系統一個絕對的創造力評估，是不現實的，也是不公平的。作者認為，創造力的評估應該是相對的，而不是絕對的，即應該根據不同的人類創造者的水平和特點，來比較AI系統的創造力。這樣創造力的評估就不再是一個靜態的、固定的、單一的標準，而是一個動態的、靈活的、多樣化的過程，更能反映創造力的本質和多樣性。

作者提出了相對創造力（Relative Creativity）的概念，將其定義為：一個AI系統被認為具有相對創造力，如果它能夠根據給定的人類創造者的生平信息，生成與該創造者的作品無法區分的作品，那麼AI系統就可以被認為與該創造者一樣有創造力。相對創造力的「相對性」體現在它取決於被比較的個體的差異。例如，一個AI系統可能在與一個非專家的人類創造者比較時顯得非常有創造力，但在與一個專家的設計師或藝術家比較時顯得不那麼有創造力。相對創造力也承認創造力的主觀性，例如原創性、發散性思考和解決問題的技能，這些因素都被融入到錨定人類創造者的選擇過程中。由於創造力的評估是基於人類的視角的，因此相對創造力的概念也受到了圖靈測試（Turing Test）的啟發，這是一種評估AI智能的比較方法，透過判斷AI系統是否能夠與人類進行無法區分的對話。

人工智慧能夠像人類一樣展現創造力嗎？圖片

圖 1: 相對創造力和統計創造力的說明。在圖1中，我們對相對創造力(a)和統計創造力(b)進行了解釋。相對創造力指的是評估人工智慧在創造藝術方面的能力，與假設的人類創作者相比幾乎沒有區別，同時考慮到相同的傳記影響。而統計創造力則是透過衡量人工智慧產生的創作與現有人類創作者無法區分的能力來進行評估，這種衡量是透過分佈距離測量來確定的。

相對創造力與圖靈測驗有一些相似之處，但也有一些差異。相似之處在於，它們都是基於人類的視角，透過比較AI系統和人類的表現，來評估AI系統的能力。差別在於，圖靈測驗的目標是評估AI系統的智能，而相對創造力的目標是評估AI系統的創造力。智能和創造力是兩個不同的維度，它們可能有一些重疊，但也有一些差異。例如，一個AI系統可能很聰明，但不一定很有創造力，反之亦然。另一個差異在於，圖靈測驗的評估是基於對話的，而相對創造力的評估是基於作品的。對話是一種互動的、動態的、即時的過程，而作品是一種靜態的、固定的、延遲的結果。因此，相對創造力的評估可能更加困難，因為它需要考慮更多的因素，如作品的風格、內容、品質、原創性等。作者認為，相對創造力是一種更全面和深入的創造力評估方法，它不僅考慮了AI系統的表現，而且考慮了人類創造者的背景和特徵。

02 統計創造力的概念和定義

#相對創造力的概念雖然具有啟發性，但是它還缺乏一個可操作的評估方法。為了彌補這一缺陷，作者引入了統計創造力（Statistical Creativity）的概念，將其定義為：一個AI系統被認為具有統計創造力，如果它能夠在給定一個人類創造者群體的情況下，生成與該群體的創造性輸出無法區分的輸出，那麼AI系統就可以被認為與該群體一樣有創造力。統計創造力的「統計性」體現在它是基於可觀察的數據，而不是抽象的標準，來評估AI系統的創造力。

人工智慧能夠像人類一樣展現創造力嗎？圖片

作者提出了一個統計創造力的測量，即E0(q)，它是一個經驗的度量，用來估計一個AI模型和一個人類創造者群體的創造能力之間的不可區分性。 E0(q)的值越低，表示AI模型越能夠模仿該群體的創造能力。作者也給出了一個統計創造力的定理，明確了一個AI模型能夠被歸類為具有δ-創造力的條件，即E0(q)

03 自迴歸模型的統計創造力的測量和應用

自迴歸模型是一種常見的大型語言模型（LLMs）技術，它透過基於前文的機率分佈來預測下一個標記，從而產生連貫的文字序列。自回歸模型被認為具有一定程度的創造能力，因為它們能夠產生新穎的文本，如詩歌、故事、代碼等。然而如何評估和提升自迴歸模型的創造力，仍然是一個開放的問題。作者將統計創造力的概念應用於自迴歸模型，提出了一個針對下一個標記預測的統計創造力的測量，即E1(q)，它是一個經驗的度量，用來估計一個自迴歸模型和一個人類創造者群體的創造能力之間的不可區分性。 E1(q)的值越低，表示自迴歸模型越能夠模仿該群體的創造能力。

人工智慧能夠像人類一樣展現創造力嗎？圖片

作者也給了自迴歸模型的統計創造力的定理，明確了一個自迴歸模型能夠被歸類為具有δ-創造力的條件，即E1(q)

下一個標記預測是自迴歸模型的核心技術，它決定了模型產生的文字序列的品質和多樣性。下一個標記預測的難度取決於給定的上下文，以及目標的標記的可能性。如果上下文是清晰和具體的，那麼下一個標記的預測就比較容易，因為有一些標記是比較合理和常見的。例如，如果上下文是“我喜歡吃”，那麼下一個標記可能是“蘋果”、“麵包”、“餃子”等。但是，如果上下文是模糊和抽象的，那麼下一個標記的預測就比較困難，因為有很多標記都是可能的，而且沒有明顯的優勢。例如，如果上下文是“我想要”，那麼下一個標記可能是“旅行”、“學習”、“睡覺”等。在這種情況下，自迴歸模型需要有更強的創造力，才能產生有意義和有趣的文字序列。

下一個標記預測的重要性在於它反映了自回歸模型的創造力的水平，以及它與人類創造者的創造力的相似性。如果一個自回歸模型能夠在不同的脈絡下，產生與人類創造者的作品無法區分的下一個標記，那麼它就表現出了與人類創造者一樣的創造力。這種創造力的評估可以透過統計創造力的測量，如E1(q)，來進行。作者認為，這種評估方法是一種更客觀和科學的方法，它不依賴人類的主觀判斷，而是基於數據和機率的計算。作者的研究為自回歸模型的創造力提供了一個新的觀點和方法，有助於提高模型的生成能力和品質。

04 基於提示的大型語言模型的統計創造力的測量和應用

基於提示的大型語言模型（prompt-conditioned large language models，LLMs）是一種前沿的模型範式，能夠利用提示（prompts）來解鎖模型的潛在能力。提示是一種向模型提供輸入和輸出格式的方法，可以用來指導模型完成不同的任務，如文字分類、文字生成、文字摘要等。提示的作用類似人類的啟發，可以激發模型的創造力和靈活性。然而，如何評估和提升基於提示的LLMs的創造力，仍然是一個開放的問題。作者將統計創造力的概念應用於基於提示的LLMs，提出了一個針對不同的上下文提示的統計創造力的度量，即E2(q)，它是一個經驗的度量，用來估計一個基於提示的LLM和一個人類創造者群體的創造能力之間的不可區分性。 E2(q)的值越低，表示基於提示的LLM越能夠模仿該群體的創造能力。作者也給出了一個基於提示的LLM的統計創造力的推論，明確了一個基於提示的LLM能夠被歸類為具有δ-創造力的條件，即E2(q)

05 統計創造力損失的定義與最佳化方法

統計創造力損失（Statistical Creativity Loss）是可最佳化的目標函數，用於訓練具有創造力的AI模型。它是基於統計創造力的測量，如E0(q)、E1(q)或E2(q)，來定義的。統計創造力損失的數值越低，表示AI模型越能夠模仿人類創造者群體的創造能力。作者提出了一個統計創造力損失的上界，公式（2），以及它與深度學習中的泛化（generalization）相關的概念，如Rademacher複雜度（Rademacher complexity）、互資訊（mutual information）和ε -覆蓋數（ε-covering number）等。作者分析了統計創造力損失的上界與下一個標記預測的對數似然（log-likelihood）的關係，以及達到統計創造力所需的創造者-作品數據的數量。作者的發現強調了創造者-作品對的多樣性的重要性，而不僅僅是擁有大量的創造數據。這項見解使得統計創造力的概念在基於下一個標記預測的當前AI框架中特別適用。作者的研究不僅提供了理論視角，也引導了AI創造力的討論，並倡導使用相對評估來促進實證研究，建立一個評估和提升AI模型創造能力的框架。

06 相關工作

#作者最後回顧了先前關於創造力的定義和應用的相關工作，主要涉及視覺和語言兩個領域。作者指出，雖然有許多研究試圖在生成模型中應用創造力的元素，但沒有直接定義創造力或直接優化它。相反，作者的研究旨在建立一個創造力的理論基礎，這個框架自然地包含了先前關於生成的多樣性和品質的見解。作者期待他們的貢獻能為未來的研究奠定基礎，引導模型創造力的提升。

在視覺領域，創造性的圖像生成模型已經取得了顯著的發展，引發了關於機器能否產生創造性藝術的問題。 Hertzmann (2018) 深入探討了這個問題，強調了電腦圖形學和藝術創新之間的交叉點。 Xu et al. (2012a) 提出了一種創意十足的三維建模方法，能夠根據使用者的偏好產生多樣的模型。生成對抗網絡（GANs）(Goodfellow et al., 2014) 被 Elgammal et al. (2017) 用來驅動創造獨特的藝術風格，透過最大化與已知風格的偏差。 Sbai et al. (2018) 進一步增加了這種偏差，鼓勵模型與訓練集的風格不同。創意的生成也可以被視為一種組合的過程，Ge et al. (2021) 和 Ranaweera (2016) 強調了細部元素的整合的重要性。 Vinker et al. (2023) 在此基礎上，將個人化的概念分解為視覺元素，用於創新的重組，豐富了創造性的輸出。

在語言領域，語言模型的發展也促使研究者探索如何優化資料的使用，以提高模型在不同的領域、任務和語言中的適應性(Gururangan et al., 2020; Devlin et al., 2019; Conneau et al., 2020)。研究者也表現出了利用語言模型來解讀人類溝通中的細微差別的傾向 (Schwartz et al., 2013; Wu et al., 2022)。這種洞察力也被用來改進分類模型 (Hovy, 2015; Flek, 2020)。隨著生成模型的日益普及，人們也對可控制的文本生成感興趣，即模型的輸出必須滿足一些約束，如禮貌(Saha et al., 2022; Sennrich et al., 2016)、情感(Liu et al., 2021; Dathathri et al., 2019; He et al., 2020) 或其他風格約束。最後，文字風格轉換（TST），即將輸入文字的風格轉換為設定的目標風格，也成為了一個熱門的任務。風格可以指一系列不同的文本和作者特定的特徵，如禮貌(Madaan et al., 2020)、正式度(Rao and Tetreault, 2018; Briakou et al., 2021)、簡單度(Zhu et al., 2010; van den Bercken et al., 2019; Weng et al., 2019; Cao et al., 2020)、作者(Xu et al., 2012b; Carlson et al., 2018)、作者性別(Prabhumoye et al. , 2018) 等(Jin et al., 2022)。雖然所有這些應用都試圖在生成模型中應用創造力的元素，但沒有直接定義創造力或直接優化它。相反，它們的重點是提高模型在預先定義的任務上的表現，作為創造力的代理。與之相反，作者的研究以建立創造力的理論基礎為目標。這個框架自然地包含了先前關於生成的多樣性和品質的見解。作者期待他們的貢獻能為未來的研究奠定基礎，引導模型創造力的提升。

參考資料：https://arxiv.org/abs/2401.01623

以上是人工智慧能夠像人類一樣展現創造力嗎？的詳細內容。更多資訊請關注PHP中文網其他相關文章！

陳述

本文轉載於：51CTO.COM。如有侵權，請聯絡admin@php.cn刪除

您必須在無知的面紗後面建立工作場所Apr 29, 2025 am 11:15 AM

在約翰·羅爾斯1971年具有開創性的著作《正義論》中，他提出了一種思想實驗，我們應該將其作為當今人工智能設計和使用決策的核心：無知的面紗。這一理念為理解公平提供了一個簡單的工具，也為領導者如何利用這種理解來公平地設計和實施人工智能提供了一個藍圖。設想一下，您正在為一個新的社會制定規則。但有一個前提：您事先不知道自己在這個社會中將扮演什麼角色。您最終可能富有或貧窮，健康或殘疾，屬於多數派或邊緣少數群體。在這種“無知的面紗”下運作，可以防止規則制定者做出有利於自身的決策。相反，人們會更有動力製定公

決策，決策……實用應用AI的下一步Apr 29, 2025 am 11:14 AM

許多公司專門從事機器人流程自動化（RPA），提供機器人以使重複的任務自動化 - UIPATH，在任何地方自動化，藍色棱鏡等。同時，過程採礦，編排和智能文檔處理專業

AI的未來超越了簡單的單詞預測和對話模擬。 AI代理人正在出現，能夠獨立行動和任務完成。這種轉變已經在諸如Anthropic的Claude之類的工具中很明顯。 AI代理：研究

為什麼同情在AI驅動的未來中比控制者更重要Apr 29, 2025 am 11:12 AM

快速的技術進步需要對工作未來的前瞻性觀點。當AI超越生產力並開始塑造我們的社會結構時，會發生什麼？ Topher McDougal即將出版的書Gaia Wakes：

用於產品分類的AI：機器可以總稅法嗎？Apr 29, 2025 am 11:11 AM

產品分類通常涉及復雜的代碼，例如諸如統一系統（HS）等系統的“ HS 8471.30”，對於國際貿易和國內銷售至關重要。這些代碼確保正確的稅收申請，影響每個INV

數據中心的需求會引發氣候技術反彈嗎？Apr 29, 2025 am 11:10 AM

數據中心能源消耗與氣候科技投資的未來本文探討了人工智能驅動的數據中心能源消耗激增及其對氣候變化的影響，並分析了應對這一挑戰的創新解決方案和政策建議。能源需求的挑戰：大型超大規模數據中心耗電量巨大，堪比數十萬個普通北美家庭的總和，而新興的AI超大規模中心耗電量更是數十倍於此。 2024年前八個月，微軟、Meta、谷歌和亞馬遜在AI數據中心建設和運營方面的投資已達約1250億美元（摩根大通，2024）（表1）。不斷增長的能源需求既是挑戰也是機遇。據Canary Media報導，迫在眉睫的電

AI和好萊塢的下一個黃金時代Apr 29, 2025 am 11:09 AM

生成式AI正在徹底改變影視製作。 Luma的Ray 2模型，以及Runway的Gen-4、OpenAI的Sora、Google的Veo等眾多新模型，正在以前所未有的速度提升生成視頻的質量。這些模型能夠輕鬆製作出複雜的特效和逼真的場景，甚至連短視頻剪輯和具有攝像機感知的運動效果也已實現。雖然這些工具的操控性和一致性仍有待提高，但其進步速度令人驚嘆。生成式視頻正在成為一種獨立的媒介形式。一些模型擅長動畫製作，另一些則擅長真人影像。值得注意的是，Adobe的Firefly和Moonvalley的Ma

Chatgpt是否會慢慢成為AI最大的Yes-Man？Apr 29, 2025 am 11:08 AM

ChatGPT用户体验下降：是模型退化还是用户期望？近期，大量ChatGPT付费用户抱怨其性能下降，引发广泛关注。用户报告称模型响应速度变慢，答案更简短、缺乏帮助，甚至出现更多幻觉。一些用户在社交媒体上表达了不满，指出ChatGPT变得“过于讨好”，倾向于验证用户观点而非提供批判性反馈。这不仅影响用户体验，也给企业客户带来实际损失，例如生产力下降和计算资源浪费。性能下降的证据许多用户报告了ChatGPT性能的显著退化，尤其是在GPT-4（即将于本月底停止服务）等旧版模型中。这

See all articles