>기술 주변기기 >일체 포함 >인공지능도 인간처럼 창의성을 발휘할 수 있을까?

인공지능도 인간처럼 창의성을 발휘할 수 있을까?

王林
王林앞으로
2024-01-08 13:33:57507검색

창의성은 예술, 문학, 과학, 기술 등 새롭고 가치 있고 의미 있는 작품을 창조할 수 있게 해주는 인간의 독특한 능력입니다. 창의성은 또한 인간 사회의 중요한 원동력이며 문화, 경제, 교육 및 기타 분야의 발전과 진보를 촉진합니다. 창의성이란 정확히 무엇입니까? 어떻게 생겼습니까? 어떻게 평가되고 개선되나요? 이러한 질문은 심리학자, 인지과학자, 철학자와 같은 다양한 분야의 연구자들을 당혹스럽게 만들어 왔습니다. 인공지능(AI) 기술이 급속도로 발전하면서 이러한 이슈는 AI 분야에서도 주목을 받고 있다. AI도 인간만큼 창의적일 수 있을까? 그렇다면 AI 창의성을 어떻게 정의, 측정, 육성할 수 있을까요? 이러한 이슈는 이론적인 의미뿐만 아니라 실질적인 가치도 지닌다. AI의 창의성이 AI의 다양한 분야 적용과 발전에 영향을 미칠 것이기 때문이다.

과학기술학술포럼 arxiv.org는 1월 3일 "AI가 인간만큼 창의적일 수 있는가?"라는 최신 논문을 발표했습니다. 이 논문은 미국, 영국, 싱가포르의 많은 유명 AI 연구자들이 집필했습니다. 및 다른 국가에서 공동 집필한 이 논문은 AI 창의성에 대한 심층적인 탐구로서, 상대적 창의성(Relative Creativity)이라는 새로운 창의성 평가 패러다임을 제안하고, 통계적 창의성 프레임워크를 구축합니다. 창의성. 이 논문은 이론적 논의를 발전시킬 뿐만 아니라 AI의 창의적 잠재력을 평가하고 개선하기 위한 실용적인 도구와 방법을 제공합니다. 본 논문의 주요 공헌과 혁신은 다음과 같습니다.

상대적 창의성 개념을 제안하여 AI 시스템의 창의성 평가를 절대적인 기준에서 특정 인간 창작자와의 비교로 전환함으로써 창작 과정에서 이를 인식합니다. 고유한 주관성을 가지며 Turing Test의 지능을 평가하는 비교 방법을 활용합니다. 이 혁신적인 접근 방식은 AI 창의성을 인간의 창의성과 비교하여 창의적인 프로세스에서 AI 시스템의 성능과 기능을 더 잘 이해할 수 있도록 해줍니다. 평가 시스템에 주관성을 접목함으로써 AI 시스템의 창의성을 보다 완전하게 평가하고 이를 인간 창작자와 비교할 수 있어 더욱

AI의 창의성을 평가하기 위해 통계적 창의성이라는 개념이 도입됩니다. 이론 구축과 경험적 평가를 결합한 방법입니다. 이 방법은 AI가 특정 집단의 창의적 결과물을 모방할 수 있는지 여부에 초점을 맞춰 AI의 창의성을 정량적으로 평가하고 이론적 프레임워크의 실제 적용 가능성을 향상시킵니다.

자기회귀 모델에 통계적 창의성을 적용하는 것은 널리 사용되는 언어 모델링 기술입니다. 이 기술은 다소 창의적인 것으로 간주되며 모델의 통계적 창의성을 평가하기 위한 실용적인 척도를 가지고 있습니다. 특히 다음 마크 예측과 관련하여 이 측정항목은 최신 AI 모델의 요구 사항에 적응할 수 있으며 기술 발전에 보조를 맞출 수 있는 잠재력을 보여줍니다.

이 연구에서는 창의적인 AI 모델을 훈련하기 위해 통계적 창의성 손실이라는 목적 함수를 도입했습니다. 또한 본 연구에서는 통계적 창의성 손실의 상한과 Rademacher 복잡성, 상호 정보, ε-커버리지 수 등 딥러닝의 일반화와 관련된 개념을 분석합니다. 이러한 이론적 지침과 실제적 조치는 AI 모델의 창의적 능력을 배양하는 데 중요한 도움을 제공합니다.

01 상대적 창의성의 개념과 정의

창의성은 주관적, 상황적, 다차원적, 역동적인 요소를 포함하기 때문에 정의하고 측정하기 어려운 능력입니다. 창의성이 무엇인지, 창의적 작업이 무엇인지에 대한 관점과 기준은 다를 수 있습니다. 따라서 창의성에 대한 절대적인 정의를 내리거나 AI 시스템에 절대적인 창의성 평가를 내리는 것은 비현실적이고 불공평합니다. 저자는 창의성에 대한 평가는 절대적이 아닌 상대적이어야 한다고 믿는다. 즉, AI 시스템의 창의성은 다양한 인간 창작자의 수준과 특성을 바탕으로 비교되어야 한다고 믿는다. 이처럼 창의성에 대한 평가는 더 이상 정적이고 고정된 단일 기준이 아니라 창의성의 본질과 다양성을 더 잘 반영할 수 있는 역동적이고 유연하며 다양한 과정이 되었습니다.

저자는 상대적 창의성(Relative Creativity) 개념을 제안하며, 이를 다음과 같이 정의했습니다. AI 시스템은 창작자의 전기적 정보를 기반으로 특정 인간 창작자의 정보와 유사한 정보를 생성할 수 있다면 상대적으로 창의적이라고 간주됩니다. 저작물을 구별할 수 없다면 AI 시스템도 그 창작자만큼 창의적이라고 볼 수 있다. 상대적 창의성의 "상대성"은 비교되는 개인 간의 차이에 따라 달라진다는 사실에 반영됩니다. 예를 들어, AI 시스템은 비전문 인간 창작자와 비교할 때 매우 창의적으로 보일 수 있지만 전문 디자이너나 예술가와 비교할 때 덜 창의적일 수 있습니다. 상대적 창의성은 또한 독창성, 확산적 사고, 문제 해결 능력과 같은 창의성의 주관성을 인정하며, 이는 인간 창작자의 기반이 되는 선택 과정에 통합됩니다. 창의성의 평가는 인간의 관점을 기반으로 하기 때문에, 상대적 창의성의 개념도 AI 시스템이 인간과 경쟁할 수 있는지 여부를 판단하는 비교 방법인 튜링 테스트(Turing Test)에서 영감을 받았습니다.

인공지능도 인간처럼 창의성을 발휘할 수 있을까?Pictures

그림 1: 상대적 창의성과 통계적 창의성의 그림. 그림 1에서는 상대적 창의성(a)과 통계적 창의성(b)을 설명합니다. 상대적 창의성은 동일한 전기적 영향을 고려하여 가상의 인간 창작자와 사실상 구별할 수 없는 예술 작품을 창작하는 AI의 능력을 평가하는 것을 의미합니다. 반면, 통계적 창의성은 AI가 생성한 창작물이 기존 인간 창작자와 구별되지 않는 능력을 분포 거리 측정 기준에 따라 측정하여 평가됩니다.

상대 창의성은 튜링 테스트와 일부 유사점이 있지만 차이점도 있습니다. 공통점은 모두 인간의 관점을 바탕으로 AI 시스템의 성능을 인간과 비교하여 AI 시스템의 성능을 평가한다는 점이다. 차이점은 튜링 테스트의 목표는 AI 시스템의 지능을 평가하는 것이고, 상대적 창의성의 목표는 AI 시스템의 창의성을 평가하는 것입니다. 지능과 창의성은 서로 겹치는 부분도 있지만 차이점도 있는 서로 다른 차원입니다. 예를 들어, AI 시스템은 똑똑하지만 반드시 창의적이지는 않을 수 있으며, 그 반대의 경우도 마찬가지입니다. 또 다른 차이점은 튜링 테스트의 평가는 대화 기반인 반면, 상대적 창의성 평가는 작업 기반이라는 것입니다. 대화는 상호작용적이고 역동적인 실시간 프로세스인 반면, 작업은 정적이고 고정되어 있으며 지연된 결과입니다. 따라서 상대적 창의성에 대한 평가는 작품의 스타일, 내용, 품질, 독창성 등과 같은 더 많은 요소를 고려해야 하기 때문에 더 어려울 수 있습니다. 저자는 상대적 창의성이 AI 시스템의 성능뿐만 아니라 인간 창작자의 배경과 특성까지 고려하는 보다 포괄적이고 심층적인 창의성 평가 방법이라고 믿는다.

02 통계적 창의성의 개념과 정의

상대적 창의성이라는 개념이 계몽적이긴 하지만, 아직 운영적 평가 방법이 부족합니다. 이러한 단점을 보완하기 위해 저자는 통계적 창의성(Statistical Creativity)이라는 개념을 도입하는데, 이는 AI 시스템이 인간 창작자 그룹을 고려할 때 다음과 같은 결과를 생성할 수 있으면 통계적으로 창의적이라고 간주됩니다. 그룹의 창의적 결과물과 구별할 수 없다면 AI 시스템도 그룹만큼 창의적인 것으로 간주될 수 있습니다. 통계적 창의성의 '통계적' 성격은 추상적인 기준이 아닌 관찰 가능한 데이터를 기반으로 AI 시스템의 창의성을 평가한다는 사실에 반영됩니다.

인공지능도 인간처럼 창의성을 발휘할 수 있을까?Pictures

저자는 통계적 창의성의 척도인 E0(q)를 제안했습니다. 이는 AI 모델의 창의적 능력과 인간 창작자 그룹의 구별 불가능성을 추정하는 데 사용되는 실증적 척도입니다. . E0(q)의 값이 낮을수록 AI 모델이 그룹의 창의적 능력을 더 잘 모방할 수 있다는 것을 의미합니다. 저자는 또한 AI 모델이 δ-창의성을 갖는 것으로 분류될 수 있는 조건, 즉 E0(q)

03 자기회귀 모델의 통계적 창의성 측정 및 적용

자기회귀 모델은 이전 확률 분포 텍스트 시퀀스를 기반으로 다음 토큰을 예측하여 일관된 텍스트를 생성하는 일반적인 LLM(대형 언어 모델) 기술입니다. 자기회귀 모델은 시, 이야기, 코드 등과 같은 새로운 텍스트를 생성하는 능력으로 인해 어느 정도 창의성을 가지고 있다고 간주됩니다. 그러나 자기회귀 모델의 창의성을 어떻게 평가하고 향상시킬지는 여전히 미해결 문제입니다. 저자는 통계적 창의성 개념을 자기회귀 모델에 적용하고 다음 토큰 예측을 위한 통계적 창의성 척도인 E1(q)를 제안합니다. 인간 창조자. E1(q)의 값이 낮을수록 자기회귀 모델은 그룹의 창의적 능력을 더 잘 모방할 수 있습니다.

인공지능도 인간처럼 창의성을 발휘할 수 있을까?Pictures

저자는 또한 자기회귀 모델의 통계적 창의성에 대한 정리를 제공하여 자기회귀 모델이 델타 창의성을 갖는 것으로 분류될 수 있는 조건, 즉 E1(q) <를 명확히 했습니다. δ, 그리고 평가를 위해 충분히 큰 샘플 세트가 있습니다. 이 정리는 창의성의 분류 방법을 제공할 뿐만 아니라 자기회귀 모델과 인간 창작자 그룹의 창의적 능력 간의 차이를 나타내는 창의성의 정도, 즉 δ도 제공합니다. 저자의 주장은 간단합니다. 자동 회귀 모델이 인간 예술가 그룹의 작업과 유사한 시퀀스(예: 시 또는 이야기)를 생성할 수 있다면 해당 모델은 해당 그룹과 비교할 수 있는 창의성 수준을 나타냅니다. 이 평가를 정량화하기 위해 저자는 측정항목 E1(q)을 도입합니다.

Next 토큰 예측은 자동회귀 모델의 핵심 기술로, 모델에서 생성된 텍스트 시퀀스의 품질과 다양성을 결정합니다. 다음 토큰 예측의 난이도는 주어진 상황과 대상 토큰의 가능성에 따라 달라집니다. 컨텍스트가 명확하고 구체적이면 일부 토큰이 더 합리적이고 일반적이기 때문에 다음 토큰을 예측하는 것이 더 쉽습니다. 예를 들어, 컨텍스트가 "나는 먹는 것을 좋아합니다"라면 다음 태그는 "사과", "빵", "만두" 등이 될 수 있습니다. 그러나 맥락이 모호하고 추상적이라면 뚜렷한 이점 없이 많은 토큰이 가능하기 때문에 다음 토큰에 대한 예측이 더욱 어렵습니다. 예를 들어 컨텍스트가 "I want"인 경우 다음 태그는 "travel", "study", "sleep" 등이 될 수 있습니다. 이 경우 자동회귀 모델은 의미 있고 흥미로운 텍스트 시퀀스를 생성하기 위해 더 큰 창의성을 요구합니다.

다음 태그 예측의 중요성은 자기회귀 모델의 창의성 수준과 인간 창작자의 창의성과의 유사성을 반영한다는 것입니다. 자기회귀 모델은 다른 맥락에서 인간 창조자의 작업과 구별할 수 없는 다음 토큰을 생성할 수 있다면 인간 창조자와 동일한 창의성을 나타냅니다. 이러한 창의성 평가는 E1(q)와 같은 통계적 창의성 측정을 통해 수행될 수 있습니다. 저자는 이 평가 방법이 인간의 주관적 판단에 의존하지 않고 데이터와 확률의 계산에 기초한 보다 객관적이고 과학적인 방법이라고 믿는다. 저자의 연구는 자기회귀 모델의 창의성에 대한 새로운 관점과 방법을 제공하여 모델의 생성 능력과 품질을 향상시키는 데 도움을 줍니다.

04 프롬프트 기반 대형 언어 모델의 통계적 창의성 측정 및 적용

프롬프트 조건형 대형 언어 모델(LLM)은 프롬프트(Prompts)를 활용하여 잠재력을 발휘할 수 있는 최첨단 모델 패러다임입니다. 모델의 능력. 힌트는 모델에 입력 및 출력 형식을 제공하는 방법으로, 모델이 텍스트 분류, 텍스트 생성, 텍스트 요약 등과 같은 다양한 작업을 완료하도록 안내하는 데 사용할 수 있습니다. 프롬프트는 인간의 경험적 방법과 유사하게 작동하여 모델의 창의성과 유연성을 자극합니다. 그러나 프롬프트 기반 LLM의 창의성을 어떻게 평가하고 향상시킬지는 여전히 미해결 문제로 남아 있습니다. 저자는 큐 기반 LLM에 통계적 창의성 개념을 적용하고 다양한 상황별 큐, 즉 E2(q)에 대한 통계적 창의성 척도를 제안합니다. 이는 큐 기반 LLM과 크리에이티브의 구별 불가능성을 추정하기 위한 실증적 척도입니다. 인간 창조자 공동체의 능력. E2(q)의 값이 낮을수록 프롬프트 기반 LLM이 그룹의 창의적 능력을 더 잘 모방할 수 있다는 것을 의미합니다. 저자는 또한 프롬프트 기반 LLM이 δ-창의성, 즉 E2(q)

05 통계적 창의성 손실의 정의 및 최적화 방법

Statistical Creativity Loss(통계적 창의성 손실)은 창의적인 AI 모델을 훈련하는 데 사용되는 최적화 가능한 목적 함수입니다. 이는 E0(q), E1(q) 또는 E2(q)와 같은 통계적 창의성 척도를 기반으로 정의됩니다. 통계적 창의성 손실 값이 낮을수록 AI 모델은 인간 창작자 그룹의 창의적 능력을 더 잘 모방할 수 있습니다. 저자는 통계적 창의성 손실의 상한선인 공식 (2)와 Rademacher 복잡도, 상호 정보, ε-커버링 수(ε-covering number) 등 딥러닝의 일반화와 관련된 개념을 제안합니다. 저자는 다음 토큰 예측의 로그 가능성과 통계적 창의성을 달성하는 데 필요한 창작자 생산 데이터의 양에 따라 통계적 창의성 손실의 상한을 분석합니다. 저자의 연구 결과는 단순히 많은 양의 창작 데이터를 보유하는 것보다 창작자와 작품 쌍의 다양성이 중요하다는 점을 강조합니다. 이러한 통찰력은 특히 다음 마크 예측을 기반으로 하는 현재 AI 프레임워크에 통계적 창의성의 개념을 적용할 수 있게 해줍니다. 저자의 연구는 이론적 관점을 제공할 뿐만 아니라 AI 창의성에 대한 논의를 안내하고, 실증적 연구를 촉진하기 위해 상대 평가의 사용을 옹호하며, AI 모델의 창의적 능력을 평가하고 향상하기 위한 프레임워크를 구축합니다.

06 관련 연구

저자는 주로 시각과 언어라는 두 분야를 중심으로 창의성의 정의와 응용에 관한 이전의 관련 연구를 마지막으로 검토합니다. 저자는 생성 모델에 창의성 요소를 적용하려는 많은 연구가 있지만 창의성을 직접적으로 정의하거나 직접 최적화하는 연구는 없다고 지적합니다. 오히려 저자의 연구는 창의성을 위한 이론적 기반, 즉 세대의 다양성과 질에 대한 이전의 통찰력을 자연스럽게 통합하는 프레임워크를 구축하는 것을 목표로 합니다. 저자는 그들의 기여가 향후 연구의 기반을 마련하고 모델 창의성 향상을 이끌기를 기대합니다.

비전 분야에서는 창의적인 이미지 생성 모델이 상당한 진전을 이루면서 기계가 창의적인 예술을 생산할 수 있는지에 대한 의문이 제기됩니다. Hertzmann(2018)은 이 문제를 심층적으로 탐구하여 컴퓨터 그래픽과 예술적 혁신의 교차점을 강조합니다. Xu et al.(2012a)은 사용자 선호도에 따라 다양한 모델을 생성할 수 있는 창의적인 3차원 모델링 방법을 제안했습니다. Elgammal et al.(2017)은 생성적 적대 네트워크(GAN)(Goodfellow et al., 2014)를 사용하여 알려진 스타일과의 편차를 최대화하여 독특한 예술적 스타일을 창출했습니다. Sbai et al.(2018)은 이러한 편향을 더욱 증가시켜 모델이 훈련 세트와 다른 스타일이 되도록 장려합니다. Ge et al.(2021)과 Ranaweera(2016)는 세부 요소 통합의 중요성을 강조하면서 창의적 생성을 조합 과정으로 볼 수도 있습니다. 이를 기반으로 Vinker et al.(2023)은 혁신적인 재구성을 위해 개인화 개념을 시각적 요소로 분해하여 창의적 결과물을 풍부하게 했습니다.

언어 분야에서 언어 모델의 개발로 인해 연구자들은 다양한 분야, 작업 및 언어에서 모델의 적응성을 향상시키기 위해 데이터 사용을 최적화하는 방법을 탐구하게 되었습니다(Gururangan et al., 2020; Devlin 등, 2019; Conneau 등, 2020). 연구자들은 또한 인간 의사소통의 뉘앙스를 해석하기 위해 언어 모델을 사용하는 경향을 보여주었습니다(Schwartz et al., 2013; Wu et al., 2022). 이 통찰력은 분류 모델을 개선하는 데에도 사용되었습니다(Hovy, 2015; Flek, 2020). 생성 모델의 인기가 높아짐에 따라 사람들은 제어 가능한 텍스트 생성에도 관심이 있습니다. 즉, 모델의 출력은 공손함(Saha et al., 2022; Sennrich et al., 2016), 감정과 같은 일부 제약 조건을 충족해야 합니다. (Liu et al., 2016) al., 2021; Dathathri et al., 2019; He et al., 2020) 또는 기타 스타일 제약. 마지막으로, 입력된 텍스트의 스타일을 설정된 대상 스타일로 변환하는 텍스트 스타일 전송(TST)도 인기 있는 작업이 되었습니다. 스타일은 공손함(Madaan et al., 2020), 형식성(Rao and Tetreault, 2018; Briakou et al., 2021), 단순성(Zhu et al. , 2021) 2010; van den Bercken et al., 2019; Cao et al., 2020), 저자(Xu et al., 2012b; Carlson et al., 2018), 저자 성별(Prabhumoye) et al., 2018) 등(Jin et al., 2022). 이러한 모든 응용 프로그램은 생성 모델에 창의성 요소를 적용하려고 시도하지만 창의성을 직접 정의하거나 직접 최적화하는 것은 없습니다. 대신 창의성의 대용으로 사전 정의된 작업에 대한 모델 성능을 향상시키는 데 중점을 둡니다. 이에 반해 저자들의 연구는 창의성에 대한 이론적 기초를 확립하는 것을 목표로 한다. 이 프레임워크는 세대의 다양성과 품질에 대한 이전의 통찰력을 자연스럽게 통합합니다. 저자는 그들의 기여가 향후 연구의 기반을 마련하고 모델 창의성 향상을 이끌기를 기대합니다.

참고자료: https://arxiv.org/abs/2401.01623

위 내용은 인공지능도 인간처럼 창의성을 발휘할 수 있을까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 51cto.com에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제