>기술 주변기기 >일체 포함 >DALL-E 3에는 이제 편집 도구가 통합되어 있지만 작업이 필요합니다.

DALL-E 3에는 이제 편집 도구가 통합되어 있지만 작업이 필요합니다.

PHPz
PHPz원래의
2024-07-12 14:10:52704검색

DALL-E 3 창작물을 즉시 편집하고 싶었지만 변경하는 방법을 몰랐나요?

OpenAI는 귀하의 의견을 듣고 ChatGPT의 DALL-E 3에 인라인 편집 도구를 추가하여 앱을 종료하지 않고도 창작물을 수정할 수 있습니다.

유일한 문제는 OpenAI가 광고하는 것을 수행하지 않는다는 점과 원하는 편집 내용을 얻을 수 있는지 여부에 대해 엇갈리는 문제입니다. 하지만 여전히 이는 DALL-E 3 편집의 시작이며 이것이 작동하는 방식입니다.

DALL-E 3의 편집 도구는 무엇인가요?

오랜 시간이 지났지만 OpenAI는 마침내 ChatGPT Plus의 DALL-E 3에 편집 기능을 추가했습니다. 그 전에는 DALL-E 3 생성물을 편집하려고 시도할 수 있지만 일반적으로 항상 완전히 새로운 이미지가 생성됩니다. 편집된 이미지를 생성하는 데 사용된 프롬프트가 첫 번째 프롬프트와 매우 유사하더라도 생성 AI의 특성으로 인해 출력이 크게 다를 수 있습니다.

DALL-E 3의 통합 편집 도구는 이제 새로운 메시지를 생성하지 않고도 동일한 이미지 내의 문제를 해결하는 것을 목표로 합니다. 이미지에서 조정하려는 영역을 강조 표시하고 DALL-E에 특정 변경(예: "이 기능 제거" 또는 "이 기능 추가")을 수행하도록 요청하면 작동됩니다.

DALL-E 3 Now Has Integrated Editing Tools, But They Need Work

그런데 엇갈리는 가방이네요.

OpenAI의 공식 블로그 예는 DALL-E가 우키요에 스타일의 고양이 이미지에 벚꽃을 추가하는 모습을 보여주며 완벽하게 작동합니다. 내 경험에 따르면 DALL-E의 편집 도구는 기존 이미지에 이러한 상세한 이미지를 추가하는 데 어려움을 겪고 있으며 대부분 이러한 성격의 요청을 처리할 수 없습니다.

편집 도구가 작동하지 않는다는 말은 아닙니다. 아래에 자세히 설명된 대로 기능을 완전히 제거하고 약간의 변경을 가할 수 있지만 이는 모두 작은 규모입니다.

DALL-E 3 편집 도구 사용 방법

DALL-E 3 편집 도구의 기능을 보여주는 가장 좋은 방법은 몇 가지 적절한 예를 사용하는 것입니다.

제거 및 지우기

DALL-E 3의 편집 도구는 일부 작은 기능을 지울 수 있지만 확실히 어려움을 겪습니다. 다음 이미지에서는 DALL-E에 "'AI Accelerated'라고 적힌 빛나고 투명한 사각형 칩을 들고 있는 로봇 손. 배경은 진한 파란색으로 미래 지향적이고 첨단 기술적인 분위기를 연출합니다."를 만들어 달라고 요청했습니다.

텍스트 작성은 생성 AI의 특정 문제이기 때문에 텍스트가 잘못되었다는 사실이 놀랍지는 않습니다. 그래서 DALL-E에게 철자 오류를 제거해달라고 요청했습니다. 첫 번째 시도에서는 "이 단어를 제거해 주세요"라는 메시지와 함께 실패했지만 두 번째 시도에서는 "이미지에서 이 단어를 제거해 주세요."라는 메시지와 함께 성공했습니다. 따라서 성공합니다. 하지만 결과를 얻으려면 다른 프롬프트를 시도해야 할 수도 있습니다. 그런 다음 AI 문자를 사각형 중앙으로 이동하도록 요청했는데, 어떤 이유로 PC가 충돌했음에도 불구하고 잘 작동했습니다.

다음으로 저는 DALL-E에게 정적인 모습을 보여주는 텔레비전 이미지를 편집하는 데 도움을 달라고 요청했습니다. DALL-E는 고유한 이미지를 생성하는 데 적합하지만 일부 세부 정보가 잘못되거나 뒤틀린 텍스트를 전달합니다. 이 경우 TV 화면의 정보 표시줄에 횡설수설하는 AI 텍스트가 표시되므로 이를 제거하고 싶었습니다. DALL-E의 첫 번째 시도에서는 정보 표시줄이 있던 자리에 그림자가 남았지만 두 번째와 세 번째 시도에서는 훨씬 깔끔해졌습니다. 완벽하지는 않지만 이미지를 사용하는 용도로는 충분합니다.

추가 및 변경

DALL-E 3는 이미지에 약간의 변경을 가할 수 있지만 다시 말씀드리지만 이는 요청하는 규모에 따라 다릅니다. 작은 추가 및 변경은 가능하지만 대부분의 경우 DALL-E의 편집 도구는 요청한 내용을 처리하지 못합니다.

DALL-E에게 "인간의 눈을 클로즈업한 2:1 4k 이미지를 상세하게 생성"해 달라고 요청하여 다음과 같은 이미지를 얻었습니다.

DALL-E 3 Now Has Integrated Editing Tools, But They Need Work

조금 이상하더라도 꽤 괜찮습니다(속눈썹 반사?!). 하지만 아이리스 색상을 청록색으로 바꾸고 싶었기 때문에 다음과 같은 이미지가 탄생했습니다.

DALL-E 3 Now Has Integrated Editing Tools, But They Need Work

색상은 약간 흐릿하지만 변함이 없으며 일부 기능이 약간 뒤틀려 있습니다.

다음으로 저는 DALLE에게 "예티를 배경으로 호랑이 옷을 입고 슬로프를 스키를 타고 내려가는 사람의 4k 2:1 클레이메이션 스타일 이미지를 만들어 달라"고 요청했습니다.

DALL-E 3 Now Has Integrated Editing Tools, But They Need Work

역시 원본 이미지가 좋고 선명하고 생동감 넘치는 색상이 프롬프트와 잘 어울립니다. 하지만 저는 설인을 다른 종류의 무서운 동물로 바꾸고 싶었습니다.

DALL-E 3 Now Has Integrated Editing Tools, But They Need Work

설인을 다른 동물로 바꾸는 대신 완전히 사라졌습니다. 대신 원본 이미지로 돌아가서 또 다른 설인을 추가하도록 요청했는데 실패했습니다. 이미지에 나무를 더 추가하라는 요청을 받았을 때도 마찬가지로 실패했습니다.

텍스트 추가

여기서는 다룰 내용이 많지 않습니다. 말했듯이 생성 AI는 일반적으로 텍스트 처리에 어려움을 겪으며 이미지에 텍스트를 추가하는 것은 훨씬 더 어렵습니다. 나는 DALL-E에게 영국 해변의 엽서를 만들도록 요청했고 그 결과 그 장면을 멋지게 포착했습니다. 그런 다음 이미지에 "Sunny Beach"라는 단어를 추가하고 싶었지만 처리할 수 없었습니다. 즉, DALL-E가 수행해야 할 작업을 상기시키는 약 6~7번의 앞뒤 프롬프트가 나올 때까지 필요한 텍스트가 포함된 완전히 새로운 이미지를 생성했습니다. 그리고 정확한 텍스트도 마찬가지입니다. 햇빛 속의 아기 얼굴이 어떨지 잘 모르겠어요.

다음으로는 생일카드를 받으러 갔습니다. 이번에는 DALL-E가 메시지 없이 "생일 축하합니다"를 추가했는데, 테마를 고려하면 괜찮습니다. 그래서 카드에 생일 날짜를 넣어달라고 했어요. 이번에도 카드에 날짜를 추가하는 데 실패했지만 몇 차례 메시지를 보낸 후 요청한 날짜가 포함된 새 이미지를 생성했습니다. 이 경우 특히 원본 이미지를 유지하려는 경우 날짜를 직접 추가하는 것이 더 쉬웠을 것입니다.

DALL-E의 편집 도구는 유용하지만 작업이 필요합니다(그리고 약간의 지속성)

DALL-E의 편집 도구는 특정 작업에 유용하지만 편집을 제대로 하려면 시간이 좀 걸립니다. 때로는 작동하지 않을 수도 있으므로 원래 프롬프트를 사용하고 이를 조정하여 새 이미지를 만드는 것이 더 나을 것입니다.

DALL-E의 편집 도구는 시간이 지남에 따라 개선될 가능성이 높지만 그때까지는 DALL-E와 여러 차례 시간이 소요되는 대화를 진행하는 것보다 이미지 편집 도구로 이미지를 편집하는 것이 더 나을 수도 있습니다. 작동하면 좋습니다. 이해하지 못하거나 전혀 편집하지 않으면 답답합니다.

위 내용은 DALL-E 3에는 이제 편집 도구가 통합되어 있지만 작업이 필요합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.