단 한 문장만으로 사진을 움직일 수 있습니다. Apple은 대형 모델 애니메이션을 사용하여 생성하고 결과를 직접 편집할 수 있습니다.
현재 대형 모델의 놀라운 혁신 기능은 창작 분야, 특히 Sora와 같은 비디오 생성 기술의 대표자들에게 계속 영향을 미치고 있습니다. 비록 소라가 새로운 세대의 트렌드를 선도하고 있지만 지금은 애플의 최신 연구 결과에 주목할 필요가 있을지도 모른다.
Apple 연구원들은 최근 대규모 언어 모델을 사용하여 애니메이션을 생성할 수 있는 "Keyframer"라는 프레임워크를 출시했습니다. 이 프레임워크를 사용하면 사용자는 자연어 프롬프트를 통해 정적 2D 이미지용 애니메이션을 쉽게 만들 수 있습니다. 이 연구는 애니메이션 디자인에서 언어 모델의 잠재력을 보여줌으로써 애니메이션 디자이너에게 보다 효율적이고 직관적인 도구를 제공합니다.
논문 주소: https://arxiv.org/pdf/2402.06071.pdf
특히 이 연구는 언어 프롬프트 디자인 아티팩트와 LLM의 코드 생성 기능을 기반으로 하는 새로운 디자인 원칙을 결합하여 구축되었습니다. 새로운 AI 기반 애니메이션 도구인 Keyframer. Keyframer를 사용하면 사용자는 자연어 프롬프트를 통해 정적 2D 이미지에서 애니메이션 일러스트레이션을 만들 수 있습니다. GPT-4를 사용하면 Keyframer는 CSS 애니메이션 코드를 생성하여 입력 SVG(Scalable Vector Graphic)에 애니메이션을 적용할 수 있습니다.
또한 Keyframer는 다양한 편집기 유형을 통해 생성된 애니메이션을 사용자가 직접 편집할 수 있도록 지원합니다.
사용자는 반복되는 프롬프트와 요청을 통해 LLM에서 생성된 디자인 변형을 사용하여 지속적으로 디자인을 개선하고 이를 통해 새로운 디자인 방향을 생각할 수 있습니다. 그러나 Keyframer는 아직 공개되지 않았습니다.
이 연구를 수행하는 이유는 Apple이 애니메이션에 LLM을 적용하는 것이 완전히 탐구되지 않았으며 사용자가 자연어로 동작을 효과적으로 설명하는 방법과 같은 새로운 과제를 안겨준다고 밝혔기 때문입니다. Dall・E 및 Midjourney와 같은 Vincentian 그래픽 도구는 현재 훌륭하지만 애니메이션 디자인에는 타이밍 및 조정과 같은 더 복잡한 고려 사항이 필요하며 이는 단일 프롬프트로 완전히 요약하기 어렵습니다.
사용자는 이미지를 업로드하고 프롬프트 상자에 "별이 반짝반짝하자"와 같은 내용을 입력한 다음 생성을 클릭하면 이 연구의 효과를 확인할 수 있습니다.
사용자는 여러 애니메이션 디자인을 일괄적으로 생성하고 별도의 창에서 색상 코드 및 애니메이션 지속 시간과 같은 속성을 조정할 수 있습니다. Keyframer가 자동으로 이러한 변경 사항을 CSS로 변환하고 코드 자체를 완전히 편집할 수 있으므로 코딩 경험이 필요하지 않습니다. 이 설명 기반 접근 방식은 종종 여러 가지 다른 응용 프로그램과 약간의 코딩 경험이 필요한 다른 형태의 AI 생성 애니메이션보다 훨씬 간단합니다.
Keyframer 소개
Keyframer는 정적 이미지에서 애니메이션을 만들도록 설계된 LLM 기반 애플리케이션입니다. Keyframer는 LLM의 코드 생성 기능과 정적 벡터 그래픽(SVG)의 의미 구조를 활용하여 사용자가 제공한 자연 언어 신호를 기반으로 애니메이션을 생성합니다.
Input: 시스템은 사용자가 애니메이션을 적용하려는 SVG 이미지 코드를 붙여넣을 수 있는 입력 영역을 제공합니다(SVG는 일러스트레이션에 사용되는 표준이자 널리 사용되는 이미지 형식입니다. 확장성과 호환성을 위해 일반적으로 사용됨). 여러 플랫폼에서). Keyframer에서는 사용자가 이미지의 시각적 디자인을 미리 볼 수 있도록 SVG 렌더링이 코드 편집기 옆에 표시됩니다. 그림 2에 표시된 것처럼 토성 그림의 SVG 코드에는 하늘, 고리 등과 같은 식별자가 포함되어 있습니다. .
GPT 팁: 이 시스템을 사용하면 사용자가 자연어 프롬프트를 입력하여 애니메이션을 만들 수 있습니다. 사용자는 단일 디자인(행성이 회전하도록 만들기) 또는 여러 디자인 변형(3개의 반짝이는 별이 있는 디자인 만들기)을 요청한 다음 애니메이션 생성 버튼을 클릭하여 요청을 시작할 수 있습니다. 사용자 요청을 GPT에 전달하기 전에 연구에서는 완전한 원시 SVG XML을 사용하여 프롬프트를 개선하고 LLM 응답 형식을 지정합니다.
GPT 출력: 프롬프트 요청이 시작되면 GPT는 그림 3과 같이 하나 이상의 CSS 조각으로 구성된 응답을 전송합니다.
Rendering: 렌더링 부분에는 (1) 각 애니메이션의 시각적 렌더링과 LLM에서 생성된 1문장 설명, (2) 디자인 수정을 위한 일련의 편집기가 포함됩니다.
코드 편집기는 CodeMirror를 사용하여 구현됩니다. 속성 편집기는 코드 편집을 위한 속성별 UI를 제공합니다(예: 색상 편집). 연구에서는 색상 선택기를 제공합니다. 그림 5는 코드 편집기와 속성 편집기 아이콘을 보여줍니다.
Iteration: 사용자가 애니메이션 제작 프로세스(DG1)를 더 깊이 탐색할 수 있도록 지원하기 위해 이 연구에서는 사용자가 프롬프트를 사용하여 생성된 애니메이션을 반복적으로 구축할 수 있는 기능도 제공합니다. 생성된 각 디자인 아래에 " + 새 프롬프트 추가 " 버튼이 있습니다. 이 버튼을 클릭하면 사용자가 새 프롬프트로 디자인을 확장할 수 있는 새 양식이 페이지 하단에 열립니다.
디자인한 사이드바와 요약을 저장하세요. 그림 6의 오른쪽에 표시된 것처럼 이 시스템을 통해 사용자는 디자인에 별표를 표시하고 사이드바에 추가할 수 있습니다. 또한 시스템에는 모든 텍스트 편집기를 숨기고 애니메이션과 프롬프트를 표시하는 요약 모드가 있어 사용자가 이전 프롬프트와 디자인을 빠르게 다시 방문할 수 있습니다.
실험 중에 Apple 팀은 Keyframer를 사용해 볼 참가자 13명(여성 6명, 남성 7명)을 선정했습니다. 표 1은 참가자와 그들이 습득한 기술에 대한 일부 정보를 제공합니다.
전문 모션 디자이너 "EP13"도 Keyframer의 기능 확장 가능성을 보고 있습니다. "이 도구가 잠재력이 너무 크기 때문에 우리 작업을 대체할 수 있을지 조금 걱정됩니다. 하지만 잘 생각해보면 이번 연구는 우리의 실력을 향상시킬 뿐입니다."
전반적으로 참가자들은 Keyframer 경험에 만족했습니다. 참가자들은 만족(4)에서 중립(3) 사이의 평균 3.9점을 받았습니다. 참가자들은 223개의 디자인을 만들어냈습니다. 평균적으로 각 참가자는 17.2개의 디자인을 생성했습니다. 그림 8은 두 참가자의 최종 애니메이션 예를 보여줍니다.
자세한 기술적인 내용은 원본 문서를 참조하세요.
위 내용은 단 한 문장만으로 사진을 움직일 수 있습니다. Apple은 대형 모델 애니메이션을 사용하여 생성하고 결과를 직접 편집할 수 있습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

Hiddenlayer의 획기적인 연구는 LLMS (Leading Lange Language Models)에서 중요한 취약점을 드러냅니다. 그들의 연구 결과는 "정책 인형극"이라는 보편적 인 바이 패스 기술을 보여줍니다.

환경 책임과 폐기물 감소에 대한 추진은 기본적으로 비즈니스 운영 방식을 바꾸는 것입니다. 이 혁신은 제품 개발, 제조 프로세스, 고객 관계, 파트너 선택 및 새로운 채택에 영향을 미칩니다.

Advanced AI 하드웨어에 대한 최근 제한은 AI 지배에 대한 확대 된 지정 학적 경쟁을 강조하여 중국의 외국 반도체 기술에 대한 의존도를 드러냅니다. 2024 년에 중국은 3,800 억 달러 상당의 반도체를 수입했습니다.

Google의 Chrome의 잠재적 인 강제 매각은 기술 산업 내에서 강력한 논쟁을 불러 일으켰습니다. OpenAi가 65%의 글로벌 시장 점유율을 자랑하는 주요 브라우저를 인수 할 가능성은 TH의 미래에 대한 중요한 의문을 제기합니다.

전반적인 광고 성장을 능가 함에도 불구하고 소매 미디어의 성장은 느려지고 있습니다. 이 성숙 단계는 생태계 조각화, 비용 상승, 측정 문제 및 통합 복잡성을 포함한 과제를 제시합니다. 그러나 인공 지능

깜박 거리는 스크린 모음 속에서 정적으로 오래된 라디오가 딱딱합니다. 이 불안정한 전자 제품 더미, 쉽게 불안정하게, 몰입 형 전시회에서 6 개의 설치 중 하나 인 "The-Waste Land"의 핵심을 형성합니다.

Google Cloud의 다음 2025 : 인프라, 연결 및 AI에 대한 초점 Google Cloud의 다음 2025 회의는 수많은 발전을 선보였으며 여기에서 자세히 설명하기에는 너무 많았습니다. 특정 공지 사항에 대한 심도있는 분석은 My의 기사를 참조하십시오.

이번 주 AI 및 XR : AI 구동 창의성의 물결은 음악 세대에서 영화 제작에 이르기까지 미디어와 엔터테인먼트를 통해 휩쓸고 있습니다. 헤드 라인으로 뛰어 들자. AI 생성 콘텐츠의 영향력 증가 : 기술 컨설턴트 인 Shelly Palme


핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

Video Face Swap
완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

인기 기사

뜨거운 도구

SecList
SecLists는 최고의 보안 테스터의 동반자입니다. 보안 평가 시 자주 사용되는 다양한 유형의 목록을 한 곳에 모아 놓은 것입니다. SecLists는 보안 테스터에게 필요할 수 있는 모든 목록을 편리하게 제공하여 보안 테스트를 더욱 효율적이고 생산적으로 만드는 데 도움이 됩니다. 목록 유형에는 사용자 이름, 비밀번호, URL, 퍼징 페이로드, 민감한 데이터 패턴, 웹 셸 등이 포함됩니다. 테스터는 이 저장소를 새로운 테스트 시스템으로 간단히 가져올 수 있으며 필요한 모든 유형의 목록에 액세스할 수 있습니다.

mPDF
mPDF는 UTF-8로 인코딩된 HTML에서 PDF 파일을 생성할 수 있는 PHP 라이브러리입니다. 원저자인 Ian Back은 자신의 웹 사이트에서 "즉시" PDF 파일을 출력하고 다양한 언어를 처리하기 위해 mPDF를 작성했습니다. HTML2FPDF와 같은 원본 스크립트보다 유니코드 글꼴을 사용할 때 속도가 느리고 더 큰 파일을 생성하지만 CSS 스타일 등을 지원하고 많은 개선 사항이 있습니다. RTL(아랍어, 히브리어), CJK(중국어, 일본어, 한국어)를 포함한 거의 모든 언어를 지원합니다. 중첩된 블록 수준 요소(예: P, DIV)를 지원합니다.

SublimeText3 Linux 새 버전
SublimeText3 Linux 최신 버전

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

DVWA
DVWA(Damn Vulnerable Web App)는 매우 취약한 PHP/MySQL 웹 애플리케이션입니다. 주요 목표는 보안 전문가가 법적 환경에서 자신의 기술과 도구를 테스트하고, 웹 개발자가 웹 응용 프로그램 보안 프로세스를 더 잘 이해할 수 있도록 돕고, 교사/학생이 교실 환경 웹 응용 프로그램에서 가르치고 배울 수 있도록 돕는 것입니다. 보안. DVWA의 목표는 다양한 난이도의 간단하고 간단한 인터페이스를 통해 가장 일반적인 웹 취약점 중 일부를 연습하는 것입니다. 이 소프트웨어는
