곧, 새로운 목적을 위해 안정된 확산이 발견되었습니다 -
로고 디자인에 있어서 가장 중요한 '형태와 의미의 결합'을 명확하게 파악하고 있는 것입니다. Cat이 즉시 고양이 머리를 그리는 것을 봤습니다.
Yoga shop YOGA 문자가 사람의 형태로 변형되었으며 스타일이 완전히 정확합니다.
문자 중 하나만 디자인해도 문제가 없습니다. 예를 들어, Dog의 경우 D를 그리세요. 개가 되어 보세요:
진실하고 간결하며 표현력이 풍부합니다. 그렇지 않나요!
중국어 글꼴의 경우에도 AI는 의미를 매우 잘 이해하고 당사자 A가 전달하고 싶은 로고 이미지를 빠르게 그릴 수 있습니다.
가게를 열어서 사용한다면 왜 지출해야합니까? 로고 디자인에 수십 달러? (doge)
로고를 디자인한 AI는 이전에도 많았지만, 이번에 생성된 효과로 보면 정말 조금 다릅니다.
사실 이 연구 이전에도 이미 AI를 사용하여 로고를 디자인하는 방법을 고려한 많은 연구가 있었습니다.
효과의 관점에서 볼 때 크게 세 가지 범주로 나눌 수 있습니다.
첫 번째는 그림 스타일을 전송하기 위한 모양 제한으로 글꼴을 사용하는 것입니다(그림 AB). 세 번째는 다양한 그림의 모양과 글꼴을 연결하여 컬러 또는 흑백 "이미지 접합" 스타일 로고 디자인을 생성하는 것입니다(그림 CE).
하지만 아래 인간이 디자인한 로고와 비교하면 위 AI 디자인의 효과가 보기 흉하다고 할 수는 없지만 조금 의미가 덜한 것 같습니다.
철저한 검토 끝에 조사 결과, 저자들은 인간이 손으로 디자인한 The LOGO가 "스포트라이트를 받지" 못한다는 사실을 발견했습니다.
인간 디자이너는 사람들이 한눈에 단어를 인식할 수 있도록 원래 글꼴 기능을 유지한 다음 Jazz의 J를 악기로 변경하는 등 몇 가지 혁신을 추가하지만 다른 사람들은 여전히 "JAZZ"를 한 번에 인식할 수 있습니다. 한눈에 "글꼴의 모양.
일반적으로 글꼴의 "맛"을 일부 유지하면서 특정 디자인 감각을 추가하는 것입니다.
예를 들어 Stable Diffusion으로 생성된 "FROG" 디자인입니다. FRO는 여전히 원래 글꼴의 모양이지만 G만 튀어나온 작은 개구리가 됩니다.
Stable Diffusion 2를 사용하는 경우 추가 후반 작업을 위해 가공하면 컬러링 기능을 추가로 구현하여 더욱 생생하게 만들 수 있습니다.
생성된 로고의 스타일도 원본 디자인 글꼴 변경에 따라 변경될 수 있습니다.
예를 들어, 다음은 8가지 글꼴로 생성된 다양한 요가 로고이며 각 스타일이 다릅니다.
반면, 다른 AI 모델은 글꼴을 생성할 때 자체 스타일을 유지하는 것을 선호합니다(수동으로 Dog Head):
그렇다면 이 마법같은 글꼴 디자인 AI는 어떻게 탄생했을까요?
원본 글꼴의 스타일을 어느 정도 유지하고 단어의 특정 글자만 변경하기 위해 저자는 글자 모양을 "미세 조정"하는 방법을 고안했습니다. ——
AI가 베지어 곡선을 사용하여 다양한 글꼴의 글자를 약간 변형하는 방법을 배우게 하는 것입니다.
(PS에서 "펜"을 사용해 본 친구들은 베지어 곡선에 익숙할 것입니다. 이를 사용하여 마우스를 제어하여 마법의 곡선을 그릴 수 있습니다)
디자인된 글자가 요구 사항을 충족할 때까지 글자의 복잡성과 글꼴 스타일에 따라 특정 제어점 수는 반복적으로 변환됩니다. 주황색은 초기 지점이고 파란색은 추가된 후속 제어점입니다.
관리점 수량은 세대효과에 얼마나 영향을 미치나요?
예를 들어, 문자를 생성하기 위해 서로 다른 개수의 제어점을 사용하는 효과입니다. 개수가 너무 작으면 디자인된 이미지 모양이 불명확해지고, 개수가 너무 크면 원래 모양이 쉽게 왜곡됩니다. 글꼴의:
이 핵심을 기반으로 디자인 아이디어를 위해 저자는 Stable Diffusion과 CLIP을 결합하여 전체 글꼴 디자인 AI 모델을 디자인했습니다.
그 중 ACAP(최대한 등각적) 손실 함수는 Delaunay 삼각측량 알고리즘을 기반으로 하며 문자 모양을 더욱 구체화합니다.
예를 들어 변형 전과 후의 PANTS(바지) 형태입니다. 바지의 형태를 유지하면서 ACAP도 글꼴의 효과를 유지하는 것을 볼 수 있습니다.
동시에 in 글꼴 형태를 더욱 보존하기 위해 저자는 조정된 문자가 원래 문자에서 너무 많이 벗어나지 않도록 저역 통과 필터를 사용했습니다. 예를 들어, Bear에서 B의 조정된 형태는 다음과 같습니다.
이 모델 세트를 적용하면 각 문자를 생성하는 속도가 나쁘지 않습니다.
RTX 2080 GPU에서는 단일 문자 로고 디자인을 생성하는 데 약 5분이 소요됩니다.
저자가 프로젝트 홈페이지에 게시한 논문은 익명이지만
그러나 arXiv에는 저자의 이름이 공개되어 있습니다. 그들은 이스라엘 텔아비브 대학교 출신입니다. 및 Reichman University(Leichman University) 및 Goldsmiths, University of London:
공동 저자이자 Tel Aviv University의 전자 및 전기공학 석사인 Shir Iluz의 현재 연구 방향은 생성적입니다. AI이며 그의 관심 분야는 딥러닝과 컴퓨터 비전이다.
공동 저자인 Yael Vinker는 텔아비브 대학교에서 컴퓨터 비전 박사 과정을 밟고 있으며 이스라엘 히브리 대학교에서 컴퓨터 과학 학사 및 석사 학위를 취득했습니다. 현재 연구 방향도 딥 러닝과 컴퓨터 비전입니다. .
레이쥔이 샤오미 로고 디자인에 쓴 2백만 위안이 너무 일찍 지출된 것 같습니다
문서 주소: https://arxiv.org/abs/2303.01818
프로젝트 주소: https:// wordasimage.github .io/Word-As-Image-Page/
위 내용은 무료 AI 로고 디자인의 효과는 놀랍습니다. Lei Jun은 200만 달러를 너무 일찍 썼습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!