Mollick은 새로운 이미지 생성 모델의 의미를 제시합니다-일체 포함-php.cn

집

기술 주변기기

일체 포함

Mollick은 새로운 이미지 생성 모델의 의미를 제시합니다

Susan Sarandon

Apr 09, 2025 am 11:26 AM

Mollick은 새로운 이미지 생성 모델의 의미를 제시합니다

최근 Google과 OpenAi가 출시 한 새로운 이미지 생성 모델은 광범위한 관심을 끌었으며 핵심 기술은 이전 모델과 완전히 다릅니다. Ethan Mollick의 기사 중 하나의 유용한 기사는 이러한 새로운 모델의 작업 메커니즘과 인간 사용자에게 미치는 영향을 탐구합니다. 이 기사는 Mollick의 견해를 해석 할 것입니다.

멀티 모달 이미지 생성의 잠재력

Mollick은 기존 이미지 생성 시스템이 여러 모델의 공동 작업의 산물이며 단일 모델은 모든 작업을 완료하지는 않습니다.

"과거에는 LLM (Lange Language Model) 생성 이미지가 LLM에 의해 직접 수행되지 않았습니다. AI는 텍스트 프롬프트를 독립적 인 이미지 생성 도구로 보내고 결과를 표시합니다. AI는 텍스트 프롬프트를 작성하는 데 도움이되었으며, 기능이 약한 다른 시스템은 이미지를 생성 할 책임이있었습니다."

확산 모델은 과거의 일이되었습니다.

구 모델은 주로 확산 모델 작업에 의존합니다. 확산 모델의 작동 원리는 이미지를 노이즈에 소개하고 추상화 처리를 수행 한 다음 노이즈를 제거하여 컴퓨터의 알려진 이미지 라이브러리의 프롬프트와 일치하는 이미지를 생성합니다.

그러나이 방법의 한계는 생성 된 이미지에 모델의 자체 추론과 판단이 없으며 기존 이미지 라이브러리의 간단한 조합이며 귀중한 정보를 제공 할 수 없다는 것입니다.

복합 제어의 장점

오늘날, 멀티 모달 제어 기술의 출현은 이러한 상황을 완전히 변화 시켰습니다.

Mollick은 다음과 같이 예를 들었습니다. 모델이 "코끼리가없는 방을 생성하고 이유를 표시"하도록 촉구했습니다. 전통적인 모델은 프롬프트의 맥락을 이해할 수 없기 때문에 코끼리가 포함 된 이미지를 생성합니다. 글자에 대한 모델의 이해는 훈련 데이터에서 비롯되기 때문에 생성 된 텍스트는 의미가 없거나 허구의 문자를 포함 할 수도 있습니다.

멀티 모달 모델은 요구 사항을 충족하는 이미지를 정확하게 생성하고 "도어가 너무 작다"와 같은 주석을 추가하여 방에 코끼리가없는 이유를 설명 할 수 있습니다.

전통적인 모델의 팁 도전

전통적인 모델의 중요한 단점은 일단 요소를 배제해야한다면 지침을 이해할 수 없기 때문에 해당 요소가 포함된다는 것입니다. 또한 각 수정 또는 조정은 이미지의 기본 구조를 변경합니다. 예를 들어, 캐릭터의 모자를 수정하면 캐릭터의 이미지가 완전히 변경 될 수 있습니다.

멀티 모달 이미지 생성 모델은 원래 결과를 유지하는 데 기초하여 미묘한 조정을 할 수 있습니다.

환경 유지 보수

Mollick은 또한 또 다른 예를 보여줍니다. 한 손으로 특정 항목을 보유한 수달 후 다른 맥락과 다른 스타일로 나타납니다. 이것은 멀티 모달 이미지 생성기의 미세한 통합 기능을 보여줍니다.

완전한 프레젠테이션

Mollick은 또한 아보카도 소스에 대한 권장 사항과 같은 멀티 모달 모델을 사용하여 완전한 프레젠테이션을 설계하는 방법을 보여줍니다. 간단한 지침 만 제공하면 모델이 인터넷에서 관련 정보를 검색하고 통합하며 최종 결과를 생성 할 수 있습니다.

Mollick이 말했듯이, 이것은 빠르게 많은 인간 사업을 대체 할 것입니다. 우리는 해당 프레임 워크 설정을 진지하게 고려해야합니다.

위 내용은 Mollick은 새로운 이미지 생성 모델의 의미를 제시합니다의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

관련 기사

외삽에 대한 포괄적 인 가이드Apr 15, 2025 am 11:38 AM

소개 매일 몇 주 만에 작물의 진행 상황을 관찰하는 농부가 있다고 가정합니다. 그는 성장률을보고 몇 주 안에 식물이 얼마나 키가 커질 수 있는지에 대해 숙고하기 시작합니다. Th

소프트 AI의 부상과 오늘날 비즈니스의 의미Apr 15, 2025 am 11:36 AM

Soft AI-대략적인 추론, 패턴 인식 및 유연한 의사 결정을 사용하여 구체적이고 좁은 작업을 수행하도록 설계된 AI 시스템으로 정의 된 것은 모호성을 수용하여 인간과 같은 사고를 모방하려고합니다. 그러나 이것이 바이러스의 의미는 무엇입니까?

AI 국경을위한 진화 보안 프레임 워크Apr 15, 2025 am 11:34 AM

클라우드 컴퓨팅이 클라우드 네이티브 보안 도구로의 전환이 필요했기 때문에 AI는 AI의 고유 한 요구를 위해 특별히 설계된 새로운 유형의 보안 솔루션을 요구합니다. 클라우드 컴퓨팅 및 보안 수업의 상승이 배웠습니다 th

3 가지 방법 생성 AI 기업가를 증폭시킵니다 : 평균을 조심하십시오!Apr 15, 2025 am 11:33 AM

기업가와 AI 및 생성 AI를 사용하여 비즈니스를 개선합니다. 동시에, 모든 기술과 마찬가지로 생성 AI를 기억하는 것이 중요합니다. 앰프는 앰프입니다. 엄격한 2024 연구 o

Andrew Ng의 모델 임베딩에 대한 새로운 단기 과정Apr 15, 2025 am 11:32 AM

임베딩 모델의 힘 잠금 해제 : Andrew Ng의 새로운 코스에 대한 깊은 다이빙 기계가 완벽한 정확도로 질문을 이해하고 응답하는 미래를 상상해보십시오. 이것은 공상 과학이 아닙니다. AI의 발전 덕분에 R이되었습니다

대형 언어 모델 (LLMS)에서 환각이 불가피합니까?Apr 15, 2025 am 11:31 AM

대형 언어 모델 (LLM) 및 환각의 피할 수없는 문제 Chatgpt, Claude 및 Gemini와 같은 AI 모델을 사용했을 것입니다. 이들은 대규모 텍스트 데이터 세트에 대해 교육을받은 강력한 AI 시스템의 대형 언어 모델 (LLM)의 예입니다.

60% 문제 - AI 검색이 트래픽을 배출하는 방법Apr 15, 2025 am 11:28 AM

최근의 연구에 따르면 AI 개요는 산업 및 검색 유형에 따라 유기 트래픽이 15-64% 감소 할 수 있습니다. 이러한 급격한 변화로 인해 마케팅 담당자는 디지털 가시성에 관한 전체 전략을 재고하게합니다. 새로운

AI R & D의 중심에 인간 번성을하는 MIT Media LabApr 15, 2025 am 11:26 AM

Elon University의 Digital Future Center를 상상 한 최근 보고서는 거의 300 명의 글로벌 기술 전문가를 조사했습니다. 결과적인 보고서 인‘2035 년에 인간이되는 것’은 대부분 AI 시스템의 심화가 T에 대한 우려가 있다고 결론지었습니다.

See all articles

핫 AI 도구

뜨거운 도구

DVWA(Damn Vulnerable Web App)는 매우 취약한 PHP/MySQL 웹 애플리케이션입니다. 주요 목표는 보안 전문가가 법적 환경에서 자신의 기술과 도구를 테스트하고, 웹 개발자가 웹 응용 프로그램 보안 프로세스를 더 잘 이해할 수 있도록 돕고, 교사/학생이 교실 환경 웹 응용 프로그램에서 가르치고 배울 수 있도록 돕는 것입니다. 보안. DVWA의 목표는 다양한 난이도의 간단하고 간단한 인터페이스를 통해 가장 일반적인 웹 취약점 중 일부를 연습하는 것입니다. 이 소프트웨어는

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

맨티스BT

Mantis는 제품 결함 추적을 돕기 위해 설계된 배포하기 쉬운 웹 기반 결함 추적 도구입니다. PHP, MySQL 및 웹 서버가 필요합니다. 데모 및 호스팅 서비스를 확인해 보세요.

SublimeText3 영어 버전

권장 사항: Win 버전, 코드 프롬프트 지원!

mPDF

mPDF는 UTF-8로 인코딩된 HTML에서 PDF 파일을 생성할 수 있는 PHP 라이브러리입니다. 원저자인 Ian Back은 자신의 웹 사이트에서 "즉시" PDF 파일을 출력하고 다양한 언어를 처리하기 위해 mPDF를 작성했습니다. HTML2FPDF와 같은 원본 스크립트보다 유니코드 글꼴을 사용할 때 속도가 느리고 더 큰 파일을 생성하지만 CSS 스타일 등을 지원하고 많은 개선 사항이 있습니다. RTL(아랍어, 히브리어), CJK(중국어, 일본어, 한국어)를 포함한 거의 모든 언어를 지원합니다. 중첩된 블록 수준 요소(예: P, DIV)를 지원합니다.