>  기사  >  기술 주변기기  >  Microsoft Bing이 다시 향상되었습니다! OpenAI DALL·E 모델에 연결하여 텍스트에서 이미지 생성

Microsoft Bing이 다시 향상되었습니다! OpenAI DALL·E 모델에 연결하여 텍스트에서 이미지 생성

PHPz
PHPz앞으로
2023-03-31 22:39:191536검색

Microsoft Bing은 텍스트에서 이미지를 생성하는 기능을 향상시켰으며 Adobe도 생성 AI 게임에 진입하기 위해 오늘 Firefly를 출시했습니다.

어젯밤은 정말 활기가 넘쳤어요.

Nvidia GTC가 진행되는 동안 Google은 공식적으로 Bard 테스트를 열었고 여기에 Microsoft Bing만이 있는 것은 아닙니다.

Microsoft Bing이 다시 향상되었습니다! OpenAI DALL·E 모델에 연결하여 텍스트에서 이미지 생성

오늘 Microsoft는 Bing 검색 엔진에 OpenAI의 DALL·E 모델을 통합하여 AI 생성 이미지 기능을 추가했다고 공식 발표했습니다.

즉, Bing은 ChatGPT에 액세스한 후 사용자가 DALL·E 모델을 사용하여 이미지를 생성할 수 있도록 Bing Image Creator를 다시 한 번 강화했습니다.

"Bing Preview 액세스 권한이 있는 사용자의 경우 Bing Image Creator는 Bing 채팅 환경에 완전히 통합되어 크리에이티브 모드에서 처음으로 출시됩니다."라고 Microsoft의 소비자 마케팅 책임자인 Yusuf Mehdi는 설명했습니다. "이미지에 대한 설명을 입력하고 위치나 활동과 같은 추가 컨텍스트를 제공하고 예술적 스타일을 선택함으로써 Image Creator는 사용자의 상상력을 기반으로 이미지를 생성합니다.

Microsoft Bing이 다시 향상되었습니다! OpenAI DALL·E 모델에 연결하여 텍스트에서 이미지 생성

Bing에는 크리에이티브 모드, 균형 모드와 정밀 모드. Creative 모드에서 Bing이 생성한 결과는 일반적으로 "독창적이고 상상력이 풍부한" 반면, Precise 모드에서는 보다 진실되고 간결한 답변을 위해 정확성과 관련성을 선호합니다. 현재 Image Creator는 크리에이티브 모드에서만 사용할 수 있습니다.

Bing 미리 보기 버전에 액세스할 수 없는 경우에도 사용자는 bing.com/create에 직접 액세스하여 Image Creator만 사용하여 이미지 생성 기능을 시험해 볼 수 있습니다. 현재는 영어 입력만 지원됩니다. Microsoft는 시간이 지남에 따라 더 많은 언어 입력을 지원할 것이라고 밝혔습니다.

또한 Microsoft는 Bing에서 새로운 AI 기반 시각적 스토리 및 지식 카드 2.0을 출시했습니다.

OpenAI 텍스트 생성 이미지에 대한 DALL·E 시리즈 연구를 간략하게 소개합니다.

2021년 1월 6일 OpenAI 블로그에서는 텍스트와 이미지를 연결하는 두 개의 신경망인 DALL・E와 CLIP을 출시했습니다. DALL・E는 텍스트를 기반으로 이미지를 직접 생성할 수 있고, CLIP은 이미지와 텍스트 카테고리의 매칭을 완료할 수 있습니다. 이 두 연구의 발표는 지역사회에 큰 관심을 불러일으켰습니다.

블로그에 따르면 DALL・E는 자연어 형태로 표현된 수많은 개념을 적절한 이미지로 변환할 수 있으며 이를 기반으로 이미지를 생성할 수 있는 GPT-3의 120억 매개변수 버전이라고 할 수 있습니다. 텍스트 설명.

Microsoft Bing이 다시 향상되었습니다! OpenAI DALL·E 모델에 연결하여 텍스트에서 이미지 생성

DALL・E 예. '아보카도 모양의 의자'라는 문장을 보면 다양한 모양의 녹색 아보카도 의자 이미지를 얻을 수 있습니다.

2개월 후, DALL·E의 논문과 코드가 공개되었습니다.

Microsoft Bing이 다시 향상되었습니다! OpenAI DALL·E 모델에 연결하여 텍스트에서 이미지 생성

  • 프로젝트 주소: https://github.com/openai/DALL-E
  • 논문 주소: https://arxiv.org/abs/2102.12092

2022년 4월 7일경, DALL・E 업그레이드된 버전인 DALL・E 2가 출시되었습니다. DALL・E에 비해 DALL・E 2는 사용자 설명 이미지 생성 시 해상도가 더 높고 대기 시간이 더 짧습니다. 또한 새 버전에는 원본 이미지 편집과 같은 몇 가지 새로운 기능도 추가되었습니다.

OpenAI는 DALL・E 2의 연구 논문 "Hierarchical Text-Conditional Image Generation with CLIP Latents"도 발표했습니다.

Microsoft Bing이 다시 향상되었습니다! OpenAI DALL·E 모델에 연결하여 텍스트에서 이미지 생성

문서 주소: https://cdn.openai.com/papers/dall-e-2.pdf

이번에 Bing에서 액세스한 DALL・E는 업데이트되고 반복되었어야 합니다. 이는 현재 ChatGPT의 크로스 모달 생성 경험 부족을 어느 정도 보완합니다. 그러나 GPT-4의 다중 모드 기능이 열리면 더 많은 새로운 경험을 제공할 수 있습니다.

마지막으로 오늘 업계 관계자들의 관심과 논의를 불러일으킨 또 다른 생성 AI가 출시되었습니다.

이때 Adobe가 Firefly를 출시했습니다. 사용자가 명령을 입력하여 이미지를 빠르게 수정할 수 있는 창의적인 표현을 위한 생성형 AI 모델 시리즈입니다. 현재 Firefly는 베타 버전을 오픈했으며, 관심 있는 독자들은 신청하여 체험해 볼 수 있습니다.

Microsoft Bing이 다시 향상되었습니다! OpenAI DALL·E 모델에 연결하여 텍스트에서 이미지 생성

요즘에는 생성 AI 게임에 참여하는 플레이어가 점점 더 많아지고 있으며 경쟁도 점점 치열해지고 있습니다.

위 내용은 Microsoft Bing이 다시 향상되었습니다! OpenAI DALL·E 모델에 연결하여 텍스트에서 이미지 생성의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 51cto.com에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제