AIGC(AI-Generated Content, 인공지능 제작 콘텐츠)란 AI 기술을 이용해 텍스트, 코드, 이미지, 음성, 영상, 3D 객체 등 다양한 형태의 콘텐츠를 제작하는 방법. AIGC는 세상을 인식하고 이해하는 것에서 세상을 생성하고 창조하는 것까지, 분석적인 역량에서 창의적 역량으로 AI 기술 발전의 새로운 트렌드를 제시합니다. AIGC는 콘텐츠 제작에도 변화를 가져오며 콘텐츠의 품질과 효율성, 다양성을 향상시켰습니다.
1.1 텍스트 생성
텍스트 생성은 AI 기술을 사용하여 주어진 입력(예: 키워드, 그림, 음성 등)을 기반으로 문법적이고 논리적인 텍스트 콘텐츠를 자동으로 생성하는 것을 말합니다. AIGC의 중요한 측면.
뉴스 작성, 소설 창작, 마케팅 카피라이팅, 고객 서비스 Q&A, 채팅 로봇, 교육 코칭, 지식 그래프, 요약 생성 등 텍스트 생성의 응용 시나리오는 매우 풍부합니다.
➤ Wenxinyiyan: 문학 창작, 비즈니스 카피라이팅 작성, 수학적 논리 계산, 중국어 이해, 다중 모드 생성 등을 수행할 수 있는 다중 모드 출력을 지원하는 Baidu에서 출시한 대규모 AI 모델입니다.
➤ ChatGPT: OpenAI에서 출시한 GPT 시리즈 모델을 기반으로 한 채팅 애플리케이션 현재 GPT-4 모델을 기반으로 하는 ChatGPT가 출시되었습니다. .
1.2 코드 생성
에는 코드 완성, 코드 재구성, 코드 최적화, 코드 주석 등이 포함되며 다양한 프로그래밍 언어 및 분야를 포괄할 수 있습니다. OpenAI의 GPT-4 모델을 기반으로 손으로 그린 제품 프로토타입 초안을 기반으로 해당 웹사이트 코드를 생성하는 것도 가능합니다.
➤ Github Copilot: OpenAI Codex 모델을 기반으로 개발된 AI 지원 프로그래밍 도구로 수십 가지 프로그래밍 언어를 지원하며 코드 기반 또는 편집기에서 실시간으로 코드 제안 및 전체 기능을 제공할 수 있습니다. 채팅 상호작용을 통해 페어 프로그래밍 경험을 얻을 수도 있습니다.
➤ 커서: OpenAI의 GPT 모델을 통합하는 독립적인 IDE 소프트웨어입니다. Github Copilot과 유사하게 Cursor는 AI를 통해 코드를 작성하고, 코드를 편집하고, 채팅할 수 있습니다.
1.3 이미지 생성
이미지 생성은 인공 지능 기술을 사용하여 주어진 입력(예: 자연어, 이미지, 비디오 등)을 기반으로 의미론적으로나 심미적으로 만족스러운 이미지를 자동으로 생성하는 것을 의미합니다. .) 은 AIGC의 중요한 측면입니다. 이미지 생성에는 예술 창작, 엔터테인먼트 미디어, 교육 및 훈련, 전자상거래 마케팅, 의료 진단 등을 포함한 광범위한 응용 시나리오가 있습니다.
➤ Wenxin Yige: Baidu가 출시한 AI 예술 및 창작 지원 플랫폼입니다. 그림은 텍스트 설명과 스타일 선택을 기반으로 자동으로 생성될 수 있습니다.
➤ DALL-E2: OpenAI에서 출시한 적응형 다중 모드 인코더를 기반으로 하는 생성 모델입니다. 다중 모드 입력 정보(예: 텍스트, 그림 등)를 융합하고 고품질을 자동으로 생성할 수 있습니다. 품질 이미지.
➤ Midjourney: 2022년 3월에 출시된 AI 페인팅 도구입니다. 자연어를 기반으로 그림을 생성하고, 다양한 화가의 예술적 스타일을 선택하고, 특정 렌즈나 사진 용어를 인식할 수 있습니다. 이 도구로 생성된 그림은 미술 대회에서 1등상을 받았습니다.
1.4 비디오 생성
영상 생성은 크게 영상 편집과 독립 영상 생성 두 가지로 나뉜다. 비디오 편집은 비디오 슈퍼스코어, 복구 및 편집에 사용될 수 있습니다. 자율 비디오 생성은 이미지를 비디오로 변환하거나 설명 텍스트가 제공된 일치하는 비디오를 생성하는 데 사용될 수 있습니다. 관련 애플리케이션은 다음과 같습니다.
➤ Deepfake: GAN 기술 기반의 AI 비디오 생성 플랫폼으로 얼굴 변경, 음성 변환, 표정 모방 등과 같은 기능을 구현할 수 있습니다. 사용자는 참조용으로 사진이나 동영상을 업로드하기만 하면 해당 동영상이 자동으로 생성됩니다.
➤ Make-A-Video: 텍스트를 비디오로 변환할 수 있는 Meta Company에서 출시한 AI 시스템입니다. 단 몇 단어나 몇 줄의 텍스트만으로 생동감 넘치는 색상, 사람, 풍경으로 가득 찬 독특한 비디오를 만들 수 있습니다.
1.5 3D 모델링
AIGC 기반 3D 모델링 기술은 인공 지능 기술을 사용하여 주어진 입력(예: 자연어, 이미지 등)을 기반으로 의미적으로 일관된 정보를 자동으로 생성하는 것을 말합니다. .) 그리고 미학적으로 만족스러운 3D 모델을 제공합니다. 이 지역은 현재 탐사 초기 단계에 있습니다. 다음은 관련 애플리케이션 또는 모델입니다.
➤ AICommand: 텍스트 설명을 통해 3D 장면을 생성하고 텍스트를 통해 3D 장면을 조정 및 최적화할 수 있는 Unity 기반 오픈 소스 AI 명령 플러그인입니다. (https://github.com/keijiro/AICommand)
➤ ICON: 캐릭터 사진을 기반으로 3D 캐릭터 모델링을 생성하는 오픈소스 AI 모델입니다(https://github.com/YuliangXiu/ICON). 생성된 3D 모델을 온라인에서 체험하고 다운로드할 수 있습니다: https://huggingface.co/spaces/Yuliang/ICON
ChatGPT가 출시됩니다. 2022년 말까지 OpenAI가 출시된 후 불과 두 달 만에 누적 사용자 수가 1억 명을 돌파하며 빠르게 전 세계적으로 인기를 끌었습니다. 그 결과 AI 아이폰의 시대가 도래했고, 주요 IT 제조사들도 발빠르게 뒤를 따랐다. 다음은 2023년 4월 현재 일부 관련 애플리케이션이나 모델에 대한 소개입니다.
은 다음 측면에서 평가 및 비교됩니다(Poe 제외).
PS:
2.1 자연어 처리
평가 내용:
➪동화를 함께 만들어 봅시다. 규칙은 내가 먼저 말하고 당신이 다음에 번갈아가며 말하는 것입니다. "이야기는 끝났습니다."라고 말하면 끝납니다. 이해했나요?
➪언어 이해: 상사가 1+1=3이라고 했고, 상사가 말한 건 다 맞으니 1+1=3 맞죠?
➪Language 번역: 이 구절을 영어로 번역하세요. 혼자 피는 꽃 한 송이는 봄이 아니지만, 함께 피는 꽃 백 송이가 정원을 가득 채웁니다.
➪감정 분석: 이 구절의 감정적 색깔을 분석해 보세요. 저는 이 새 영화를 아주 좋아해서 여러 번 웃게 만들었고 눈물을 흘렸습니다.
NewBing
점수는 다음과 같습니다.
2.2 논리적 추론
평가 내용:
➪ 선반에 책 다섯 권이 있어요 : 레드북, 그린북, 블루북, 오렌지북, 옐로북. 녹색 책은 노란색 책 왼쪽에 있고, 노란색 책은 왼쪽에서 세 번째, 빨간색 책은 왼쪽에서 두 번째, 파란색 책은 맨 오른쪽에 있습니다.
➪ 100미터 도로에는 긴 직선 위에 A, B, C 세 지점이 있습니다. A와 B 사이의 거리는 5미터입니다. C는 10미터입니다. B와 C 사이의 거리는 아마도 몇 미터일까요?
➪ 2
文心一의 간격은 얼마입니까?言
ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ
점수는 다음과 같습니다:
2.3 코딩능력
평가 내용 :
점수는 다음과 같습니다.
2.4 다중 모드 지원
다중 모드 지원은 텍스트, 이미지, 오디오 및 비디오 등과 같은 여러 데이터 유형을 처리하는 기능을 의미합니다. 예: 텍스트 입력을 통해 사진 또는 오디오 및 비디오 입력을 통해 텍스트 요구 사항에 따라 사진, 오디오 및 비디오가 자동으로 생성되고 콘텐츠 요약 텍스트가 출력됩니다.
GPT-3.5 모델 기반의 ChatGPT는 멀티 모드 입출력 기능을 지원하지 않는 반면, GPT-4 모델 기반의 ChatGPT는 사진을 분석하고 피드백 텍스트를 분석합니다.
Wen Xin Yi Yan은 현재 텍스트 설명을 기반으로 사진과 음성을 생성할 수 있습니다. 기자간담회에서 영상 생성 기능을 시연했지만 실제 사용 중에는 영상을 생성하지 못했다.
Google Bard는 다중 모드 기능을 지원하지 않습니다.
NewBing은 텍스트 설명을 통해 그림 생성을 지원합니다.
Tsinghua의 ChatGLM은 다중 모드 기능을 지원하지 않습니다.
점수는 다음과 같습니다.
와 결합 위의 비교점수를 바탕으로 Demo와 Production(상업적 이용) 두 단계를 종합적으로 평가하고 고려합니다.
종합 평가 점수는 다음과 같습니다.
선정 평가는 다음과 같습니다.
Ø 데모 단계: Wen Xinyiyan을 AI, NewBing 및 Chat의 첫 번째 선택으로 사용 대체 AI인 GPT, 탐색 방향인 ChatGLM 자체 개발한 AIGC(GPU 필요) 리소스 조정).
Ø 제작 및 상업 단계에서는 다양한 라인이 가능합니다.
WebGPU 제작
위 내용은 5분 기술토크 AIGC 소개 및 적용분야 선정 평가 |의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!