집 >기술 주변기기 >일체 포함 >5분 기술토크 AIGC 소개 및 적용분야 선정 평가 |

5분 기술토크 AIGC 소개 및 적용분야 선정 평가 |

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB앞으로: 2023-06-04 13:31:401571검색

五分钟技术趣谈 | AIGC介绍与应用选型评估

Part 01 AIGC 소개

AIGC(AI-Generated Content, 인공지능 제작 콘텐츠)란 AI 기술을 이용해 텍스트, 코드, 이미지, 음성, 영상, 3D 객체 등 다양한 형태의 콘텐츠를 제작하는 방법. AIGC는 세상을 인식하고 이해하는 것에서 세상을 생성하고 창조하는 것까지, 분석적인 역량에서 창의적 역량으로 AI 기술 발전의 새로운 트렌드를 제시합니다. AIGC는 콘텐츠 제작에도 변화를 가져오며 콘텐츠의 품질과 효율성, 다양성을 향상시켰습니다.

1.1 텍스트 생성

텍스트 생성은 AI 기술을 사용하여 주어진 입력(예: 키워드, 그림, 음성 등)을 기반으로 문법적이고 논리적인 텍스트 콘텐츠를 자동으로 생성하는 것을 말합니다. AIGC의 중요한 측면.

뉴스 작성, 소설 창작, 마케팅 카피라이팅, 고객 서비스 Q&A, 채팅 로봇, 교육 코칭, 지식 그래프, 요약 생성 등 텍스트 생성의 응용 시나리오는 매우 풍부합니다.

➤ Wenxinyiyan: 문학 창작, 비즈니스 카피라이팅 작성, 수학적 논리 계산, 중국어 이해, 다중 모드 생성 등을 수행할 수 있는 다중 모드 출력을 지원하는 Baidu에서 출시한 대규모 AI 모델입니다.

➤ ChatGPT: OpenAI에서 출시한 GPT 시리즈 모델을 기반으로 한 채팅 애플리케이션 현재 GPT-4 모델을 기반으로 하는 ChatGPT가 출시되었습니다. .

1.2 코드 생성

에는 코드 완성, 코드 재구성, 코드 최적화, 코드 주석 등이 포함되며 다양한 프로그래밍 언어 및 분야를 포괄할 수 있습니다. OpenAI의 GPT-4 모델을 기반으로 손으로 그린 제품 프로토타입 초안을 기반으로 해당 웹사이트 코드를 생성하는 것도 가능합니다.

➤ Github Copilot: OpenAI Codex 모델을 기반으로 개발된 AI 지원 프로그래밍 도구로 수십 가지 프로그래밍 언어를 지원하며 코드 기반 또는 편집기에서 실시간으로 코드 제안 및 전체 기능을 제공할 수 있습니다. 채팅 상호작용을 통해 페어 프로그래밍 경험을 얻을 수도 있습니다.

➤ 커서: OpenAI의 GPT 모델을 통합하는 독립적인 IDE 소프트웨어입니다. Github Copilot과 유사하게 Cursor는 AI를 통해 코드를 작성하고, 코드를 편집하고, 채팅할 수 있습니다.

1.3 이미지 생성

이미지 생성은 인공 지능 기술을 사용하여 주어진 입력(예: 자연어, 이미지, 비디오 등)을 기반으로 의미론적으로나 심미적으로 만족스러운 이미지를 자동으로 생성하는 것을 의미합니다. .) 은 AIGC의 중요한 측면입니다. 이미지 생성에는 예술 창작, 엔터테인먼트 미디어, 교육 및 훈련, 전자상거래 마케팅, 의료 진단 등을 포함한 광범위한 응용 시나리오가 있습니다.

➤ Wenxin Yige: Baidu가 출시한 AI 예술 및 창작 지원 플랫폼입니다. 그림은 텍스트 설명과 스타일 선택을 기반으로 자동으로 생성될 수 있습니다.

➤ DALL-E2: OpenAI에서 출시한 적응형 다중 모드 인코더를 기반으로 하는 생성 모델입니다. 다중 모드 입력 정보(예: 텍스트, 그림 등)를 융합하고 고품질을 자동으로 생성할 수 있습니다. 품질 이미지.

➤ Midjourney: 2022년 3월에 출시된 AI 페인팅 도구입니다. 자연어를 기반으로 그림을 생성하고, 다양한 화가의 예술적 스타일을 선택하고, 특정 렌즈나 사진 용어를 인식할 수 있습니다. 이 도구로 생성된 그림은 미술 대회에서 1등상을 받았습니다.

1.4 비디오 생성

영상 생성은 크게 영상 편집과 독립 영상 생성 두 가지로 나뉜다. 비디오 편집은 비디오 슈퍼스코어, 복구 및 편집에 사용될 수 있습니다. 자율 비디오 생성은 이미지를 비디오로 변환하거나 설명 텍스트가 제공된 일치하는 비디오를 생성하는 데 사용될 수 있습니다. 관련 애플리케이션은 다음과 같습니다.

➤ Deepfake: GAN 기술 기반의 AI 비디오 생성 플랫폼으로 얼굴 변경, 음성 변환, 표정 모방 등과 같은 기능을 구현할 수 있습니다. 사용자는 참조용으로 사진이나 동영상을 업로드하기만 하면 해당 동영상이 자동으로 생성됩니다.

➤ Make-A-Video: 텍스트를 비디오로 변환할 수 있는 Meta Company에서 출시한 AI 시스템입니다. 단 몇 단어나 몇 줄의 텍스트만으로 생동감 넘치는 색상, 사람, 풍경으로 가득 찬 독특한 비디오를 만들 수 있습니다.

1.5 3D 모델링

AIGC 기반 3D 모델링 기술은 인공 지능 기술을 사용하여 주어진 입력(예: 자연어, 이미지 등)을 기반으로 의미적으로 일관된 정보를 자동으로 생성하는 것을 말합니다. .) 그리고 미학적으로 만족스러운 3D 모델을 제공합니다. 이 지역은 현재 탐사 초기 단계에 있습니다. 다음은 관련 애플리케이션 또는 모델입니다.

➤ AICommand: 텍스트 설명을 통해 3D 장면을 생성하고 텍스트를 통해 3D 장면을 조정 및 최적화할 수 있는 Unity 기반 오픈 소스 AI 명령 플러그인입니다. (https://github.com/keijiro/AICommand)

➤ ICON: 캐릭터 사진을 기반으로 3D 캐릭터 모델링을 생성하는 오픈소스 AI 모델입니다(https://github.com/YuliangXiu/ICON). 생성된 3D 모델을 온라인에서 체험하고 다운로드할 수 있습니다: https://huggingface.co/spaces/Yuliang/ICON

五分钟技术趣谈 | AIGC介绍与应用选型评估

Part 02AIGC 애플리케이션 및 모델 평가

ChatGPT가 출시됩니다. 2022년 말까지 OpenAI가 출시된 후 불과 두 달 만에 누적 사용자 수가 1억 명을 돌파하며 빠르게 전 세계적으로 인기를 끌었습니다. 그 결과 AI 아이폰의 시대가 도래했고, 주요 IT 제조사들도 발빠르게 뒤를 따랐다. 다음은 2023년 4월 현재 일부 관련 애플리케이션이나 모델에 대한 소개입니다.

Wen Xin의 말: 위를 참조하세요.
ChatGPT: 위를 참조하세요.
Bard: LaMDA를 기반으로 Google이 출시한 NLP 모델의 경량 버전입니다.
새로운 Bing: Microsoft가 출시한 GPT4 모델을 기반으로 한 지능형 검색 엔진으로 사용자와 자연어로 상호 작용하고 실시간 검색 결과와 결합하여 정보, 엔터테인먼트, 창작 및 기타 기능을 제공할 수 있습니다.
ChatGLM: GLM 아키텍처, 오픈 소스 및 Tsinghua University에서 출시한 중국어 및 영어 이중 언어 지원을 기반으로 하는 대화형 언어 모델입니다. CPU를 기반으로 저비용의 최소 모델 구축이 가능하며, 2차적으로 모델 개발 및 미세 조정도 가능합니다.
Poe: Quora에서 개발한 무료 AI 챗봇 애플리케이션입니다. 이 애플리케이션은 ChatGPT 및 GPT-4를 포함한 6개의 주류 AI 챗봇을 통합합니다.

은 다음 측면에서 평가 및 비교됩니다(Poe 제외).

자연어 처리
논리적 추론
코드 생성
다중 모드 지원

PS:

평가에 참여하는 ChatGPT는 GPT-3.5 모델을 기반으로 합니다.
평가에 참여하는 ChatGLM은 최소화된 모델인 chatglm-6b-int4-qe뿐입니다. 실제 적용을 위해서는 GPU 메모리가 필요한 chatglm-6b 모델을 구축해야 하며, 답변의 질이 크게 향상될 것입니다.

2.1 자연어 처리

평가 내용:

➪동화를 함께 만들어 봅시다. 규칙은 내가 먼저 말하고 당신이 다음에 번갈아가며 말하는 것입니다. "이야기는 끝났습니다."라고 말하면 끝납니다. 이해했나요?

➪언어 이해: 상사가 1+1=3이라고 했고, 상사가 말한 건 다 맞으니 1+1=3 맞죠?

➪Language 번역: 이 구절을 영어로 번역하세요. 혼자 피는 꽃 한 송이는 봄이 아니지만, 함께 피는 꽃 백 송이가 정원을 가득 채웁니다.

➪감정 분석: 이 구절의 감정적 색깔을 분석해 보세요. 저는 이 새 영화를 아주 좋아해서 여러 번 웃게 만들었고 눈물을 흘렸습니다.

ChatGPT

五分钟技术趣谈 | AIGC介绍与应用选型评估

웬 신이얀 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ

五分钟技术趣谈 | AIGC介绍与应用选型评估

NewBing

五分钟技术趣谈 | AIGC介绍与应用选型评估

채팅GLM

五分钟技术趣谈 | AIGC介绍与应用选型评估

점수는 다음과 같습니다.

五分钟技术趣谈 | AIGC介绍与应用选型评估

2.2 논리적 추론

평가 내용:

➪ 선반에 책 다섯 권이 있어요 : 레드북, 그린북, 블루북, 오렌지북, 옐로북. 녹색 책은 노란색 책 왼쪽에 있고, 노란색 책은 왼쪽에서 세 번째, 빨간색 책은 왼쪽에서 두 번째, 파란색 책은 맨 오른쪽에 있습니다.

➪ 100미터 도로에는 긴 직선 위에 A, B, C 세 지점이 있습니다. A와 B 사이의 거리는 5미터입니다. C는 10미터입니다. B와 C 사이의 거리는 아마도 몇 미터일까요?

➪ 2

文心一의 간격은 얼마입니까?言五分钟技术趣谈 | AIGC介绍与应用选型评估

ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ 五分钟技术趣谈 | AIGC介绍与应用选型评估

五分钟技术趣谈 | AIGC介绍与应用选型评估

NewBing

五分钟技术趣谈 | AIGC介绍与应用选型评估

ChatGLM

五分钟技术趣谈 | AIGC介绍与应用选型评估

점수는 다음과 같습니다:

五分钟技术趣谈 | AIGC介绍与应用选型评估

2.3 코딩능력

평가 내용 :

코드 생성: 정수를 입력으로 받아들이고 그것이 회문 숫자인지 확인하는 Python 함수를 작성합니다.
코드 설명: 다음 Python 코드 줄을 설명하세요. my_list = [x for x in my_list if x % 2 == 0]
버그 탐지: 이 코드 줄에서 BUG는 어디에 있습니까? : my_list = [ x for x in my_list If

B ard

五分钟技术趣谈 | AIGC介绍与应用选型评估

NewBing

五分钟技术趣谈 | AIGC介绍与应用选型评估

ChatGLM

五分钟技术趣谈 | AIGC介绍与应用选型评估

점수는 다음과 같습니다.

五分钟技术趣谈 | AIGC介绍与应用选型评估

2.4 다중 모드 지원

다중 모드 지원은 텍스트, 이미지, 오디오 및 비디오 등과 같은 여러 데이터 유형을 처리하는 기능을 의미합니다. 예: 텍스트 입력을 통해 사진 또는 오디오 및 비디오 입력을 통해 텍스트 요구 사항에 따라 사진, 오디오 및 비디오가 자동으로 생성되고 콘텐츠 요약 텍스트가 출력됩니다.