2023년에는 대형모델 구현을 위해 액셀버튼이 눌릴 예정이며, 빈센티안 그래픽은 가장 뜨거운 적용 방향 중 하나가 될 것입니다. Stable Diffusion이 탄생한 이후, 문성도의 대형 모델이 국내외에 등장하면서 한동안 "신들 사이의 싸움"처럼 느껴졌습니다. 각 기술 반복은 모델 생성 효과와 속도를 빠르게 향상시킵니다. 오늘 Tencent Hunyuan 모델은 최신 진행 상황도 발표했습니다. Vincentian 그래프 기능이 공식적으로 출시되었습니다. 시험해 보자마자 Hunyuan Model의 넓고 심오한 중국 음식 문화에 대한 이해를 보았습니다. 여기서는 많은 대형 모델을 어렵게 만드는 "나무를 오르는 개미"를 선택했지만 Hunyuan은 쉽게 생성됩니다.
질문은 현재 Vincentian 대형 모델이 너무 큰데 Hunyuan 대형 모델에 다른 특별한 이점이 있습니까? 공식 소개에 따르면, 알고리즘 및 모델 측면에서 현재 Vincentian 대형 모델은 의미론적 이해 부족, 생성된 그림의 불합리한 구조, 그림 세부 정보 부족, 질감 부족 등 여전히 몇 가지 과제를 안고 있습니다. Tencent는 오랫동안 광고 시나리오에서 AI 생성 이미지를 탐색하기 시작했으며 관련 축적은 상당히 심오합니다. 이 Hunyuan 대형 모델 업그레이드의 Wenshengtu 기능은 "의미론, 콘텐츠 및 질감"의 세 가지 문제를 정확하게 해결하기를 희망합니다. 보도에 따르면 다른 대형 모델에 비해 Tencent Hunyuan의 Wenshengtu는 인물 사진과 장면의 사실성 측면에서 확실한 장점을 갖고 있는 동시에 중국 풍경, 애니메이션 게임 및 기타 장면 생성에서도 더 큰 장점을 가지고 있습니다. . 좋은 성능. 실습 테스트: Hunyuan Wensheng Tu, 차이점은 무엇인가요? "Wen Sheng Tu"를 잘하려면 "Wen"에 대한 완전한 이해가 중요합니다. 의미론적 이해 측면에서 Hunyuan Wensheng 그래프 모델은 중국어 및 영어 이중 언어 세분화 모델을 채택하는 동시에 중국어 및 영어 이중 언어 모델링과 모델의 능력을 기반으로 이중 언어 이해를 달성합니다. 최적화 알고리즘을 통해 세부 사항을 인식하고 효과를 생성합니다. 이전에는 Stable Diffusion과 같은 인기 모델이 중국어를 어느 정도 지원했지만 핵심 데이터 세트 LAION-5B는 여전히 주로 서구화된 콘텐츠였으며 중국어, 음식, 문화 및 관습에 대한 이해가 충분하지 않았습니다. 이해. Hunyuan Wenshengtu 모델은 사용자가 입력한 한시나 숙어에 관계없이 중국 고유의 Wenshengtu 모델입니다. 사용자는 직접 그림을 만들도록 요청할 수 있습니다. 콘텐츠 합리성 측면에서 Hunyuanwenshengtu는 알고리즘 모델의 이미지 2차원 공간 위치 인식 능력을 향상시키고 인간 골격 및 인간 손 구조와 같은 사전 정보를 생성 프로세스에 도입하여 생성된 이미지 구조가 더욱 합리적이어서 AI가 생성한 인체 구조와 손이 비합리적인 문제를 개선합니다. 그림 질감 측면에서 Hunyuan Wenshengtu는 생성된 질감을 개선하기 위해 다중 모델 융합 방법을 기반으로 합니다. 최적화 후 Hunyuan Wenshengtu의 인물 모델(머리카락, 주름 등) 효과가 30% 향상되었으며, 장면 모델(식물, 잔물결 등) 효과가 25% 향상되었습니다. 이 세 가지 측면의 기술적 이점은 Hunyuan 대형 모델 Wenshengtu 제품 경험을 확실히 향상시켰습니다.
위 성능을 검증하기 위해 본 사이트에서는 처음으로 Hunyuan 대형 모델에 대해 몇 가지 질문을 설정하고 철저한 테스트를 진행했습니다.
Hunyuan은 중국 출신 모델이기 때문에 다른 유사 제품보다 자연스럽게 "고대 중국의 언어"를 더 잘 이해합니다.
우리는 매우 예술적인 고시 "술에 취하면 하늘이 물 위에 있는 줄 모르고 배에는 맑은 꿈이 가득하고 별은 압도적이다"를 선택하여 혼위안 대형 모델은 강한 이미지 감각을 지닌 사진을 생성할 수 있습니다.
시 "과주에 정박하다"에서 "강 남쪽 기슭에 봄바람이 다시 푸르러지는데, 밝은 달은 언제 나를 비춰줄 것인가?"라는 구절은 수많은 방랑자들의 향수병을 씁니다. 혼원의 생성으로 인해 '봄빛', '물둑', '밝은 달' 등의 이미지가 유기적으로 추출 및 결합되어 보는 즉시 시적인 장면에 있는 듯한 느낌을 줍니다.
그럼 재미있겠다 "중국 음식 그림" 섹션에서 "생선 맛 돼지고기"에 대한 고전적인 테스트를 해보자:
사람을 미치게 만드는 중국 음식 그림부터, 사진을 보고 먹는 수준까지, 우리도 느낄 수 있는 빈센트 다이어그램 기술의 지속적인 진화.
업계에서 인정하는 "현실적인 초상화" 문제에 대해 Hunyuan이 어떻게 하는지 살펴보겠습니다.
Midjourney의 초기 히트작이 아래 커플 사진 때문이라는 것을 알고 있습니다. 저항할 수 없음 이것은 AI에 의해 생성된 것이 아닌 것으로 밝혀졌습니다.U Midjourney V5에서 생성된 커플 맵
이제 "사기"를 생성하는 혼합 전자의 능력을 살펴보겠습니다. 사용된 프롬프트는 다음과 같습니다. 현실감에 대해 어떻게 생각하시나요? 우리는 프롬프트에 언급된 세부 사항으로 충분하다고 생각합니다. Tencent가 강조하는 점은 Hunyuan 대형 모델이 최적화 알고리즘을 통해 디테일에 대한 인식과 생성 효과를 향상한다는 것입니다. 이 능력은 많은 특정 장면에서만 반영될 수 있습니다. 예를 들어 애니메이션 장면에서는 "사슴이 숲을 달리며 낙엽이 날아오르고, 달이 밝고 크고, 새들이 하늘을 나는 모습, 분위기, CG 스타일, 측면 시점"을 생성합니다. ". 어렸을 때 보았던 애니메이션 속 장면과 비슷합니까? 또한 애니메이션 제작에 있어서 문성투의 활용 가능성은 엄청납니다. Hunyuan 대형 모델에게 준 프롬프트는 "3D 생성, 애니메이션 스타일, 소녀 1명, 금발 머리, 미소, 짧은 머리, 도시 배경"입니다. 세대 효과에 대해 어떻게 생각하시나요? ? 배경화면으로 직접 사용할 수 있나요? Wenshengtu의 자체 개발 기술은 무엇입니까? 일꾼이 일을 잘하려면 먼저 도구를 갈고 닦아야 하듯이, 대형 모델도 마찬가지입니다. Tencent의 Hunyuan 대형 모델은 혁신적인 모델 알고리즘 외에도 중국 문화에 부합하는 텍스처 이미지 효과를 달성한다는 사실을 알게 되었습니다. 이는 또한 고품질 이미지-텍스트 매칭 데이터 및 자체 개발과 불가분의 관계입니다. 머신러닝 프레임워크와 강력한 컴퓨팅 인프라. Tencent Hunyuan Large Model은 모델 알고리즘부터 기계 학습 프레임워크, AI 인프라까지 풀 링크 자체 개발 기술 경로를 형성했습니다. 다단계 기술 축적은 대형 모델의 진화가 실제로 시작하여 실제로 개선되는 단계를 거쳐야 함을 의미합니다. 먼저 모델 학습을 지원하는 데이터 엔지니어링을 살펴보겠습니다. 모든 AI, 특히 대형 모델에 있어서 데이터는 필수 요소 세 가지 중 하나입니다. 대형 모델 텍스트 생성 기능도 마찬가지다. 이미지와 텍스트 데이터, 특히 이미지와 텍스트 간의 매칭 데이터가 생성 효과에 결정적인 영향을 미친다. 그러나 인터넷에 있는 모든 기존 데이터를 쉽게 사용할 수 있는 것은 아닙니다. 큰 문제는 사진의 텍스트 설명이 정확하지 않을 수 있어 대부분의 이미지-텍스트 일치 데이터의 품질이 좋지 않다는 것입니다. 사용하는 경우 훈련 시간이 매우 길더라도 모델 생성 효과는 여전히 기대에 미치지 못하며 이는 생성 품질의 안정성과 후속 반복 효율성에도 영향을 미칩니다. 따라서 이미지와 텍스트 데이터의 품질을 향상시키는 것이 빈첸시안 이미지의 효과를 보장하기 위한 "첫 번째 장애물"이 되었습니다. 이때 엔지니어링 방법을 통해 데이터 품질을 개선하고, 모델 훈련, 최적화 및 업그레이드를 지원하고, 알고리즘 모델을 위한 해자를 구축해야 하는 경우가 많습니다. 이미지와 텍스트 매칭 데이터의 문제에 직면한 Tencent Hunyuanwenshengtu 팀의 대응 전략은 다음과 같습니다. 첫째, 중국어 프롬프트를 세분화하여 개선하고, 이미지와 텍스트 간의 상관성을 개선하며, 그런 다음 훈련 데이터 분석 계층 및 계층적 전략을 사용하여 모델을 점진적으로 최적화하고 데이터 효과를 극대화합니다. 마지막으로 대규모 모델의 신속한 반복의 핵심인 데이터 플라이휠이 구축됩니다. 대규모 모델을 사용하는 온라인 사용자의 피드백을 기반으로 팀은 자동으로 훈련 데이터를 구축하여 모델 반복 속도를 높이고 데이터 효율성을 극대화합니다. 데이터 품질, 효과, 효율성이 향상되어 빈센트 차트 효과를 위한 기반이 마련되었습니다. 다음에 논의할 머신러닝 프레임워크도 똑같이 중요합니다.강력한 기계 학습 프레임워크 또는 플랫폼은 개발자의 모델 구축, 교육 및 배포 속도와 효율성을 크게 향상시킵니다. Tencent는 대규모 모델 훈련 및 추론 시나리오를 위한 자체 Angel 기계 학습 플랫폼을 개발했습니다. 이는 주로 훈련을 담당하는 AngelPTM과 추론을 담당하는 AngelHCF의 두 부분으로 구성됩니다. 그 중 AngelPTM은 ZeRO-Cache 최적화 전략을 채택하여 스토리지 관리를 통해 단일 머신 모델의 용량을 확장하고 비동기식 멀티 스트림을 통해 리소스 활용도를 향상시키는 강력한 초대형 모델 교육 도구가 됩니다. 비디오 메모리 관리를 통해 비디오 메모리 효율성을 향상시킵니다. 또한 4D 병렬 처리를 사용하여 사용 가능한 비디오 메모리의 상한을 늘리고 킬로카드에 대한 통신 부담을 줄이며 컴퓨팅 잠재력을 출시합니다. 자동 교육 갱신 메커니즘은 킬로카드 오류에 대한 자동 내결함성을 지원하고 중단 시간을 줄입니다. 모델 훈련 상황도 실시간으로 모니터링되며, 협업 알고리즘을 통해 모델 훈련 방향을 최적화합니다. 현재 AngelPTM은 업계 최초의 ZeRO-Cache 메커니즘 + 4D 병렬성을 기반으로 수천억 개의 하이브리드 기본 모델에 대한 고속 교육을 달성하고 있습니다. 주류 오픈 소스 프레임워크(DeepSpeed-Chat)에 비해 교육 속도가 두 배 빠릅니다. ). ZeRO-Cache 개요. AngelHCF는 주로 맞춤형 다각화된 서비스 전략, 병렬 전략, 프레임워크 가속(일반적인 GPU 가속 방법 포함), 모델 압축(업계에서 일반적인 압축 방법 지원) 및 효율적이라는 5가지 측면에서 대형 모델의 성능을 향상시킵니다. 모델 디버깅 기능. 추론 속도는 업계 주류 프레임워크(FasterTransformer)보다 1.3배 빠릅니다.
Tencent는 자사의 Angel 머신 러닝 플랫폼이 최고의 성능을 갖추고 있으며 더 나은 인프라 시스템을 제공하고 대형 모델이 고속으로 실행되도록 도울 수 있다고 말했습니다. 이를 통해 대규모 Hunyuan 모델은 고품질 이미지를 생성하는 동시에 생성 속도도 크게 향상시킬 수 있습니다.
고품질 데이터와 효율적인 기계 학습 프레임워크를 통해 대형 모델의 지속적인 운영은 여전히 컴퓨팅 성능 테스트에 직면해 있습니다. 결국 대형 모델 시대에는 컴퓨팅 파워가 왕이다.
Tencent의 Hunyuanwenshengtu 기능은 Tencent Cloud가 제공하는 강력한 컴퓨팅 인프라와 분리될 수 없습니다. 2023년 4월, Tencent Cloud는 최신 세대의 Xinghai 자체 개발 서버를 사용하고 자체 개발한 네트워크 및 스토리지 아키텍처를 기반으로 3.2T의 초고 상호 연결 대역폭(TB)을 달성하는 차세대 HCC 고성능 컴퓨팅 클러스터를 출시했습니다. 수준의 처리 용량 및 천만 수준의 IOPS. 차세대 클러스터의 컴퓨팅 성능은 이전 세대에 비해 3배, 기존 컴퓨팅 클러스터 솔루션에 비해 12배 이상 향상되었습니다.
기본 하드웨어를 강화하는 동시에 상위 수준의 소프트웨어 기능도 함께 병행해야 합니다. 차세대 HCC 클러스터는 Tencent Cloud가 자체 개발한 TACO 훈련 가속화 엔진을 통합하여 네트워크 프로토콜, 통신 전략, AI 프레임워크 및 모델 컴파일 수준에서 많은 시스템 수준 최적화를 수행했습니다. 이 포괄적인 생태 훈련 가속화 솔루션 세트는 고객이 AI 최적화 임계값을 낮추고 AI 훈련 성능을 향상시키는 데 도움이 될 뿐만 아니라 훈련 조정 및 컴퓨팅 전력 비용을 크게 줄일 수 있습니다. 대형 모델, 알고리즘, 데이터 및 컴퓨팅 성능을 제한하는 세 가지 주요 요소는 Tencent Hunyuan 대형 모델에서는 더 이상 문제가 되지 않는 것 같습니다. 당연히 빈첸시안 그림의 품질과 효과도 보장됩니다. 효과는 "가짜와 진짜"입니다.
Venographic 그래픽 기능이 Tencent 광고 장면에 내장되었습니다.오늘 우리가 본 Hunyuan 대형 모델 텍스트 그래픽 기능은 하루아침에 달성된 것이 아닙니다. 그러나 진화 과정의 실제 현실입니다.
지난달 열린 2023 Tencent 글로벌 디지털 생태 컨퍼런스에서 Tencent Hunyuan 대형 모델이 공식 공개되었습니다. Tencent Group의 Jiang Jie 부사장은 당시 Hunyuan이 항상 길 위에 있다고 말했습니다. Tencent는 계속해서 Hunyuan의 역량을 발전시킬 것이며 매달 모든 사람에게 놀라움을 선사할 수 있기를 바랍니다.
현재 Tencent에는 Tencent Conference, Tencent Documents, Enterprise WeChat, Tencent Advertising 및 WeChat Search를 포함하여 Hunyuan 대형 모델과 연결된 180개의 내부 비즈니스가 있습니다. 동시에 소매, 교육, 금융, 의료, 미디어, 운송, 정부 업무 등 다양한 산업 분야의 고객도 Tencent Cloud를 통해 Tencent Hunyuan API를 호출합니다. 응용 분야에는 지능형 질문 및 답변, 콘텐츠 생성, 데이터 분석, 코드 도우미 및 기타 시나리오.
새롭게 오픈된 Vincentian 이미지 기능은 Tencent의 Hunyuan 모델이 우리에게 가져온 가장 큰 놀라움으로, 자동 이미지 생성 분야에서 선도적인 기능을 보여줍니다. 물론 Tencent Hunyuan Wenshengtu도 점진적으로 발전하고 있으며 앞으로 더 많은 Wenshengtu 관련 기능과 Wenshengtu 기능이 개발될 것입니다. 우리는 그것의 물결을 기대할 수 있습니다.현재 Hunyuanwen의 이미지 생성 기능은 제품 광고나 광고 이미지 생성과 같은 Tencent의 광고 시나리오에 내장되어 있습니다. 광고 사업에 대한 여러 차례의 평가에서 Tencent Hunyuan Wenshengtu의 우수 사례 비율과 광고주 채택률은 각각 86%와 26%에 이르렀으며, 이는 둘 다 유사 모델보다 높습니다. 먼저 호텔 방을 생성하기 위해 Hunyuan 대형 모델이 필요한 다음 예를 살펴보겠습니다. 효과의 관점에서 볼 때 Hunyuan Wensheng 사진 효과는 업그레이드 후 확실히 더 좋아지고 디자인과 품질이 크게 향상되었으며 세부 사항이 더욱 풍부해졌습니다. Midjourney와 비교해도 결과는 비슷합니다. 캐릭터 생성 장면도 비슷한 효과를 가집니다. 업그레이드 후 Hunyuan이 생성한 초상화는 얼굴 피부색, 주름 및 기타 세부 사항과 같이 더욱 사실적입니다. Tencent는 광고 시나리오 외에도 게임 시나리오에서 게임 요소 및 게임 캐릭터 생성, 콘텐츠 시나리오에서 참신한 일러스트레이션 및 일러스트레이션 생성, 클라우드 비즈니스 시나리오에서 혼합 등 Wenshengtu에 대한 다른 수요 시나리오도 지속적으로 탐색하고 있습니다. . 메타 기능은 다양한 산업 분야의 고객에게 열려 있습니다. 아무리 강력한 모델이라도 더 많은 사람들이 사용하고 피드백을 계속 받아야 더 발전할 수 있습니다. 향후 Tencent 제품은 Hunyuanwentutu 기능의 폭발적인 증가를 가져올 것으로 예상할 수 있으며, 사용자도 AIGC가 가져온 매력을 더 많이 경험하게 될 것입니다. 위 내용은 Tencent의 Hunyuan 대형 모델이 다시 업그레이드되어 Vincentian 그래프 기능과 포괄적인 실제 측정 및 분석 기능이 충격적으로 출시되었습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!