ホームページ >テクノロジー周辺機器 >AI >体験しようと70万人が殺到！動画生成の新たな王様「Keling AI」が再びアップグレード

体験しようと70万人が殺到！動画生成の新たな王様「Keling AI」が再びアップグレード

王林オリジナル: 2024-07-20 05:09:40887ブラウズ

AI生成のショートドラマの時代が本当に来る可能性はあるのか？

最近、様々な動画生成AIが公開しているデモが眩しいです。ミームや長さのパズルで遊ぶことから、実際の物理的ロジックに注意を払うことまで、区別するのが難しい人工知能のアイデアは無限にあり、それらはすべてソラと競争する必要があります。このとき、誰かが突然「フィルムレベル」のパフォーマンスを実行するために一歩先に進みました:

光と影の効果の実際のスタイルから:

体験しようと70万人が殺到！動画生成の新たな王様「Keling AI」が再びアップグレード

^{出典: https://x.com/ i/status/1806383419661730197 豊かな想像力の中で、要素は完成し、それを手に入れることができます:}

体験しようと70万人が殺到！動画生成の新たな王様「Keling AI」が再びアップグレード AIの目でバットマンがピエロを伸ばすことができなくなるとは予想していませんでした。出典: https://x.com/blizaine/status/1806383419661730197

^{すでにこの能力を使って複雑なタスクを完了しようとしている人もいます。映像生成AI、音楽生成AI、そして一部のPSとAEを使えば、完全なMVを作成できます。〜友達は「ハリウッドについてどう思いますか？」と聞きたがります}

この種の AI ビデオによって生成されるエフェクトはスムーズかつ正確で、多くの「いいね！」を集めていることがわかります。ソーシャルネットワーク上には、それによって作成された短いビデオがたくさんあります。

体験しようと70万人が殺到！動画生成の新たな王様「Keling AI」が再びアップグレードネチズンのまとめによると、新しいAIの主な利点は、大規模な動きを生成する際に気が散りにくいことです。別の例は、走っているケンタウルスのビデオを作成することです:

これらのビデオの背後にある生成 AI は、

Kuaishou の大型モデル「Kling」(クリング)

で、数週間前に世界のインターネット上で爆発的に普及し始めました。当時は「入手困難ナンバーワン」として知られていました。体験しようと70万人が殺到！動画生成の新たな王様「Keling AI」が再びアップグレード

そうです、これは最初に PPT リリース用にリリースされたデモではなく、最初から直接開かれる製品レベルのアプリケーションです。

Keling AI は、シンプルさと使いやすさに重点を置いた Web バージョンを開始しました

。

最新のデータによると、Keling AI を申請するユーザーの数は

700,000 体験しようと70万人が殺到！動画生成の新たな王様「Keling AI」が再びアップグレードに近づき、ネットワーク全体で最もホットなビデオ生成モデルとなっています。

1 月のいくつかのアップグレード、Keling AI の急速な進化 今年は生成 AI 元年であり、2 月にはすでに OpenAI の Sora が競争をビデオ生成のレベルに引き上げました。しかし、それを最初に導入したのは国内のテクノロジー企業だった。

6月6日の正式デビュー以来、海外のAI界で熱い議論を巻き起こした初の国産大型モデルであるKuaishou Keling AIは、わずか1ヶ月の間に3回の反復アップデートを経ました。文生ビデオの最初から、土生ビデオ、ビデオの継続、および 2 週間後の複数のサイズ選択のサポートに至るまで、Keling AI はますます卓越した包括的なものになりました。動画生成に対するさまざまなニーズが無意識のうちに解決されているようです。

先週末の世界人工知能会議 WAIC 2024 で、Keling AI は 3 回目のメジャーアップグレードを開始し、ビデオ生成の質感、美しさ、プレイアビリティを大幅に向上させた一連の新機能をリリースし、クリエイティブエクスペリエンスに新たな飛躍をもたらしました。。 Kuaishou のシニアバイスプレジデントであり、Kuaishou の主要ウェブサイトビジネスおよびコミュニティサイエンスラインの責任者であるGai Kun

は、

高解像度バージョン、最初と最後のフレーム制御、カメラレンズ制御を含む、この Keling AI アップグレードの 3 つのハイライトを紹介しました。。

。アップグレード後、生成されるビデオの品質は、以前のモデルと比較して質的に向上しました。

동시에 훈련의 더 높은 시공간 해상도 덕분에 Keling AI는 디테일 생성, 구성, 렌즈 움직임 미학, 빛과 그림자 측면에서 크게 향상되었습니다.

아래 화질 비교를 보면 Keling AI의 이전 모델과 최신 모델의 차이를 확연히 알 수 있습니다.

体験しようと70万人が殺到！動画生成の新たな王様「Keling AI」が再びアップグレード

두 번째로, Keling AI는 Tusheng 비디오 분야에서 실용적이고 요청이 많은 "첫 번째 및 마지막 프레임 제어" 기능을 추가하여 첫 번째와 마지막 프레임을 에코하는 Tusheng 비디오를 현실로 만들었습니다.

시작 프레임과 끝 프레임 이미지를 사용자 정의함으로써 사용자는 서로 다른 비디오 클립 간 샷의 부드러운 전환을 정확하게 제어하여 한 샷에서 끝까지 효과를 얻을 수 있습니다. 실제 생성된 결과를 보면 움직임이 자연스럽고 부드러울 뿐만 아니라 이미지 품질도 보장됩니다. 이 기능의 도입으로 사용자는 개인화된 Tusheng 비디오의 요구 사항을 충족하면서 보다 직관적이고 편리한 편집 경험을 가질 수 있습니다.

예를 들어 다음 두 장의 사진으로 비디오를 생성합니다.

体験しようと70万人が殺到！動画生成の新たな王様「Keling AI」が再びアップグレード

효과는 다음과 같습니다.

体験しようと70万人が殺到！動画生成の新たな王様「Keling AI」が再びアップグレード

마지막으로 Keling AI는 미러 이동 제어 및 자동 마스터 렌즈 이동 기능을 추가합니다. 영상의 세계에서는 더 많은 렌즈를 조합하면 더 많은 이미지를 포착하고 전체적인 표현력을 향상시킬 수 있습니다.

Keling AI는 다양한 목적에 맞게 롤, 틸트, 팬, 수직, 수평 및 줌을 포함한 6가지 기본 렌즈 제어 방법 세트를 사전 설정하여 다양한 선택을 제공합니다. 사용자는 또한 이러한 움직임의 양수 및 음수 매개변수를 조정하여 움직임의 강도나 부드러움, 역방향 움직임 등을 제어할 수 있습니다. 동시에 뛰어난 카메라 움직임은 완전한 영화적 느낌을 지닌 시선을 사로잡는 블록버스터를 제작하는 데 도움이 됩니다.

体験しようと70万人が殺到！動画生成の新たな王様「Keling AI」が再びアップグレード

Keling AI는 이러한 새로운 기능을 추가하여 비디오 선명도, 미적 성능 및 콘텐츠 사용자 정의 제어 측면에서 눈에 띄는 개선을 이룬 것을 볼 수 있습니다.

그뿐만 아니라, 공식적으로 사용자에게 제공되는 Keling AI 웹 버전은 가까운 시일 내에 지원될 Vincent 사진, Vincent 비디오 및 비디오 편집 기능을 통합하여 원스톱 시각적 콘텐츠 제작 플랫폼으로 거듭나고 있습니다. 출시 후 바로 사용이 가능합니다.

새로 추가된 '첫 번째 및 마지막 프레임 제어'와 '거울 움직임 제어' 기능을 현재 웹페이지에서 체험하고 싶은 친구들은 빠르게 신청할 수 있습니다!

体験しようと70万人が殺到！動画生成の新たな王様「Keling AI」が再びアップグレード

Klingai AI 웹 버전 주소: klingai.kuaishou.com

Keling AI의 업그레이드는 "성실함이 가득하다"고 표현해도 과언이 아닙니다. 물론 Kuaishou의 지속적인 혁신 역량과도 떼어놓을 수 없습니다. 획기적인.

"영화 수준" AI 세대는 그 뒤에 있는 모든 기술입니다

이미 매우 성숙한 이미지 세대에 비해 비디오 생성 작업은 실제 응용 분야에서 진정성, 동작 일관성 및 영상의 부드러움을 직면해야 합니다. , 세부 사항의 정확성, 장면, 캐릭터 및 빛과 그림자의 일관성, 물리적 정확성 및 시간 제약 및 기타 여러 과제.

이러한 과제를 얼마나 잘 처리하느냐에 따라 모델의 실용성과 사용 용이성이 직접적으로 결정됩니다. 분명히 업그레이드된 Keling AI는 이러한 측면에서 급격한 변화를 겪었습니다. 요약하면 Keling AI에는 7가지 주요 기능 하이라이트가 있습니다.

Kuaishou 비주얼 생성 및 상호 작용 센터 책임자 Wan Pengfei는 이러한 기능을 하나씩 분석하여 비디오 품질, 이미지 생성, 모션 생성, 생성 시간, 물리적 법칙 및 명령 응답, 비디오 제어 가능성 및 기타 분야에서 Keling AI의 기능을 구축했습니다. 핵심 경쟁력 측면을 고려하여 오늘날 강력한 Keling AI를 만들었습니다. 동시에 Wan Pengfei는 비디오 생성 효과가 매우 빠르게 개선되고 있으며 점차적으로 그래픽 렌더링 및 카메라 촬영에 접근하고 있으며 이는 범 비디오 산업에 새로운 기회를 가져올 것이라고 말했습니다. ㅋㅋ ~ 영화 수준의 고화질 사진 생성, 선도적인 그래픽 비디오 효과 및 뛰어난 비디오 생성 제어 가능성의 세 가지 주요 기능이 더욱 발전했습니다

体験しようと70万人が殺到！動画生成の新たな王様「Keling AI」が再びアップグレード 그 중

영화 수준의 고화질 사진 생성 기능

은 웅장한 자연 풍경, 인간 또는 동물의 움직임과 표현, 기타 웅장하고 미묘한 장면을 높은 충실도와 생생함으로 표현하여 완전한 블록버스터 느낌을 선사할 수 있습니다.

최고의 그래픽 비디오 기능은 정지 이미지에 애니메이션을 적용하여 생생한 5초짜리 짧은 비디오로 변환할 수 있습니다. 동시에 Tusheng 비디오를 더욱 창의적이고 "원하는 대로" 만들기 위해 다양한 텍스트 입력과 결합됩니다.

예를 들어, 수영하는 강아지의 이미지를 동영상으로 변환합니다.

효과는 다음과 같습니다.

뛰어난 동영상 생성 제어 가능성을 통해 사용자는 더욱 정교한 동영상 제작을 할 수 있습니다. Keling AI는 카메라 렌즈 제어 외에도 음성 얼굴 매칭, 캐릭터 ID 유지, 향후 간단한 스트로크 프롬프트를 통한 화면 및 레이아웃 진화 제어 등 더 많은 측면에서 제어 가능한 조정을 달성할 예정입니다. 모델 훈련이 완료되었으며 이러한 기능은 곧 온라인에 제공될 예정입니다.

동시에 Keling AI는 모션 생성, 생성 기간, 물리적 법칙, 명령 응답 등 다른 4가지 주요 기능도 더욱 업그레이드되었습니다.

먼저Keling AI는 크고 합리적인 모션 생성 기능을 갖추고 있습니다. Keling AI는 복잡한 시공간 동작을 모델링하여 더 큰 진폭의 동작을 생성하고 동작 법칙을 준수할 수 있습니다.

이번에는 더욱 적절한 모델 훈련 덕분에 Keling AI가 생성하는 전반적인 모션 효과가 더 유연해졌으며 합리성을 약화시키지 않으면서 더 넓은 범위의 모션을 지원합니다. 아래에 표시된 새끼 고양이의 회전 및 걷는 자세는 모두 매우 자연스럽고 합리적이며 신체적 사실과 일치합니다.

두 번째는 분 단위의 장편 영상 생성 기능입니다. 이제 1분 단위의 지속 시간은 보다 효율적인 멀티샷 처리, 더 긴 스토리텔링, 보다 일관된 모션 확장 기능이 필요한 비디오 생성 모델을 평가하는 데 중요한 지표가 되었습니다.

현재 Keling AI는 몇 분 분량의 1080p, 30fps 비디오를 생성할 수 있습니다. 동시에 사용자 지시에 따른 영상 연속 기능이 오픈되며, 1회 연속 재생 시 영상 이동이 4~5초 지연됩니다. 최대 3분 길이의 영상을 생성할 수 있습니다. 연속 중에도 계속해서 스토리 전개 방향을 지정할 수 있어 사용하기 쉽습니다.

이번 업그레이드 이후 Keling AI는 알고리즘과 엔지니어링 수준에서 공동으로 심층적인 최적화를 수행하여 단일 생성된 동영상의 길이를 5초에서 10초로 늘려 공개 제품 중 가장 긴 지속 시간을 달성했습니다. , 보다 완전한 스토리 라인을 제시하고 사용자에게 더 넓은 창작 공간을 제공할 수 있습니다.

Sankeling AI는 복잡한 물리적 세계 특성을 시뮬레이션할 수 있습니다. 소라 이후 다양한 영상 생성 모델들은 모델 능력의 상한선을 결정하는 물리적 법칙을 준수하는 영상 생성에 큰 관심을 기울여 왔습니다.

Keling AI는 출시 이후 실제 속성을 정확하게 모델링하고 시뮬레이션하여 새끼 고양이 목욕시키기와 같이 생성된 비디오를 현실에 가깝게 만들 수 있었습니다.

이제 더욱 완벽한 모델 교육 지원으로 Keling AI의 대화형 물리 법칙에 대한 모델링 및 시뮬레이션 기능은 새로운 수준에 도달했습니다.

치시클링 AI의 개념 조합과 명령 응답 능력은 매우 강력합니다. 기술적 구현 측면에서 Keling AI는 텍스트에서 비디오까지 교차 모달 의미론에 대한 깊은 이해를 통해 사용자의 풍부한 상상력을 특정 비디오 이미지로 쉽게 변환하여 커피잔 화산과 같은 상상력을 발휘할 수 있도록 합니다.

업그레이드된 Keling AI는 더 나은 텍스트 데이터 및 인코딩 방식을 채택하여 사용자 프롬프트 단어에 대한 반응성을 자연스럽게 향상시키고 더 나은 시각적 렌더링 효과를 제공합니다.

이 모든 기능은 Keling AI의 비디오 생성 기술 경로(DiT 아키텍처 사용), 모델 설계(예: 잠재 공간 인코딩 및 디코딩, 시간 정보 모델링, 텍스트 확장 및 인코딩), 데이터 보증(예: 다차원 태그 시스템)에서 파생됩니다. , 비디오 설명 모델), 컴퓨팅 효율성(예: 분산 훈련 클러스터, 단계적 훈련 전략) 및 기능 확장(예: 비디오 타이밍 확장, 다중 모드 입력 제어 가능)과 같은 측면에서 기술 축적 및 고유한 혁신입니다.

오늘날의 Keling AI는 기술적으로 발전하고 신뢰할 수 있다고 할 수 있습니다. 이 기술이 출시되자마자 사람들이 찾는 것은 당연합니다.

제너레이티브 AI 시대, Kuaishou가 준비했습니다

지난 1년여간 대형 모델 분야 전체가 매우 바빴다고 할 수 있습니다. 작년에 우리는 기본 모델 개발에 대해 이야기했고, 올해는 모두가 애플리케이션에 대해 이야기하고 있습니다. 최근 WAIC 컨퍼런스가 열리면서 우리는 '모델 학교'와 '응용 학교' 사이에 또 다른 논쟁의 물결을 목격했습니다.

이번 웨이브에서 콰이쇼우는 무엇을 하고 있나요?

우선 시스템으로 플레이합니다. 기본 IDC 컴퓨팅 센터부터 네트워크 아키텍처 및 AI 플랫폼, 중간 계층의 기본 핵심 대형 모델, 애플리케이션 계층의 다양한 애플리케이션 탐색에 이르기까지 Kuaishou는 완전한 자체 연구 및 개발 세트를 구현했습니다. 이 시스템에 대해 이야기할 때 Kuaishou의 부사장이자 대형 모델 팀의 책임자인 Zhang Di는 독립적인 연구 개발에 대한 확고한 투자가 장기적으로 "기술적 눈덩이" 효과와 엄청난 비용 이점을 가져올 것이라고 믿습니다. 달리다. Kuaishou의 가장 큰 장점은 상위 계층에 수많은 AI 응용 시나리오가 있어 대규모 모델 구현에 많은 기회를 가져올 수 있다는 것입니다. ㅋㅋㅋ ~ . 기본 모델에 따라 연구 투자의 양적 변화가 질적 변화로 이어질 수 있는 반면, 새로운 기술을 단계적으로 적용하고 피드백을 점진적으로 수집할 수 있습니다. 선순환을 형성합니다.

작년부터 Kuaishou는 초기 13B 매개변수 크기에서 175B로 빠르게 성장한 "KwaiYi" 대형 모델을 제안하고 다중 모드 버전을 출시했습니다. 여러 버전의 반복을 거쳐 Ruiyi의 대형 모델은 Kuaishou의 내부 자료 생성, AI 상호 작용, 콘텐츠 제작 및 기타 시나리오에서 역할을 하기 시작했습니다. 올해 6월에는 Ruiyi 기반 AIGC 마케팅 자료의 일일 소비량이 2천만 개를 초과했습니다.
Kuaishou는 기본 모델을 통해 점차 더 많은 시나리오에서 고유한 차별화된 기능을 개발해 왔습니다.
특히 Wenshengtu에서 Kuaishou의 "Ketu"는 강력한 의미론적 이해와 명령 따르기 기능을 갖춘 업계 최고의 모델 중 하나가 되었습니다. 텍스트 표현의 혁신과 이미지 데이터 정렬에 대한 많은 작업 덕분에 Ketu는 강화 학습 훈련 후 카메라 수준의 그림 텍스처를 그릴 수 있으며 미학도 보편적인 인간 표준에 맞춰 조정되었습니다. 영상 세대 측면에서 “Keling AI”는 글로벌 영상 세대 분야에서 새로운 경쟁의 불을 붙였습니다. 텍스트 기반 비디오와 사진 기반 비디오를 제작할 수 있으며 풍부한 이미지 편집 기능을 갖추고 있으며 비디오 생성의 제어성, 질감, 아름다움 및 모션 합리성 측면에서 업계 최고의 성능을 유지하고 있습니다. Kuaishou 엔지니어들은 계속해서 엔지니어링 알고리즘을 최적화하고 비디오 생성 AI의 임계값을 낮추기 위해 노력하고 있습니다.
기준 설정에 관해 말하자면, 신기술의 최적화는 현재 생성 AI가 직면한 중요한 과제 중 하나입니다. 국가 수준의 단편 비디오 애플리케이션인 Kuaishou의 장점은 AI 애플리케이션 시나리오가 많아 시나리오와 구현 기회를 제공한다는 것입니다.
기술 구현에서 Kuaishou는 일련의 이정표를 달성했습니다.

앱 댓글 영역에 있는 Kuaishou의 대화 모델 애플리케이션 "
AI Xiaokuai
"는 동영상 내용을 이해하고 사용자와 상호 작용할 수 있습니다. 지금까지 테스트를 거쳤으며 천만 명 이상의 팬을 축적했습니다.

전자상거래 생방송실에서는 문성도 AI '
사진 찍기
' 능력을 활용해 퇴역 군인들도 자신의 인생 사진을 활용해 빠르게 옷을 입어보고 역동적인 디스플레이도 볼 수 있다.

동영상 생성 모델 "
KeLing AI
"은 출시 이후 총 700만 개의 동영상을 생성하며 원스톱 콘텐츠 제작 플랫폼을 오픈했습니다.
콘텐츠 제작, 이해, 추천 및 기타 수준, 개인에서 전자 상거래에 이르기까지 Kuaishou의 생성 AI 기능은 주요 비즈니스를 완벽하게 포괄하며 Kuaishou 생태계의 지속적인 발전을 지속적으로 촉진하고 있습니다.

드디어 새로운 시도가 있습니다. WAIC에서 Kuaishou는 첫 번째 AIGC 단편 드라마 '산과 바다의 이상한 거울: 파도를 자르는 것'이 이달에 공식 공개될 것이라고 발표했습니다.

이 연극은 Keling AI의 심층적인 기술 지원을 통해 사이버 스타일을 사용하여 산과 바다의 고전에서 고대 신화의 세계를 재현합니다. 예고편을 보면 산에서 바다, 숲에서 하늘까지 모든 장면이 놀라운 시각 효과를 선사합니다. 과거에는 이러한 효과를 위해서는 전문 특수효과팀이 필요했지만, 이제는 비주얼 생성 AI가 놀라운 시각적 경험을 선사할 수 있습니다.

네, 반년 전만 해도 우리는 여전히 미래를 상상하고 있었지만 이제 AI가 영화를 만들기 시작했습니다.

현재 대형 모델의 물결 속에서 대규모 구현보다 기술적 역량을 가장 잘 입증할 수 있는 것은 없습니다.

그리고 Kuaishou의 종합적인 실천은 AI의 생산성이 무의식적으로 우리의 삶을 변화시켰다는 것을 다시 한 번 확인시켜 주었습니다.

以上が体験しようと70万人が殺到！動画生成の新たな王様「Keling AI」が再びアップグレードの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

架构分布式循环算法人工智能 https AIGC zoom

声明：

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

前の記事：Google チームは、高効率でラベルを必要とせず、AI を使用して臨床データをマイニングし、遺伝子発見と疾患予測を改善し、その成果が Nature サブジャーナルに掲載されました。次の記事：Google チームは、高効率でラベルを必要とせず、AI を使用して臨床データをマイニングし、遺伝子発見と疾患予測を改善し、その成果が Nature サブジャーナルに掲載されました。

続きを見る