지난 며칠 동안 ChatGPT로 촉발된 검색 엔진 전쟁으로 인해 Google과 Microsoft 사이에 불꽃이 튀었습니다.
멀리서 지켜봐도 이 AIGC 열풍이 인류 사회의 운영 방식을 영원히 바꿀 수도 있다는 것을 깊이 느낄 수 있습니다.
어제 '제너레이티브 AI 폭발'을 주제로 한 New Smart Talk 2단계가 공식적으로 시작되었습니다.
New Wisdom Talk의 진행자는 New Wisdom의 창립자인 Yang Jing입니다. 이번 호의 게스트는 NVIDIA China의 Omniverse 대표인 He Zhan입니다.
호스트와 게스트들이 연이어 행복해한 뒤, 드디어 뉴 와이즈 토크의 새 편 녹화가 시작되었습니다. 이번 호의 주제는 '제너레이티브 AI 폭발'이다. ㅋㅋㅋ 프로그램.
2022년은 우리 인간이 돌고 있는 것처럼 AI도 조용히 진화하고 있습니다. 따라서 2022년은 생성적 AI가 폭발하는 해가 되었습니다.
제너레이티브 AI의 인기를 완벽하게 입증할 수 있는 것은 두 가지입니다.
예를 들어, 국내 유명 록 밴드 완먼 유스호스텔의 'Kill That Shijiazhuang Man'이라는 작품이 스테이션 B에서 갑자기 인기를 끌었습니다. 그 이유는 각 가사를 AI가 이미지와 매칭했기 때문이다.
많은 사람들에게 친숙해야 할 또 하나의 사실입니다. 미국의 한 게임 디자이너는 AI를 활용해 그림을 그린 뒤, 그 그림을 활용해 미술대회에 참가해 실제로 1등을 차지했다. AI가 예술 분야에서 인간을 이긴 것은 역사상 처음이기도 하다.
마찬가지로 NVIDIA Omniverse의 강력한 반복도 이를 반영합니다. 이제 사용자는 디지털화를 통해 쉽게 디지털 트윈과 가상 디지털 사람을 생성할 수 있으며, 이는 메타버스 구축을 위한 견고한 기반을 마련합니다.
Deng Ziqi "홍해 건너기", NVIDIA 가상 무대 축복
Ms. Yang Jing은 매우 흥미로운 발언을 했습니다. 지난 6개월 동안 인간이 이 과정에 참여했고 AI도 실제로 참여했습니다. 단계.
예를 들어 2023년 장쑤위성TV 신년전야 콘서트에서 덩쯔치가 '계시록'의 '글로리아'를 부를 때 갑자기 그의 주위에 거대한 파도가 나타났는데, 이는 AIGC의 기술과 AR 기술이 만들어낸 것이다.
이 시각적 프레젠테이션은 중국 수억 명의 시청자가 직접 눈으로 볼 수있는 것, 메타 버스의 충격입니다.
그리고 이 무대 뒤에는 NVIDIA의 몇 가지 블랙 기술이 지원됩니다. He Zhan은 현장에서 암호 해독을 수행했습니다.
예를 들어 이런 바닷물 특수 효과는 콘텐츠 생성에 있어서 중요한 적용 방향입니다. 이 무대는 XR 기술을 활용하고 이를 AIGC에서 생성된 최신 기술과 결합하여 화려한 시각적 향연을 선사합니다. 이러한 기술 뒤에는 그래픽의 발전도 있었습니다.
두 번째 블랙 기술은 NVIDIA의 AI 딥 러닝 가속 알고리즘 최적화입니다. 무대에서는 대규모 훈련 모델 반복 형성의 효과입니다.
예를 들어 바닷물에는 많은 시뮬레이션과 더 많은 모델 훈련 데이터 세트가 필요합니다. 드디어 무대에 오르면 관객들은 현장에 몰입하면서 아름다운 노래를 감상할 수 있다.
위의 배경을 바탕으로 Yang Jing 씨는 He Zhan에게 이렇게 물었습니다. 이렇게 빠르고 강력한 반복의 이면에는 이러한 생성 AI 물결 속에서 인공지능 생성 콘텐츠(AIGC) 뒤에 어떤 알고리즘이 있을까요? 젊은 사람들이 서핑하고 멋질 수 있도록 알고리즘과 컴퓨팅 성능에 대한 요구 사항은 무엇입니까?
He Zhan은 이 질문에 대해 여러 각도에서 훌륭한 답변을 주었습니다.
우선 AIGC와 생성 AI의 개념은 우리와 멀지 않습니다. AIGC의 개발 맥락을 더 잘 이해할 수 있게 해주는 몇 가지 역사적 노드가 있습니다.
이르면 1957년에 인공지능이 작곡한 최초의 현악4중주, 즉 최초의 인공지능 음악인 "장골 모음곡"이 있었습니다.
시기가 2007년으로 밀려나자 뉴욕대학교는 인공지능이 창작한 소설을 출간했습니다. 그 안에는 다양한 논리적 오류와 다양한 모호한 줄거리가 있지만, AI가 완벽하게 완성한 최초의 소설이다.
다음 시점은 2014년입니다. 올해에는 GAN(Generative Adversarial Network)이 등장했습니다.
이 세 시점은 생성 AI 또는 AIGC의 서로 다른 반복 단계입니다.
여기에는 매우 흥미로운 점이 있는데, 독자들도 눈치채셨을지 궁금합니다. -
AI 개발의 첫 번째 단계, 즉 최초의 AI 생성 음악 "장골 모음곡"의 탄생, 최초의 AI 생성 소설은 50년이 걸렸지만, 최초의 AI 생성 소설부터 GAN 네트워크 출현까지는 불과 7년이 걸렸습니다.
최근 몇 년간, 특히 지난 6개월 동안 생성 AI는 비가 내린 뒤 버섯처럼 솟아올랐습니다. 텍스트 투 이미지 DALL-E2, Midjourney, Stable Diffusion 등이 있습니다. 이러한 모델은 1~2주 안에 반복되는데 이는 매우 빠릅니다.
2014년에 방금 언급한 GAN 세대를 포함한 딥러닝 기술의 빠른 반복은 생성적 AIGC 기술의 개발을 크게 가속화했습니다.
젊은이들은 AIGC의 기술을 어떻게 활용해야 할까요? 허잔의 관점에서 미래는 끝없이 상상됩니다. 우리 모두는 창의적인 콘텐츠를 다루는 직업이 점점 더 많아지고 있다는 것을 알 수 있습니다.
기사 작성, 음악 제작, 후반 작업 등을 위해 방금 언급한 AI를 포함합니다. 이러한 다양한 애플리케이션은 젊은이들에게 탐색하고 탐구할 수 있는 많은 여지를 제공할 수 있습니다.
젊은이들이 이러한 변화를 받아들이고 계속해서 자신의 능력을 반복한다면 미래에는 무한한 잠재력을 갖게 될 것입니다.
2022년은 메타버스가 폭발하는 해이지만, 메타버스가 따라잡기 전에 신개념 AIGC가 빛의 속도로 인터넷에서 인기를 끌었습니다.
Sequoia Capital의 파트너들은 AIGC가 수조 달러 규모의 새로운 트랙을 형성할 것이라고 예측하는 기사를 GPT-3와 공동 집필하기도 했습니다.
Yang Jing 선생님이 질문했습니다. AIGC는 왜 2022년에 동풍을 이용하여 폭발할까요? 그 뒤에 숨어 있는 기술적 논리와 산업적 논리는 무엇인가? 그리고 Metaverse와 AIGC의 유사점과 차이점은 무엇입니까?
He Zhan은 GPT-3에 관해 이야기할 때 그 뒤에 있는 매개변수인 1,750억을 언급해야 한다고 설명했습니다.
GPT-3가 처음 출시되었을 때 많은 연구자와 개발자는 놀랐습니다. 불과 일주일 전, GPT-4의 워밍업에 대한 보도가 있었는데, GPT-4의 매개변수가 100조에 도달할 수 있다고 언급했습니다.
1000억 매개변수 레벨에 진입한 모델들, 이들이 만들어내는 콘텐츠는 앞으로 어떤 모습이 될까요? 이것은 누구나 기대할 수 있는 일이다.
GPT-3과 GPT-4는 메타버스의 콘텐츠 제작 역할을 합니다.
Metaverse 애플리케이션이 반복적으로 빠르게 발전하려면 가능한 한 많은 사람이 참여해야 합니다.
예를 들어 옴니버스 플랫폼에 모두가 참여하게 하려면 기술적인 한계점을 낮추어 모두가 더 많은 작품을 만들 수 있도록 해야 합니다.
이때에는 빠르게 생성할 수 있고, 빠르고, 좋고, 저렴할 수 있는 도구가 필요합니다.
그렇다면 생산성은 어디서 나오는 걸까요? 생성적 AIGC의 도구입니다.
현재 NVIDIA를 포함한 많은 회사에서 회의 시스템을 만들고 있습니다. 화상회의에는 맥신(Maxine) 알고리즘이 있다. 운전 중에 물을 마시고 싶다면 물을 마시러 갈 때 알고리즘이 얼굴을 새로운 얼굴로 교정해 다른 사람들이 당신이 화면을 쳐다봤다고 생각하게 만든다.
흠? 잠깐, 이거 낚시 아니지?
네 사실 이게 낚시입니다.
몇 주 전 NVIDIA에서도 흥미로운 사용자 교류가 있었습니다.
이런 생방송방을 원한다고 하더군요. 책에 액자나 예술작품이 있어야 합니다. 액자에 푸른 하늘, 흰 구름 등이 있어야 합니다. .
사실 이런 종류의 요구 사항은 스튜디오 무대만큼 까다롭지 않으며 이제 완전히 달성 가능합니다.
예를 들어 서재에 있는 배경화면의 경우 도구를 사용하여 원하는 스타일과 톤을 입력하면 실시간 효과가 생성됩니다.
요즘 이러한 기술의 발전은 개인의 창의성을 완전히 자극하고 있습니다.
예전에는 유화를 그려야 했지만 이제는 AI가 직접 빠르게 그림을 그릴 수 있다고 상상해 보세요.
Ms. Yang Jing은 이 아이디어가 정말 흥미롭다고 말했습니다. 이제 Weibo 및 WeChat의 비디오 계정 뒤에는 수천만 또는 수억 명의 사용자가 있기 때문입니다. AI를 활용해 특수효과나 영상을 제작할 수 있다면 분명 많은 사람들의 창작 욕구를 자극할 것입니다.
그럼 2023년에는 이 소원이 이루어질 수 있을까요?
He Zhan은 유명 연구 기관의 보고서를 인용했습니다. 이 보고서에 따르면 현재 전체 인공 지능 세대에서 생성 AI의 비율은 1% 미만입니다. 따라서 2025년에 10%에 도달할 수 있다면 놀라운 결과가 될 것이다.
생명과학과 의료 분야에서는 2050년까지 AI가 생산하는 의약품과 소재의 비율이 30%에 달할 수도 있습니다.
그렇다면 다양한 생성 AI 기술 중에서 어떤 것이 킬러가 될 수 있을까요? AIGC는 과연 언제 대중에게 공개되어 슈퍼 APP이 될 것이며, 어떤 기업이 절호의 기회를 얻게 될까요?
He Zhan은 가장 중요한 것은 이러한 애플리케이션에 필요한 킬러 애플리케이션을 식별하는 것이라고 믿습니다.
예를 들어, 전기 주전자를 디자인해야 하는데 게으르게 활용하고 싶은 경우 어떻게 해야 할까요?
이런 종류의 디자인을 사용자 정의할 수 있는 주요 제조업체의 3D 모델 생성 도구가 실제로 많이 있습니다.
예를 들어 Google의 DreamFusion과 NVIDIA의 Magic 3D는 텍스트만 입력하면 원하는 효과를 생성할 수 있습니다.
요약하자면, AIGC는 디자이너나 엔지니어의 요구를 충족할 수 있는 한 언제든지 폭발할 수 있습니다.
분명히 생성적 AI는 전자상거래, 미디어, 영화, TV 및 기타 산업에서 비디오 스크립트 작성, 게임 장면을 지원하는 데 사용될 수 있습니다. 세대, 디지털 사람들은 상품 운반, XR 제품 전시 등을 지원합니다.
이제 몇 단어만으로 스크립트나 짧은 비디오 또는 영화를 생성할 수 있습니다. 그리고 향후 AIGC가 대규모로 구현된다면 산업 체인의 어느 링크가 가장 큰 영향을 미치게 될까요?
He Zhan은 최근 비디오 계정에서 큰 인기를 얻고 있는 Shuang 드라마가 Shuangwen을 사용하여 촬영되었다고 답했습니다. 하지만 이 과정의 생산성은 실제로 부족합니다.
중국 Shuangju 뒤에는 약 100,000명의 제작진이 있다는 것을 아셔야 합니다. 이 100,000명은 전체 제작 체인의 마지막에 있으며, 그들의 작품이 무대에서나 대중화되기 위해서는 많은 손을 거쳐야 합니다. 화면이 작동합니다.
이 제작진분들 정말 고생 많으셨지만 큰 이득을 얻지 못하셨어요. 하지만 AIGC를 통해 쌍주를 빨리 생산할 수 있다면 한 무리의 사람들이 들어올 것이다. 기술적 한계점을 낮추면 생산성이 높아지고 자연스럽게 폐쇄 루프가 발생합니다.
게다가 시나리오 작가뿐만 아니라 약물 연구 개발, 교육 등의 분야에서도 제작, 출시, 경제적 이익에 있어 이러한 폐쇄 루프를 갖게 됩니다.
그러나 Yang Jing 씨는 다음과 같은 매우 비판적인 질문을 제기했습니다. 멋진 기사와 멋진 드라마가 클릭 한 번으로 생성될 수 있는데, 젊은이들이 그러한 도구에 너무 의존하여 상상력을 잃게 될까요?
He Zhan은 AI 도구가 사람들이 상상력을 잃지 않을 것이라고 확신한다고 말했습니다.
예를 들어 Nvidia는 작년 항저우에서 디자인 위크 행사를 열고 "Magic Pen Ma Liang"이라는 프로세스를 선보였습니다 - Nvidia Canvas. 왼쪽에 곡선을 그리고 오른쪽에 입력을 사용하여 AI가 그림을 만들 수 있도록 할 수 있습니다.
몇 획만 그리면 오른쪽에 실제 사진 같은 작품이 생성됩니다.
허잔에게 큰 감동을 준 것은 참석한 많은 어린이들이 어른들보다 훨씬 더 진지하고 세심한 주의를 기울인다는 점이었습니다. 그리고 많은 어른들이 농담을 하거나 수줍어하는 태도를 가지고 있습니다.
그래서 그들이 그린 그림은 어른들이 그린 그림보다 상상력이 더 풍부했습니다.
같은 AI 도구가 전혀 다른 작품을 만들어냅니다. 이는 입력된 상상이 다르면 작품이 이루는 효과도 전혀 다르다는 것을 말해준다. 그러므로 기술로 반복된 도구라 할지라도 인간의 상상력과 집중력은 여전히 불가분하다.
따라서 생성적 AI는 젊은이들의 상상력을 자극하고, 그들의 생각을 제약으로부터 자유롭게 하고, 그들의 상상력이 날개를 달게 할 수 있습니다. 미래에 등장하는 도구가 아무리 훌륭하더라도 최종 입력은 여전히 우리 자신에게 달려 있습니다.
그러고보니 최근 구글, 마이크로소프트, 메타 등 주요 업체들이 1위 경쟁을 벌이고 있다는 점을 언급해야겠다. OpenAI와 같은 새로운 유니콘도 최근 ChatGPT로 주목을 받으며 마이크로소프트로부터 100억 달러 이상의 투자를 받았습니다.
동시에 BAT 등 국내 주요 제조사들도 AIGC 분야에 돌진하고 있다.
어떤 선수가 선두 주자가 될까요? 2023년 기술 발전의 가장 큰 하이라이트는 무엇인가?
He Zhan은 국내 주요 인터넷 기업이 확실히 ChatGPT와 유사한 모델을 갖게 될 것이라고 믿습니다.
예를 들어 Alibaba의 온라인 쇼핑, Tencent의 소셜 네트워킹 등에 Lenovo 애플리케이션이 많이 있으며 대형 제조업체는 확실히 막대한 투자를 할 것입니다.
프로그램 마지막에 Yang Jing 선생님은 최근에 꾸었던 마법 같은 꿈에 대해 이야기했습니다. 꿈에서 같은 반 친구들이 그녀에게 인생에서 가장 기억에 남는 장면들을 숫자와 이미지로 생생하게 표현한 사진첩을 그녀에게 선물했는데, 마치 살아있는 인생책처럼 말이다.
이로부터 Yang Jing은 멋진 아이디어를 떠올렸습니다. AIGC 기술을 사용하여 사람의 이미지로부터 1년 또는 평생 동안 자동으로 가상 사진 앨범을 생성할 수 있을까요? 웨이보나 모멘트를 복습하고 싶다면 매일매일 이런 추억을 찾기는 힘들겠지만, AI를 활용해 이런 장면들을 복습하고 자동으로 인생책을 만들어낸다면 훨씬 쉬울 것이다.
He Zhan은 휴대전화가 때때로 우리를 밀어내는 것처럼 문제가 크지 않다고 말했습니다. 그리고 같은 논리가 적용됩니다.
지난 몇 년간의 데이터를 입력으로 사용하고 입력하고 생성할 수 있습니다. 그리고 좀 더 부드러워지거나 명랑해지도록 요청할 수 있으며, 생성된 사진 앨범에도 그에 상응하는 감정 표현이 포함됩니다.
Ms. Yang Jing은 한때 자신이 키웠던 Xiaodoudou라는 강아지에 대해 이야기했는데, 2020년에 세상을 떠났습니다. 그녀는 제품에 강아지 사진을 입력하면 강아지의 생활을 담은 사진첩이 생성된다는 광고를 본 적이 있다. 하지만 강아지 사진을 구체적으로 찾는 것은 번거로울 수 있기 때문에 AI가 갤러리에서 자동으로 사진을 검색할 수 있다면 분명 많은 사람들의 요구를 충족할 수 있을 것입니다.
He Zhan은 이 말을 듣고 매우 감동했습니다. 또한 도구가 점점 더 빠르게 발전하면 일반 사람들의 삶에 점점 더 많이 침투할 것이며, 예를 들어 일부 사람들은 이러한 도구를 사용하는 새로운 산업이 반드시 등장할 것이라고 믿었습니다. 도구는 새로운 앱으로 만들어집니다.
Yang Jing은 우리의 파트너, 애완 동물, 친척이 모두 우리 삶의 약점이자 가장 부드러운 부분이라고 말했습니다. 그들은 인간 본성의 가장 큰 자산입니다.
멋진 기사와 멋진 드라마 외에도 미래의 메타버스에는 대규모 가상 도시와 인간도 아닌 다양한 성격을 지닌 수많은 가상 스타들이 등장할 것입니다.
이러한 가상 스타와 실제 스타의 디지털 클론은 새로운 디지털 사진 앨범과 가상 영화를 생성하여 수많은 인생 책을 만들 수 있습니다. 미래에 AIGC는 새로운 디지털 행성, 디지털 지구, 심지어는 지구를 생성할 수 있는 능력을 갖게 될 것입니다. 모든 것을 포괄하는 디지털 메타버스?
He Zhan은 모든 것이 가능하다고 믿습니다. 이 모든 기술은 궁극적으로 생산성을 향상시키며, 이제 사람들이 그 부드러운 순간을 되돌아볼 수 있도록 사진 앨범을 생성하는 등 모든 사람의 요구가 이미 존재합니다. 사용자에게 필요한 것은 빠르고, 좋고, 저렴한 것입니다. 예를 들어 사진 앨범은 10위안 이상이면 생성할 수 있습니다.
프로그램이 끝나자 Yang Jing 씨는 다음과 같이 결론을 내렸습니다. Huang Renxun의 모토는 "돈 절약"이므로 빠르고 우수하며 강력한 생성 AI는 인류의 미래를 확실히 뒤바꿀 것입니다.
그래서 2023년에도 제너레이티브 AI가 우리를 홍해 건너게 해주고, 삶의 따뜻한 추억을 되새기게 해준 덕분에 2023년에는 제너레이티브 AI의 폭발이 더욱 기대됩니다. 다채로운 세계는 물론, 무한한 가능성과 행성 수준의 컴퓨팅 파워로 가득한 새로운 우주와 메타버스를 선사할 것입니다.
위 내용은 덩쯔치의 '홍해를 건너다'의 비하인드에는 엔비디아의 AIGC 블랙 기술이 숨어 있다!의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!