5월 27일 창업다크호스는 베이징에서 "2023 Leap•Dark Horse AIGC Summit"을 개최했습니다. 이번 컨퍼런스의 주제는 '새로운 세계를 예측하고 새로운 패턴을 구축하다'입니다. 저스틴 카셀(Justin Cassell) 전 카네기멜론대학교 컴퓨터과학부 부학장이자 'AI 전문가'로 알려져 있으며 다보스에서 열린 세계경제포럼(WEF) 컴퓨팅 글로벌 미래 협의회 전 회장과 360 그룹, Zhiyuan Research 연구소와 Kunlun Wanwei, Yunzhisheng, BlueFocus, Wondershare Technology, Zhizhichuangyu 등 업계 내 많은 기업의 고위 임원들이 참석하여 수천 명의 참가자들과 심도 있는 교류를 가졌습니다.
정상회담에서 Yunzhisheng의 창립자이자 CEO인 Huang Wei는 "지능형 미래로 가는 길"주제를 공유했습니다.
공유 내용은 다음과 같습니다.
처음에는 전문가가 하는 방식대로 작업을 수행하고 몇 가지 방법론을 기계에 넘겨주고 싶었습니다. 10년 전 기계는 오류 피드백을 통해 학습하기 시작했습니다. 이는 과거 인공지능 기술의 일반적인 단계와 경로이다.
오늘 OpenAI는 ChatGPT 및 사전 훈련 모델을 출시했으며 전체 지능이 더욱 의인화되었습니다. 첫째, 매우 강력한 컴퓨팅 성능을 사용하여 세상에 알려진 모든 텍스트를 읽고 대규모 모델을 형성하도록 훈련했습니다. 특히 아기의 뇌와 같아서 수백억 또는 수천억 개의 매개변수를 가질 수 있습니다. 인간의 뇌와 달리 아기는 기껏해야 부모의 외모와 성격만을 물려받지만, 대형 모델의 뇌는 지식과 지식을 물려받습니다. 이는 초기 상태일 뿐이며, 성장 과정에서 다양한 교육을 받게 될 아이들처럼 미세 조정 등 다양한 방법을 통해 전체 대형 모델의 진화가 더욱 의인화될 것입니다.
이것은 인공지능 전체의 변화입니다.
현재 AGI와 이전 AGI의 본질적인 변화는 무엇인가요? 2022년 12월 이전에 전체 인공 지능은 여전히 판별식 인공 지능으로 남아 판단 질문, 특수 시스템 및 지능형 모듈을 수행하여 일부 특정 작업을 수행합니다. 한편으로는 인공지능의 성능이 그다지 똑똑하지도 않고, "당신이 제공하는 것은 인공지능이다"라는 비판을 받기도 하여 과거에는 인공지능 능력의 한계가 낮았다.
두 번째, 많은 시나리오에서 고객 요구 사항은 매우 다양하지만 인공 지능의 기능은 그다지 강력하지 않습니다. 많은 회사와 팀은 이를 충족하기 위해 다양한 사용자 정의를 사용합니다. 인공지능 기업은 첨단 기업과 다르다. 지난 10년은 수작업 시대에 차별적인 AI밖에 할 수 없었다. 하지만 이제는 대형 모델과 더욱 강력한 일반 기능이 등장하고 인공지능이 산업 시대로 진입하기 시작했습니다.
신세대 및 출현 기능을 통해 하나의 모델로 다양한 시나리오에서 다양한 문제를 해결할 수 있습니다. 오늘날의 시대에 인공지능의 큰 모델은 발전기이다. 엔진이 발명되기 전에는 중동 국가들이 그다지 부유하지도 않았고, 석유의 가치도 그리 크지 않았다. 오늘날과 마찬가지로 데이터는 연료와 기능으로 전환될 수 있으며, 이 기능은 수천 개의 산업에 힘을 실어주는 데 사용될 수 있습니다.
윤지성에서는 왜 단기간에 자체 개발한 대형 모델을 출시할 수 있었나요?
2016년 알파고를 본 후, 북경연합의과대학병원 의사들의 업무 효율성을 크게 향상시키기 위해 의료제품을 병원에 도입했습니다. 병원 시나리오에서는 효율성 도구만으로는 충분하지 않습니다. 인공지능의 실제 지능은 인지 지능입니다. Transformer는 2017년에 제안되었습니다. 인지 지능에는 상대적으로 강력한 컴퓨팅 성능이 필요합니다.
이러한 기초를 바탕으로 학문적 측면과 공학적 측면 모두에서 많은 경험을 축적했습니다. 개인에게는 이러한 경험이 먹고살 수 있는 능력이지만, 기업에게는 시장에서 승리하기 위한 핵심 경쟁력입니다. ChatGPT 프레임워크를 살펴본 후 우리는 이 프레임워크 중 새로운 것이 없다는 사실을 발견했습니다. 우리는 이 기능을 신속하게 결합하여 대형 모델 개발에 투자했습니다.
3일 전 Shanhai라는 대형 상용 모델을 출시했습니다. 인간의 피드백을 기반으로 한 사전 훈련, 지시 미세 조정, 강화 학습을 거친 후 우리는 오랫동안 기다려온 새로운 기능을 확인했습니다. 그때 팀에서 이름을 지어볼까 고민 중이었는데, 그 동안 자주 여행을 다니면서 이름이 참 좋다고 생각했어요. 바다는 웅장하고 그 관용성이 크며, 이는 대형 모델의 무한한 생성 능력을 반영합니다. 산은 높은 산이며, 이는 바로 대형 모델의 생성 능력과 대형을 모두 강조하기 위한 것입니다. -규모 모델 모델 보안 준수 문제.
매우 흥미로운 현상이 있습니다. 춘절 이후부터 국내에서 대형 모델에 대한 관심이 집중되고 있지만 아무도 이에 대해 이야기하지 않고 확신도 없습니다. 지금까지 이 일은 기술만으로는 할 수 없다는 견해가 있었습니다. 사람이 있어도 훈련 비용이 매우 비싸고 비용이 많이 듭니다. 대형 모델은 과학적 혁명이나 새로운 알고리즘의 발명이 아니라 기존 알고리즘을 결합하여 더 크게 만드는 것입니다. 대부분 비용이 들고, 물론 많은 프로젝트가 관련됩니다. 요점이 맞습니다.
반면, 향후 10~20년 후에 대형 모델이 큰 기회가 될 것이라고 생각하고 BAT가 투자할 수 없어 포기한다면 아직 기회는 있다고 생각합니다.
지난 몇 년 동안 윤지성에게는 특별히 좋은 과학자가 필요하지 않았습니다. 심지어 과학자들은 컴퓨팅 파워를 그렇게 많이 사용하지도 않았고 현장이 어디인지도 모르기 때문에 이 문제는 그렇지 않다고 생각합니다. 나쁜. 시나리오를 갖춘 제조업체가 성공할 가능성이 가장 높습니다.
산하이라는 이름에는 또 다른 의미가 있습니다. 사랑하는 사람은 산과 바다로 분리되어 있고 산과 바다는 평평해질 수 있습니다.
산과 바다의 힘은 10종경기입니다. 생성 능력은 매우 주관적입니다. 장면을 구현할 때 언어 이해 능력이 매우 중요합니다. 과거에는 왜 인위적으로 지체되었다고 생각했습니까? 코딩 능력의 향상은 대형 모델의 추론 능력 향상에 도움이 될 수 있으며, 출력 결과는 국내법과 규정은 물론 도덕적 가치까지 준수해야 합니다. 또한 GPT-4 플러그인 아키텍처를 사용하여 기업과 고객에게 데이터 선택, 모델 훈련, 모델 배포까지 원스톱 서비스를 제공합니다.
대형 모델에는 왜 복잡한 논리적 추론 능력이 있나요? 오늘은 해냈는데 왜 500억 개의 매개변수가 더 나은지, 1000억 개의 매개변수 중 뉴런이 아직 활성화되지 않았는지 말하기는 어렵습니다.
그리고 의료도 있습니다. 처음에는 대규모 모델을 하고 있었는데, 많은 사람들이 윤지성이 수직적 산업 모델을 하고 있다고 생각했습니다. 우리는 가장 심각한 시나리오 중 하나인 의료에 도전했습니다. 사전 훈련 단계를 통해 수많은 의학 문헌, 논문, 서적, 의료 기록을 수집하고 변환 가능한 실제 레이블이 붙은 수천만 개의 데이터를 축적했습니다. 미세 조정 데이터에 추가합니다.
또한, 우리는 2019년 베이징 과학 기술 발전상에서 1위를 차지하기도 했습니다. 우승 프로젝트는 대규모 지식 그래프 구축의 핵심 기술과 응용입니다. 우리는 중국 최대 규모의 의학 지식 그래프 중 하나를 보유하고 있습니다. 지식 그래프를 지식 플러그인으로 분해하고 이를 대형 언어 모델에 내장하여 대형 모델을 의료 분야의 전문가로 만듭니다.
MedQA는 Google의 Med-PaLM, ChatGPT 및 GPT-4를 포함하여 매우 권위 있는 의학 지식 질문 및 답변 테스트 세트로, 모두 이 테스트 세트에 대한 평가 결과를 발표했으며 얼마 전 Shanhai는 평가에서 81점을 획득했습니다. 이는 GPT-4의 71점을 크게 웃도는 수준이다. 도메인 강화 후에는 대형 모델이 특정 분야의 전문가로 변신할 수 있습니다. 수평적 비교에 사용할 수 있는 또 다른 숫자가 있는데, 의과대학 졸업생이 임상의 시험에 합격할 수 있는 가장 높은 AI 점수는 456점입니다. 이는 도메인 강화를 통해 대형 모델이 얻은 슈퍼 능력입니다. .
대규모 모델을 구축하는 것은 상당히 어렵습니다. 많은 돈과 더불어 뛰어난 알고리즘 엔지니어와 알고리즘도 많은 능력이 필요합니다. 직관적으로 말하면 대형 모델 자체는 대규모 데이터 세트이고 대형 모델은 엔지니어의 작업입니다. Yunzhisheng이 몇 달 만에 매우 권위 있고 객관적인 평가 데이터를 생성할 수 있는 이유는 무엇입니까? 일반 분야에서는 Yunzhisheng이 최고 중 하나입니다.
컴퓨팅 파워 플랫폼은 단지 몇 장의 카드를 구입하여 연결하는 것이 아닙니다. Yunzhisheng은 거의 200P의 컴퓨팅 파워를 가지고 있으며 클러스터 사용 효율성은 상대적으로 적은 수로 매우 빠르게 모델을 훈련시킬 수 있습니다. 카드.
현재 GPU 클러스터 활용도는 50%에 달할 수 있습니다. 대형 모델에는 여러 카드가 필요합니다. 현재 업계 수준은 약 42%입니다. 대형 모델은 또한 3D 하이브리드 병렬 교육을 달성해야 합니다. 3D란 무엇입니까? 이는 모델의 병렬화, 데이터의 병렬화, 파이프라인의 병렬화를 의미하며 작업은 각각 계산을 위해 다양한 기계의 서로 다른 카드로 분리되어야 하며 최종적으로 응답 결과를 빠르게 얻을 수 있습니다. 또한, 모델 추론이 많이 최적화되어 추론 속도가 5배 향상되었습니다. 트레이닝 카드와 추론 카드를 분리하는 방법은 A800이며 추론 카드는 빠른 추론을 달성할 수 있습니다. 단일 카드 A6000.
또한 데이터는 매우 중요합니다. 데이터 규모, 데이터 다양성 및 데이터 고품질이 이제 10T 수준의 빠른 중복 제거를 지원할 수 있습니다. ChatGPT의 학습 횟수는 45T였지만 최적화 후에는 수백 G의 데이터가 사용되었습니다. 훈련. .
이러한 기능을 통해 Atlas 및 UniDataOps의 기능을 사용하여 Shanhai의 업계 고객에게 더 나은 서비스를 제공할 수 있습니다.
스마트 사물 인터넷도 회사의 중요한 사업입니다. 과거에 사용한 결과는 실제로 그다지 좋지 않았습니다. Shanhai가 설립된 후에는 기존의 모든 인터넷을 만들 수 있기를 바랍니다. 사물 제품.
의료는 우리가 낙관하는 방향입니다. 과거 의료 분야에서는 주로 두 가지 측면을 지닌 제품이었습니다. 첫째, 손으로 키보드를 치는 대신 마이크를 통해 직접 말할 수 있어 의사의 업무 효율성이 크게 향상되고 입력 시간도 단축되었습니다. 3시간부터 1시간까지의 의료 기록; 둘째, 의료 기록을 받은 후 AI 두뇌를 통해 의료 기록을 검토하여 오류가 있는지 확인하는 시스템도 있습니다. 모델 능력, 우리는 무엇을 할 수 있나요?
Shanhai의 비전은 인공 지능을 통해 상호 연결되고 직관적인 세상을 만드는 것입니다. 과거에는 기계가 사람에게 복종하게 만드는 것이 인공 지능의 정의였습니다. 오늘날 우리는 기계가 더욱 인간과 유사해지기를 바랍니다. 사람과 사물 사이의 소통은 더욱 직관적이 될 것이며, 새로운 기능은 새로운 제품과 새로운 비즈니스 모델을 가져올 것입니다. 저는 여기 있는 모든 사람들과 함께 대형 모델의 새로운 시대를 맞이할 의향이 있습니다.
다크호스 창업자 교류회에 참여하시려면 QR코드를 스캔하세요
↓↓↓
아래 QR코드를 스캔하세요
다크호스 AIGC 산업 캠프에 참여하세요
AIGC의 기본 논리를 이해하고 한 단계로 업계의 미래를 연결하세요
↓↓↓
공유하고, 좋아요를 누르고, 시청하여 3번 클릭 콤보를 완성하고 좋은 콘텐츠를 필요한 더 많은 사람들에게 전달하세요.
더 흥미로운 콘텐츠는 모두 i dark Horse 동영상 계정에 있습니다
↓↓↓
다크호스 커뮤니케이션 매트릭스를 팔로우하고 더 흥미로운 콘텐츠를 받아보세요
↓↓ ↓
위 내용은 기계를 의인화하자, '인공정신지체'에서 '인공지능'으로의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!