>기술 주변기기 >일체 포함 >ChatGPT가 의료 서비스를 구현하려면 얼마나 걸리나요? 하버드 교수의 개인 테스트 성적은 의사 수준에 가깝고 윤지성은 산업판을 만들려고 노출됐다.

ChatGPT가 의료 서비스를 구현하려면 얼마나 걸리나요? 하버드 교수의 개인 테스트 성적은 의사 수준에 가깝고 윤지성은 산업판을 만들려고 노출됐다.

WBOY
WBOY앞으로
2023-04-12 12:28:021403검색

본 글은 AI 뉴미디어 큐빗(공개 계정 ID: QbitAI)의 승인을 받아 재인쇄되었습니다.

국내 플레이어들이 ChatGPT에 본격적으로 진출하고 있으며 다양한 산업 분야에서의 성공은 모두에게 분명합니다.

그러나 사람들이 언제 일을 시작할 수 있는지는 아직 명확하지 않습니다. 특히 의료와 같이 어렵고 장벽이 높은 일부 산업에서는 더욱 그렇습니다.

이제 하버드 의과대학 교수가 ChatGPT의 성능을 직접 테스트했습니다.

그 결과 45개 사례 중 39개 사례를 정확하게 진단하여 87%의 정확도(기존 기계의 진단률 51% 초과)를 제공했으며 30개 사례에 대해 적절한 분류 권장 사항을 제공했습니다.

ChatGPT의 보조 진단 성능이 의사 수준에 가깝다고 하더군요. 이런 경우 언제부터 일을 시작할 수 있나요?

사실 이는 대부분의 국내 플레이어가 직면한 문제이기도 합니다. 보너스가 여기 있는데 어떻게 먼저 가져가나요?

저희는 이전에 ChatGPT 중국어 버전을 복제하는 데 따른 기술적, 생태학적 어려움을 체계적으로 정리했는데, 이는 분명히 단기간에 달성할 수 있는 것이 아닙니다.

이제 새로운 아이디어가 등장했습니다. ChatGPT의 업계 수직 버전을 직접 생성.

이 방법이 가능한가요?

ChatGPT의 산업 버전을 구축하는 것이 가능합니까?

기술의 핵심인 ChatGPT의 생성은 컴퓨팅 성능, 데이터 및 알고리즘의 세 가지 요소를 우회할 수 없습니다.

컴퓨팅 성능 측면에서 OpenAI는 Microsoft에 의존합니다. 이는 285,000개의 CPU 코어와 10,000개의 NVIDIA V100 GPU를 갖추고 있습니다. GPT-3을 훈련시키는 데 드는 비용은 DataUp, GPT 시리즈입니다. 반복적으로 최적화되었으며, 한때 모두를 놀라게 했던 GPT-3는 1,750억 개의 매개변수를 가지고 있는 반면, 이전 버전 GPT-2는 15억 개의 매개변수만을 가지고 있습니다. 알고리즘은 당연히 수년간의 깊은 축적을 가지고 있습니다. '인간다운' 자율적인 학습 특성을 갖고 있으며, 나아가 다양한 분야와 시나리오에 빠르게 적응하는 능력을 보여준다.

생태학적 피드백 기술과 결합하여 반복적인 폐쇄 루프가 형성됩니다. OpenAI는 GPT-3 이후 개방형 인터페이스 형태로 자체

"GPT 생태계"를 구축했습니다. gpt3demo 웹사이트의 통계에 따르면 현재 GPT-3 시리즈 모델을 사용하여 개발된 애플리케이션이 656개 있습니다.

ChatGPT가 의료 서비스를 구현하려면 얼마나 걸리나요? 하버드 교수의 개인 테스트 성적은 의사 수준에 가깝고 윤지성은 산업판을 만들려고 노출됐다.

이러한

기술적, 생태적장벽으로 인해 ChatGPT를 위조하는 것이 그리 쉽지는 않습니다. 이 경우 업계에서는 ChatGPT의 수직 버전에 대한 솔루션도 논의되기 시작했습니다.

우선,

기술적 관점에서 이들의 핵심 과제는 수백억 개의 매개변수와 같이 더 적은 매개변수를 사용하는 수직 분야의 작업에서 ChatGPT의 효과를 달성하거나 초과하는 것입니다. 이것은 ChatGPT를 재현하는 것보다 더 어려울 수 있습니다. 매개 변수의 수가 훨씬 적고 "폭력적인 미학"에만 의존할 수 없으며 뛰어난 모델 디자인과 압축 기술도 필요하기 때문입니다.

또 다른 과제는

데이터 소스

의 차이입니다. 구글이나 마이크로소프트처럼 실제로는 자연스러운 일반 데이터 소스를 갖고 있지만, 그들의 전용 데이터 축적은 수직 플레이어와 비교할 수 없습니다.

특히 의료와 같은 생활 산업에서는 전문성이 높고 적용 범위가 넓습니다. 필요한 고품질 데이터는 ChatGPT보다 작지 않을 수 있으며 대부분의 데이터는 온라인으로 캡처할 수 없습니다.

ChatGPT가 의료 서비스를 구현하려면 얼마나 걸리나요? 하버드 교수의 개인 테스트 성적은 의사 수준에 가깝고 윤지성은 산업판을 만들려고 노출됐다.

그러나 수년 동안 이에 깊이 뿌리를 둔 수직 플레이어에게는 이미 자체 산업 생태계를 구축하고 풍부한 산업 데이터와 지식 축적을 보유하여 ChatGPT 재생산에 필요한 기반을 마련했습니다.

그리고

가치 수요

의 관점에서 수직 산업이 대표하는 가치는 실제입니다. 예를 들어 의료에 대한 수요 자체는 적지 않습니다. ChatGPT가 의료에 구현되면 큰 사회적 가치를 나타낼 것입니다. 과거에는 사용자들이 질병 진단을 돕기 위해 습관적으로 검색과 APP를 사용했지만 결과가 미미한 경우가 많았습니다.

하버드 의과대학 Ateev Mehrotra 교수는 기존 온라인 진단의 평균 정확도가 51%에 불과한 반면 ChatGPT는 87%라는 테스트를 한 적이 있어 ChatGPT가 의료 진단의 판도를 바꿀 수 있는 잠재력을 갖고 있다고 믿습니다.

ChatGPT 애플리케이션의 구현을 가속화하기 위해 기술적 난이도와 가치 수요의 관점에서 ChatGPT의 수직 버전을 만드는 것이 가능합니다.

그리고 이제 중국에는 이미 이 일을 하고 있는 AI 플레이어들이 있습니다.

Yunzhisheng ChatGPT Industry Edition

최신 공개 진행 상황, 지능형 음성 트랙 유니콘 Yunzhisheng은 ChatGPT Industry Edition 구축을 추진하고 있습니다. -

의료를 ChatGPT Medical Industry Edition 구축의 진입점으로 사용하는 동시에 기반 ChatGPT 산업 버전에서는 플랫폼이 다른 분야로 빠르게 확장된 다음 도메인 모델이 MoE(Mixture of Experts) 기술과 통합되어 일반 ChatGPT 모델을 교육합니다.

그리고 이 아이디어는 특별함부터 일반까지 다양합니다. 사실 그것은 윤지성의 일관된 “U+X” 접근 방식이다. 여기서 "U"는 범용 대형 모델 알고리즘 개발 및 효율적인 학습 기반 플랫폼을 의미합니다. "X"는 여러 산업 분야에서 사용되는 전용 대형 모델 버전을 의미합니다.

실제로 이는 많은 기업들이 ChatGPT에 진입하는 아이디어가 되고 있습니다. 이러한 방식으로 기존 전용 데이터를 활용할 수 있습니다.

그러나 Yunzhisheng이 생성된 콘텐츠의 품질에 대한 요구가 더 높은 의료 산업을 진입점으로 선택한 것은 말할 것도 없이 쉽지 않습니다.

가장 중요한 문제는 의학 지식의 신뢰성을 높이는 것입니다. ChatGPT가 가장 잘하는 것은 말도 안되는 소리를 진지하게 말하는 것입니다. 실제로 채팅 검색과 콘텐츠 제작을 이제 Bing에 올려놓는 것은 큰 문제가 되지 않으며, 사용자들은 이를 즐기고 있습니다.

그러나 업계에 적용할 경우 비전문가가 감지하기 어려운 경우가 많아 다양한 위험을 초래할 수 있습니다. 따라서 ChatGPT의 산업 버전은 특히 콘텐츠 생성 요구 사항이 매우 높고 내결함성 비율이 낮으며 데이터 품질 요구 사항이 더 높은 의료, 교육, 산업 등과 같은 산업에서 모든 넌센스를 종식시켜야 합니다. .

둘째, 업계에서 '가성비'를 달성하는 것입니다. 어떤 기술이 대규모로 구현되려면 '어떻게 하면 제한된 자원으로 효과를 극대화할 수 있는가'라는 문제를 해결해야 합니다.

이것은 ChatGPT 산업이 구현되는 유일한 방법이기도 합니다. 모델은 더 작은 매개변수 규모로 ChatGPT와 동일한 효과를 얻을 수 있습니다. 이는 또한 이들 회사에 많은 문제를 가져옵니다.

실제로 Yunzhisheng도 ChatGPT 산업 버전의 매개변수가 수백억 규모에 도달해야 할 수 있으며 효과적인 결과를 달성하고 대규모 적용을 달성하는 것이 결코 작지 않다는 점을 인정했습니다.

ChatGPT의 산업 버전을 구축하는 것은 현재의 범용 ChatGPT보다 어느 정도 어렵지만 ChatGPT 산업이 실제로 구현되면 이러한 문제는 해결되어야 합니다. 정리하자면 ChatGPT 엔지니어링 역량을 실현하는 것입니다.

이것은 게임에 참여하는 모든 사람이 피할 수 없고 반드시 통과해야 하는 길입니다.

이를 바탕으로 Yunzhisheng의 선택이 더 어렵다는 것은 의심의 여지가 없습니다. 즉 의료를 진입점으로 삼는 것입니다. 이는 늘 산업 장벽이 높고, 전문성이 강하며, 기술적인 어려움이 있는 분야로 여겨져 왔던 분야이며, 다른 산업의 번영에 비해 의료 AI 플레이어가 거의 없는 이유이기도 합니다.

그러나 ChatGPT의 의료용 버전이 오픈되면 최종 범용 대형 모델을 포함한 다른 분야의 구현은 절반의 노력으로 두 배의 결과로 완료됩니다.

2012년 설립된 AI 기업으로 최첨단 AI 기술에 주목해 왔으며, 2012년 딥러닝 알고리즘의 고도화 및 산업적 적용을 비롯해 Atlas 슈퍼컴퓨팅 플랫폼 및 2016년 지식 그래프와 풀스택 AI 기술 애플리케이션, 현재 ChatGPT 프레임워크 기반 AGI 인지 기술 업그레이드까지.

동시에 그는 거의 10년 동안 의료 산업에 깊이 관여하며 업계 지식, 데이터 및 응용을 축적했습니다. 또한 2019년 베이징 과학 기술 발전상에서 1등상을 받았습니다.

ChatGPT가 의료 서비스를 구현하려면 얼마나 걸리나요? 하버드 교수의 개인 테스트 성적은 의사 수준에 가깝고 윤지성은 산업판을 만들려고 노출됐다.

ChatGPT의 산업 버전을 구축하는 데 자신감이 있는지에 대해 Yunzhisheng은 다음과 같이 말했습니다. 완전히 자신감이 있습니다.

요약하자면, ChatGPT 구축은 고품질 데이터, 선도적인 알고리즘 및 충분한 컴퓨팅 성능과 불가분의 관계에 있습니다. ChatGPT의 수직 버전에는 더 깊은 엔지니어링 기능도 필요합니다.

이러한 측면에서 Yunzhisheng은 실제로 업계의 참고 자료입니다.

데이터 측면에서, Yunzhisheng은 지난 10년 동안 환자 중심 지도, 사전 상담, 환자 교육 및 후속 시스템, 임상 중심 음성을 포함한 광범위한 산업 데이터를 축적했습니다. 의료 기록, 의료 기록 품질 관리, 단일 질병 품질 관리 및 의료 위험 관리 시스템은 거의 400개 병원에서 구현되었습니다. 데이터 규모가 5T에 이르렀다고 하며, 의료 업계의 대규모 언어 모델을 위한 데이터 기반을 제공하고 있습니다.

알고리즘, ChatGPT로 대표되는 인지 지능 그 자체가 Yunzhisheng의 핵심 기술 장점입니다. 그들은 국내 최대 규모의 의학 지식 그래프 중 하나를 구축했습니다. 2019년부터 2022년까지 Yunzhisheng의 인지 지능 기술은 국내외 관련 평가에서 7번의 우승과 5번의 준우승을 차지했습니다. 자체 개발한 의료 사전 훈련 언어 모델 CirBERTa는 한때 중국 의료 정보 처리 과제 목록에서 1위를 차지했습니다.

컴퓨팅 성능 측면에서 Yunzhisheng 슈퍼컴퓨팅 플랫폼의 부동 소수점 컴퓨팅 성능은 초당 80억 회에 도달할 수 있으며, 이는 수천억 개의 매개변수가 있는 모델에 컴퓨팅 성능을 보장할 수 있습니다.

대형 모델 엔지니어링 측면에서 Yunzhisheng은 CirBERTa 모델을 개발하고 GPT-2 모델을 재현했으며 모델 압축 및 지식 증류 메커니즘을 사용하여 온라인 추론 효율성을 거의 100배 가속화하여 제공하는 기반을 마련했습니다. 대형 모델의 폭넓은 적용을 위해.

또한, ChatGPT의 산업 버전인 만큼 콘텐츠 품질 보증도 핵심적인 부분입니다.

Yunzhisheng이 제공하는 솔루션은 CirBERTa에 적용된 지속적인 학습 및 지식 임베딩 기술을 사용하여 기존 지식 그래프의 축적을 기반으로 ChatGPT 모델의 지식 획득 및 업데이트 메커니즘을 최적화하는 것입니다.

보고서에 따르면 이는 ChatGPT 답변의 지식의 정확성을 보장하는 동시에 지식 추적 정보도 제공할 수 있습니다.

또한 Yunzhisheng의 업계 최고 수준의 의료 기록 품질 관리 기술을 사용하면 생성된 의료 기록에서 자동으로 문제를 발견하고 ChatGPT의 핵심 기술로 인간의 피드백을 기반으로 강화 학습을 자동으로 생성할 수 있습니다(RLHF, Reinforcement Learning from Human) 피드백) 모델 최적화를 가속화하려면 사용자 피드백 데이터가 필요합니다.

ChatGPT 보너스를 먼저 먹어치울 사람은 누구일까요?

마지막으로 사건 자체로 돌아가서, ChatGPT가 업계에 미치는 가치에 대한 이전 논의는 모두 인간-컴퓨터 상호 작용, 정보 배포, 콘텐츠 제작 등 거시적 수준의 산업 생태학 및 모델 혁신의 관점에서 나온 것이었습니다.

현재 점점 더 많은 수직적 기업이 업계에 진출함에 따라 기업에 대한 ChatGPT의 중요성도 부각되고 있습니다. 새로운 AGI 기술 패러다임 선택: "대규모 일반 기본 모델 + 경량 산업 애플리케이션 최적화"를 기반으로 하는 산업 지식 통합 그리고 문제 해결 방법.

과거에는 이러한 시나리오의 플레이어들이 AI 탐색에 대해 "산을 산으로 보고, 산을 산이 아닌 것처럼 본다"는 무지 상태에 있었을 수도 있지만 이제는 " 산이 작아지고 길이 있을 줄도 안다."

ChatGPT가 보여준 "지능"은 그들에게 명확한 기술적 방향을 제시했습니다.

Yunzhisheng CEO Huang Wei는 AlphaGo와 비교해도 ChatGPT의 영향이 훨씬 더 깊고 새로운 "산업 혁명"에 해당한다고 믿습니다.

이 혁명의 가장 큰 장점은 자기 감독 주의 메커니즘을 통해 대규모 비지도 데이터를 최대한 활용하여 일반 기본 모델을 훈련하고 통합 프레임워크를 사용하여 인식의 "엔드 투 엔드" 통합을 달성할 수 있다는 것입니다. , 인지 및 생성. 고품질 생성 결과에서 직접 기계 지능을 제시합니다. 기계가 채택한 인위적으로 유도되는 데이터 기반 학습 방법은 인간의 논리적 사고 모드와 완전히 다릅니다. 이는 비행기가 사용하는 제트기의 "공기 역학" 메커니즘과 유사하며, 이는 비행기가 채택하는 "날개 퍼덕임" 방법과 완전히 다릅니다. 조류.

산업 전체이든 개별 기업이든 ChatGPT가 제공하는 가치는 실제로 따라갈 수 없게 만듭니다.

특히 일부 시나리오의 플레이어의 경우 여전히 ChatGPT 보너스를 소모할 가능성이 가장 높은 그룹입니다.

ChatGPT 기능이 있으면 시나리오, 데이터 및 깊은 업계 장벽이 있으므로 업계에서 가장 먼저 구현할 수 있습니다. 이는 다른 플레이어가 얻을 수 없는 선점자 이점입니다.

마지막 AI 웨이브가 닥쳤을 때 가장 먼저 AI 보너스를 활용한 것은 현장 플레이어들이었습니다. 단지 이제 ChatGPT가 기술적인 경로를 통해 직접적으로 나타나고 구현 속도가 자연스럽게 이전보다 훨씬 빨라졌을 뿐입니다.

Yunzhisheng CEO Huang Wei도 다음과 같은 명확한 시점을 제시했습니다.

연내 성공적인 신청 계획이 구현될 것입니다.

위 내용은 ChatGPT가 의료 서비스를 구현하려면 얼마나 걸리나요? 하버드 교수의 개인 테스트 성적은 의사 수준에 가깝고 윤지성은 산업판을 만들려고 노출됐다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 51cto.com에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제