>기술 주변기기 >일체 포함 >ChatGPT와 생성적 AI가 디지털 혁신에서 의미하는 것

ChatGPT와 생성적 AI가 디지털 혁신에서 의미하는 것

PHPz
PHPz앞으로
2023-05-15 10:19:121202검색

ChatGPT와 생성적 AI가 디지털 혁신에서 의미하는 것

ChatGPT를 개발한 회사인 OpenAI는 자사 웹사이트에서 Morgan Stanley가 실시한 사례 연구를 보여줍니다. 주제는 "Morgan Stanley Wealth Management는 방대한 지식 기반을 구성하기 위해 GPT-4를 배포합니다." 사례 연구에서는 Morgan Stanley의 분석, 데이터 및 혁신 책임자인 Jeff McMillan의 말을 인용하여 "이 모델은 자산 관리 콘텐츠에 대한 포괄적인 검색을 수행하고 Morgan Stanley Wealth Management의 축적된 지식을 효과적으로 잠금해제할 챗봇입니다.”

McMillan은 다음과 같이 강조했습니다. “GPT-4를 사용하면 기본적으로 자산 관리 분야에서 가장 지식이 풍부한 사람의 지식을 즉시 얻을 수 있습니다. 이를 우리의 최고 투자 전략가, 최고 글로벌 이코노미스트, 글로벌 주식 전략가 및 기타 모든 분석가로 생각하십시오. 우리는 이것이 우리 회사의 혁신적인 역량이라고 믿습니다."

이것이 지식 관리의 궁극적인 목표입니다. 지식을 기업에 제공하고 시스템, 프로세스 및 프로세스에 구현된 전문 지식을 제공하는 것입니다. 고객과 소통하는 도구.

이 목표가 실제로 달성되었습니까? 생성 AI가 지식 접근, 검색 및 적용에 대한 해답입니까? 정보 혼란에 대한 승리를 선언하기 전에 몇 가지 기본 요소와 고려 사항을 고려하는 것이 중요합니다.

첫째, 생성 AI가 지식 관리 문제를 극복할 수 있다는 인식 이면에는 지식이 명시적이고 문서화된 형태로 존재한다는 가정이 있습니다. 그러나 대부분의 기업에서 지식은 직원의 머릿속에 갇혀 있으며, 디지털 형식으로 저장되면 부서, 기술, 저장소로 구성된 생태계 내의 사일로에 분산됩니다. OpenAI는 Morgan Stanley가 자본 시장, 자산 등급, 산업 분석 및 글로벌 경제 지역을 다루는 수천 개의 논문을 매년 발행한다고 웹 사이트에서 지적합니다. 이러한 풍부한 지식은 Morgan Stanley에게 독특한 경험을 제공합니다. GPT-4를 사용하여 처리 및 구문 분석할 수 있을 뿐만 아니라 내부적으로 제어할 수도 있습니다. Morgan Stanley는 ChatGPT의 대규모 언어 모델을 사용하기 위한 기반을 형성할 수 있는 지식을 보유하고 있습니다. 기업 콘텐츠 및 지식 리소스에 액세스할 수 없거나 품질이 낮거나 고객 및 직원의 요구 사항과 일치하지 않는 경우 ChatGPT는 이러한 요구 사항에 응답하는 특정 지식에 액세스할 수 없습니다.

두 번째, 생성 인공지능이 콘텐츠를 만듭니다. 이는 검색 메커니즘이 아닙니다. 그렇다면 원래의 지식 기반은 어떻게 사용됩니까? 이것은 까다로운 영역입니다. ChatGPT는 프롬프트에 따라 어떤 텍스트가 표시되어야 하는지 예측할 수 있도록 콘텐츠와 개념 관계의 패턴을 찾고 있습니다. 검색어가 신호인 것처럼 프롬프트는 신호입니다. 검색 엔진은 용어뿐만 아니라 업계나 검색자의 역할 등 쿼리 시나리오와 관련된 기타 신호를 기반으로 어떤 정보가 표시되어야 하는지 예측합니다. 시나리오는 프롬프트에서 사실이나 문서의 형태로 ChatGPT에 제공되거나 응답의 기반이 되는 특정 정보를 지정하여 프로그래밍 방식으로 제공될 수 있습니다.

대규모 언어 모델 - 동의어 사전

대규모 언어 모델은 정보 본문에 포함된 용어, 개념 및 관계를 수학적으로 표현한 것입니다. 대규모 언어 모델의 힘은 사용자 의도(요청이 표현되는 방식에 관계없이 사용자가 찾고 있는 것)를 이해하고 사용자의 의도에 가장 잘 응답할 가능성이 높은 단어 패턴을 예측하는 능력에 있습니다. 모델은 사용자의 요청을 "이해"하고 무엇을 반환해야 할지 예측합니다. 검색 엔진은 비록 다른 메커니즘을 통하더라도 사용자 쿼리를 기반으로 예측을 수행합니다. 검색 엔진은 인공 지능 시나리오에서 검색을 생성하는 데 사용될 수 있습니다. 의미 검색 또는 신경 검색 엔진을 사용하여 콘텐츠를 검색하고 대규모 언어 모델을 사용하여 사용자에 대한 응답 형식을 지정합니다.

Thesaurus는 선호하지 않는 용어를 선호하는 용어에 매핑합니다(예: "SOW" 및 "작업 명세서"는 문서에 태그를 지정하는 선호 용어인 "제안"에 매핑됩니다). 대규모 언어 모델의 한 측면을 "동의어 사전"으로 생각하십시오. 단어뿐만 아니라 구문과 개념도 포함됩니다. 사용자는 다양한 방법으로 동일한 질문을 할 수 있습니다. 이 의도 분류는 새로운 것이 아니며 문구 변경 사항을 특정 작업으로 구문 분석하는 챗봇의 기초입니다. 언어 모델은 의도 구문 분석 및 분류 기능의 기초입니다.

대형 언어 모델은 프롬프트에 따른 단어 패턴도 이해합니다. 이것이 ChatGPT 세션 유창성을 활성화하는 방법입니다. 이를 기업에 유용하게 만드는 핵심은 모델을 특정 콘텐츠나 지식 체계에 맞게 조정하고(Morgan Stanley가 ChatGPT를 구현할 때 수행한 작업) 기업 고유의 용어를 통합하는 것입니다.

특정 콘텐츠가 포함된 대규모 언어 모델을 사용하는 방법을 보여주는 예제 코드가 포함된 많은 튜토리얼이 있습니다. 예를 들어, 해당 동영상은 개발자에게 GPT-4와 같은 언어 모델을 사용하고 특정 지식과 콘텐츠를 챗봇에 알려주는 과정을 안내합니다.

기업을 위한 지식 관련 봇

이 튜토리얼을 검토한 후 관찰된 사항은 다음과 같습니다.

맞춤형 지식 관련 챗봇은 대규모 언어 모델을 사용하여 사용자 요구 사항을 이해한 다음 지정된 지식 소스 결과에서 반환할 수 있습니다. 개발자들은 콘텐츠를 "의미상 의미 있는" 섹션으로 "청크"해야 할 필요성을 지적했습니다. 특정 질문에 답하기 위해 설계된 구성 요소화된 콘텐츠는 완전하고 상황에 맞아야 합니다. 이 상태에서는 일반적으로 지식이 존재하지 않는다는 점에 유의하는 것이 중요합니다. 구성요소화하려면 큰 문서와 텍스트 본문을 여러 단위로 나누어야 합니다. 예를 들어, 사용자 매뉴얼은 장, 절, 문단, 문장별로 부분을 나눌 수 있습니다. 기술 문서의 세계에서는 이것이 이미 완료되었습니다. DITA(Darwin Information Classification Architecture)와 같은 표준은 질문에 답하는 데 이상적인 주제 기반 접근 방식을 사용합니다.

개발자들은 "의미론"과 이것이 얼마나 중요한지에 대해 이야기합니다. 의미론은 의미에 관한 것입니다. 의미가 풍부한 콘텐츠에는 필요한 정보와 정보의 맥락을 정확하게 검색할 수 있는 메타데이터가 태그로 지정됩니다. 예를 들어, 사용자가 특정 라우터 모델을 사용하고 해당 라우터가 오류 코드를 내보내는 경우 지원 봇에 도움을 요청할 때 해당 식별자로 태그가 지정된 콘텐츠를 검색할 수 있습니다. 이 프로세스는 챗봇 세계에서는 "보간"이라고도 알려져 있습니다.

사용자 정의 콘텐츠는 유사한 문서를 클러스터링하고 검색할 수 있는 다차원 공간(수학적 구성)에 문서를 배치하는 또 다른 수학적 정보 모델인 "벡터 공간"으로 수집됩니다. 이것을 "임베딩"이라고 합니다. 임베딩에는 특정 답변이 사용자에게 제공된 이유를 문서화하는 데 도움이 되는 메타데이터 및 식별자(예: 참조 소스)가 포함될 수 있습니다. 이는 법적 책임과 규제 목적뿐만 아니라 정확하고 가장 권위 있는 정보가 사용자에게 제공된다는 보장을 위해 중요합니다.

인공지능 훈련의 정의

"훈련"에 대해서는 여러 가지 견해가 있습니다. ChatGPT 및 대규모 언어 모델은 대량의 콘텐츠에 대해 훈련되어 사용자 쿼리를 이해하고 올바른 형식의 대화식 최적의 답변으로 응답할 수 있습니다. 도구를 훈련시키는 한 가지 방법은 프롬프트에 "다음 정보를 바탕으로 이 질문에 대답하세요..."를 포함하는 것입니다.

하지만 여기에는 두 가지 문제가 있습니다.

첫째, ChatGPT는 프롬프트 콘텐츠에서 특정 양만 처리할 수 있습니다. , 이 질문 방법은 매우 제한적입니다. 콘텐츠를 도구에 수집하여 추가 교육을 지원할 수 있습니다. 그러나 ChatGPT에 콘텐츠를 추가하면 해당 콘텐츠가 공개 모델에도 병합됩니다. 결과적으로 회사의 지적재산권이 침해될 수 있습니다. 이러한 위험으로 인해 많은 기업에서는 실수로 기업 비밀을 업로드하여 지적 재산을 손실한 ChatGPT 및 기타 AI 도구의 사용을 금지했습니다.

또한 콘텐츠를 훈련시키는 또 다른 방법이 있습니다. 대규모 언어 모델은 교육 자료의 일부로 기업별 지식을 사용할 수 있지만 이를 위해서는 방화벽 뒤의 버전을 제공해야 합니다. 다행스럽게도 대규모 언어 모델은 빠르게 상품화되고 있으며 일부는 랩톱에서 기본적으로 실행될 수도 있습니다. 이러한 유형의 훈련은 계산 비용도 많이 듭니다. 또 다른 메커니즘은 대규모 언어 모델을 사용하여 사용자의 목표(의도)를 해석한 다음 벡터 임베딩을 사용하여 특정 데이터 또는 콘텐츠 소스의 시나리오를 프로그래밍 방식으로 제공하는 것입니다.

그런 다음 언어 모델은 응답을 처리하고 형식을 지정하여 대화식으로 만들고 완전하게 만듭니다. 이러한 방식으로 기업의 영업 비밀과 지적 재산이 손상되지 않도록 지식이 대규모 언어 모델과 분리됩니다.

이 모든 요소는 사용자가 특정 질문에 대한 답변을 얻을 수 있도록 정보를 구성 요소로 구성하는 지식 관리 및 지식 아키텍처의 필요성을 나타냅니다. ChatGPT의 대규모 언어 모델과 혁신적인 특성은 거의 인간 수준의 상호 작용으로 긍정적인 고객 경험을 지원하는 데 필요한 대화의 유창함을 제공합니다. 핵심 요소는 기업 내 잘 구조화된 지식에 대한 접근입니다. ChatGPT는 놀랍게 보이지만 정보의 통계적 처리와 패턴 예측을 기반으로 합니다. 정보가 올바르게 구성되고 통합된다면 비즈니스의 디지털 혁신에서 중요한 부분이 될 수 있습니다.

위 내용은 ChatGPT와 생성적 AI가 디지털 혁신에서 의미하는 것의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 51cto.com에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제