>  기사  >  기술 주변기기  >  대규모 모델 응용 프로그램 탐색 - 기업 지식 관리자

대규모 모델 응용 프로그램 탐색 - 기업 지식 관리자

WBOY
WBOY앞으로
2024-01-08 08:49:431295검색

대규모 모델 응용 프로그램 탐색 - 기업 지식 관리자

1. 전통 지식경영의 배경과 과제

1. 기업 지식경영의 필요성

현대 기업에서 지식경영은 필수적인 연결고리입니다. 이는 기업이 내부 및 외부 지식 자원을 효과적으로 구성하고 활용하여 기업의 효율성과 경쟁력을 향상시키는 데 도움이 될 수 있습니다. 지식을 보다 효율적으로 관리하기 위해 많은 기업에서는 지식 관리자(Knowledge Steward)라는 개념을 도입했습니다. 지식 관리자는 기업 지식을 관리하고 전파하는 일을 특별히 담당하는 역할 또는 시스템입니다. 지식 관리자를 통해 기업은


대규모 모델 응용 프로그램 탐색 - 기업 지식 관리자

인터넷 애플리케이션의 급속한 발전과 지식의 폭발적인 성장으로 기업은 지식을 공유해야 하는 과제에 직면해 있습니다. 기업 내에서 어떻게 지식을 효과적으로 전달하고 공유할 것인가가 중요한 문제가 되었습니다. 지식 공유를 통해 기업은 업무 효율성을 높일 수 있을 뿐만 아니라 업무의 중복도 피할 수 있습니다.

또 다른 방법은 지식 공유 모델을 사용하여 기업에 권한을 부여할 수 있는 메커니즘을 구축함으로써 프로세스와 결과를 더 잘 최적화하고 기업의 운영 효율성을 높이는 것입니다. 이 모델을 통해 기업 내 직원은 자신의 지식과 경험을 공유하여 팀의 모든 구성원이 혜택을 누릴 수 있습니다. 지식을 공유함으로써 기업은 노력의 중복을 피하고 오류와 실수를 줄이며 도전과 변화에 더 잘 대응할 수 있습니다. 이는

또한 지식 관리자로서 의사 결정자에게 핵심 정보와 데이터를 제공하여 더 많은 정보를 바탕으로 결정을 내리는 데 도움을 줄 수도 있습니다. 지식 관리자는 강력한 정보 검색 및 분석 능력을 갖추고 있으며, 대용량 데이터에서 유용한 정보를 추출하고 통합 및 분석할 수 있습니다. 이러한 정보 및 데이터에는 시장 동향, 경쟁사 분석, 소비자 통찰력, 기술 개발 등이 포함될 수 있습니다.

또한 기업 직원의 업무량을 줄이고 정보 손실을 방지하며 직원 생산성을 향상시키는 것이 매우 중요한 요소입니다. . 업무 효율성과 고객 서비스 수준을 향상시켜 비용 절감 및 효율성 향상 목표를 달성합니다.

2. 기업 지식 관리 과제

대규모 모델이 있기 전에는 지식 관리자 구축 논리가 상당히 복잡했습니다. 일반적으로 우리는 지식베이스라는 개념을 사용하여 기업 지식 그래프나 기업 내부 데이터의 도움을 받아 지식베이스를 구축합니다. 그러나 이 건설 과정에는 많은 어려움이 따른다. 첫째, 지식베이스 구축에는 많은 인력과 시간 투자가 필요하다. 기업 내에서 지식과 정보를 수집, 구성 및 요약하는 것은 지루하고 시간이 많이 걸리는 작업입니다. 이 데이터를 처리하고 관리하고

대규모 모델 응용 프로그램 탐색 - 기업 지식 관리자

  • 지식 단편화

지식 단편화는 주로 두 가지 측면에서 반영됩니다. 분산, 예를 들어 OA 시스템의 데이터는 서로 다른 부서, 서로 다른 팀에 속합니다. 반면, 이러한 데이터는 기본적으로 워드, PDF, 사진, 동영상 등 비정형 형태로 제공됩니다. 지식 관리자를 구축하는 과정에서 단편화된 정보를 어떻게 신속하게 중앙 집중화하는 것이 첫 번째 과제입니다.

  • 정보 과부하

기업 비즈니스의 급속한 발전과 대량의 정보 및 데이터의 지속적인 출현으로 인해 정보의 정확성과 적시성을 보장하기 위해 대용량 데이터에 대한 심사 메커니즘을 구축하는 방법 역시 큰 문제다.

  • 데이터 보안 위험

회사는 일반적으로 개인 데이터를 다른 기관이나 조직과 공유하지 않습니다. 일반적으로 기업의 개인 도메인 데이터의 데이터 보안에 더 많은 관심을 기울이기 때문에 처리도 필요합니다. 데이터 보안 위험이 있습니다.

  • 지식 공유와 소통이 어렵습니다

회사마다 조직 구조가 다르며, 일부는 더 기술적이고 일부는 비즈니스 지향적이며 일부는 기술과 비즈니스가 혼합되어 있습니다. 비즈니스 및 기술 커뮤니케이션에 있어서, 빈약한 커뮤니케이션은 모든 기업이 지식 공유에 직면하게 되는 문제입니다.

2. 지식집사 솔루션

1. 기업지식집사란

기업지식집사는 사람의 두뇌와 유사하여 지식 전체의 저장을 돕고, 지식을 이해하고 창조하는 역할을 합니다.

대규모 모델 응용 프로그램 탐색 - 기업 지식 관리자

엔터프라이즈 지식 관리자는 일반적으로 세 가지 수준으로 나뉩니다. 첫 번째 수준은 기능적, 기술적 요구 사항으로 주로 기업 데이터 가져오기, 문서 자동 분류 및 보관 등 기업 지식 관리를 담당합니다. 기타 기본 기능의 요구 사항은 지능적인 질문과 답변, 지능적인 검색, 요약 생성, 보조 작성 및 기타 기능 제공을 포함하여 응용 프로그램 측면의 요구 사항입니다. 계약 검토, 보험 고객 서비스, 업계 보고서 생성 등이 포함됩니다.

Knowledge Butler는 일반적으로 세 가지 인터페이스 모드를 제공합니다. 첫 번째 인터페이스는 텍스트 상자와 유사하여 지식 탐색 및 분석을 제공하고, 다른 하나는 API 토큰을 사용하여 다양한 애플리케이션 시나리오에 관련된 지능형 에이전트를 통합하는 것입니다. 세 번째 방법은 대화 모드를 통해 지식을 탐색하고 분석하는 지능형 에이전트입니다.

2. 기업 지식 관리자 솔루션

기업 지식 관리자는 다음 비즈니스 시나리오를 포함하여 기업별 지식 관리 및 생성을 주로 담당합니다.

조합 기업의 개인 도메인 데이터는 벡터화되어 벡터 데이터베이스에 저장됩니다. 이는 질문 및 답변 모드를 사용하여 지능형 질문 및 답변 시나리오를 생성합니다. 이러한 시나리오를 통해 더 많은 구체적인 비즈니스 요구 사항을 도출할 수 있습니다.

대규모 모델 응용 프로그램 탐색 - 기업 지식 관리자

  • 셀프 서비스 문서 분석

문서 탐색 등 문서를 통해 탐색 및 분석을 수행하고, 논문 내용에 대해 질문할 수 있으며, 논문 내용에 대해 독립적인 분석을 수행할 수도 있습니다. 문서 전체를 분할된 미리보기, 상황별 검색, 요약 요약 및 기타 기능을 제공합니다.

  • 사용자 정의된 역할 시나리오

기업 내 다양한 ​​역할의 개인 도메인 데이터와 프롬프트 단어 모드를 결합하여 문서 작성 지원 및 스마트와 같은 일부 사용자 정의 시나리오의 디자인을 제공합니다. 회의록 등

  • 계약 검토

인간-기계 대화 모드를 채택하여 기업의 다양한 계약의 일부 핵심 조항 정보를 검토하여 해당 정보가 정확한지 확인합니다.

    Enterprise Knowledge Manager 제품의 주요 기능은 다음과 같습니다.

지능형 Q&A: 특정 질문과 결합하여 컨텍스트를 검색하여 소스 기반 답변을 얻을 수 있습니다.

다중 역할 크리에이티브 Q&A: 프롬프트 단어와 기업 비공개 도메인 데이터를 통해 지능형 응용 시나리오를 구축합니다.

대규모 모델 응용 프로그램 탐색 - 기업 지식 관리자

  • 문서 분석: 요약 또는 탐색 분석을 위해 전체 문서를 가져옵니다.
  • 지식 관리: 기업 데이터는 지식 관리자를 통해 완전히 자동으로 관리되며 전체 프로세스는 매우 간단한 모델을 채택합니다.
  • 에이전트 빌드: 개발 플랫폼, 즉 대형 모델 IDE 기능입니다.
  • Knowledge Manager의 기능적 아키텍처:
  • 하단은 GPU 컴퓨팅 파워로, 두 가지 카테고리로 구성됩니다. 하나는 추론 컴퓨팅 파워이고 다른 하나는 미세 조정 컴퓨팅 파워입니다. 중간 계층은 안전하고 신뢰할 수 있는 기업의 개인 도메인 데이터 메모리인 DingoDB 다중 모드 벡터 데이터베이스입니다.
모델 미세 조정 관리, 지식 문서 관리, 지능형 애플리케이션 관리 등 전체 기술 계층을 위한 또 다른 기능 포인트 계층입니다.

가장 중요한 것은 비즈니스 시나리오 기반 요구사항입니다. 지능형 Q&A에서는 일부 역할 대화, 표준 QA Q&A, 지능형 애플리케이션용 에이전트, 문서 기반 보조 읽기, 계약 검토 및 보험 개인 비서를 사용자 정의할 수 있습니다.

3. 지식집사 핵심기술 탐구

1. 지식집사 구축 과정

다음으로, 지능형 질의응답 시나리오를 통해 지식집사 구축 과정 전체를 소개하겠습니다.

대규모 모델 응용 프로그램 탐색 - 기업 지식 관리자

우선 데이터 소스가 있어야 합니다. 정형 데이터와 비정형 데이터가 있을 수 있습니다. 일반적으로 지식베이스 구축은 주로 Word, PDF, Excel 등의 비정형 데이터를 기반으로 합니다. 및 엔터프라이즈 시스템, Jira, 지식 관리 플랫폼 등

이러한 데이터는 지식처리를 거쳐 벡터로 변환되어 데이터베이스에 저장됩니다. 문서를 먼저 로드한 다음 문서의 레이아웃 정보나 구조 정보를 제공하고 문서 벡터 분석을 수행하여 파일 블록을 생성한 다음 파일 블록을 기반으로 해당 Embedding 모델을 호출하여 벡터로 변환하고 벡터를 저장해야 합니다. .

지능형 질문 및 답변 상호 작용 프로세스: 사용자가 질문을 제기한 후 먼저 지능형 보조자를 사용하여 질문을 벡터화한 다음 데이터베이스로 이동하여 의미론적 검색을 수행하여 유사한 의미론을 가진 기사의 맥락을 얻습니다. , 문맥을 통해 프롬프트 단어를 결합하고, 수많은 수를 거쳐 모델은 추론을 수행하고 최종적으로 답변을 반환합니다.

전체 프로세스는 지속적인 반복과 피드백 최적화의 프로세스입니다. 그래야만 기업의 프라이빗 도메인 데이터를 기반으로 독점적인 지능형 전문가 역할을 얻을 수 있습니다.

대규모 모델 응용 프로그램 탐색 - 기업 지식 관리자

2. 지식 청지기 구축 핵심 기술 탐구

  • 비정형 데이터 처리

대규모 모델 응용 프로그램 탐색 - 기업 지식 관리자

비정형 데이터 ETL 처리에는 일부 도움이 필요합니다. 도구. Knowledge Manager는 기술 모델의 일부 특수 연산자를 제공합니다. 이러한 연산자는 전체 맵, 필터 및 창 기반 변경 사항을 정리하고 전체 ETL 파이프라인을 통해 데이터를 변환할 수 있습니다.

다양한 파일(예: PDF 파서)을 구문 분석한 후 중간 계층에 해당하는 다양한 응용 시나리오의 허브 운영자를 통과하여 파이프라인 허브를 빠르게 구성한 후 데이터를 정리하고 변환할 수 있습니다. , 최종적으로 벡터 데이터베이스에 저장됩니다.

  • 정확성과 무결성 데이터 보장 - 무손실 데이터 분석

좋은 모델 디버깅 효과를 얻으려면 정확하고 완전한 데이터를 보장하고 데이터 처리 품질이 좋아야 합니다.

대규모 모델 응용 프로그램 탐색 - 기업 지식 관리자

전통적인 데이터 검색을 구성하는 것은 매우 간단하지만 실제 지식은 텍스트 자체의 정보 외에도 그림, 표 데이터, 단락 정보 등이 더 복잡합니다. 이와 관련하여 Jiuzhang Yunji DataCanvas는 레이아웃 정보, 표, 그림 등 다중 모드 데이터의 전체 저장을 실현하고 데이터 구문 분석 프로세스의 품질을 종합적으로 향상시킬 수 있는 레이아웃 구문 분석 모드를 제공합니다.

  • 강한 상관 검색 - 재순위 2차 심사

문서를 벡터화하여 DingoDB 다중 모드 벡터 데이터베이스에 저장한 후 Query를 통해 검색하고, 검색 내용 자체가 DingoDB에 포함됩니다. 검색 결과 결과에는 상관관계 결과도 포함됩니다. 이때 검색된 청크에 대해 Reranking의 2차 스크리닝을 수행해야 합니다.


대규모 모델 응용 프로그램 탐색 - 기업 지식 관리자

Reranking의 2차 심사 중에 검색 청크와 해당 쿼리는 가장 가까운 의미론적 일치를 찾은 다음 검색 푸시 대상을 다시 심사하는 것을 포함하여 상관 관계 의미론을 분석해야 합니다. 대규모 언어 모델.

  • 안전하고 신뢰할 수 있는 답변 생성 - 다중 명령 미세 조정


대규모 모델 응용 프로그램 탐색 - 기업 지식 관리자

답 생성 프로세스의 보안과 신뢰성을 보장하기 위해 Jiuzhang Yunji DataCanvas는 범용 회상에 적합한 대형 음성 모델 데이터는 프롬프트 단어를 제한하는 데 사용되며 대형 모델은 회사의 개인 도메인 데이터를 기반으로 한 수직 지식으로 미세 조정되었으며 풍향 제어 메커니즘과 결합되어 높은 정확도를 보장합니다. 답변 세대.

  • 저장 및 검색 기능 - DingoDB 다중 모드 벡터 데이터베이스

DingoDB는 다양한 API를 제공하고 SQL 및 Python 툴킷을 통해 데이터 쿼리를 지원하며 구조화를 달성하기 위한 통합 방법도 제공합니다. 구조화되지 않은 통합 쿼리. 실시간 시나리오의 경우 DingoDB는 쓰기를 통해 실시간으로 쿼리하는 기능을 제공하고, 데이터를 가져오는 동안 실시간 검색을 수행할 수 있습니다.


대규모 모델 응용 프로그램 탐색 - 기업 지식 관리자

DingoDB는 또한 계산 가속화 기능을 제공하여 메타 사전 및 사후 필터링과 유사성을 기반으로 한 범위 검색을 지원합니다. DingoDB는 부분 마이그레이션과 데이터 마이그레이션을 수행할 수 있는 다중 복사 도구도 제공하며, 운영 및 유지 관리 비용을 절감할 수 있는 다양한 운영 및 유지 관리 및 모니터링 도구도 제공합니다. DingoDB는 또한 각 노드에서 로드 밸런싱을 달성하기 위해 데이터를 여러 시스템에 동적으로 분산시킬 수 있는 자동 탄력적 샤딩 기능을 제공할 수 있습니다.

  • 안전하고 신뢰할 수 있는 독점 LLM-fine-tuning Pipeline

기업 개인 도메인 데이터에서 특정 시나리오에서 기업별 대규모 언어 모델을 구축하려면 일반적인 시나리오에 미세 조정이 필요합니다. 지식 관리자는 전체 미세 조정 과정에서 문제점을 요약하고, 문서 업로드를 통해 모든 문제에 대한 데이터를 도구 기반으로 제공합니다. 데이터를 확보한 후 매개변수를 구성하여 인터페이스에서 직접 미세 조정을 수행할 수 있습니다. 동시에 제품은 미세 조정 결과를 평가할 수 있는 일부 미세 조정 데이터 표시기도 제공합니다.

대규모 모델 응용 프로그램 탐색 - 기업 지식 관리자

  • 대형 모델 애플리케이션을 빠르게 구축 - 대형 모델 IDE

지식 버틀러는 Jiuzhang Yunji의 FS 기능을 기반으로 자체 대형 모델 애플리케이션을 구축하는 경우가 많습니다. DataCanvas 모델 IDE는 풍부한 구성 요소와 도구를 제공하고 간단한 애플리케이션 구성 방법을 통해 구축된 템플릿을 지능형 애플리케이션 에이전트에 게시할 수 있습니다.

대규모 모델 응용 프로그램 탐색 - 기업 지식 관리자

IV. 요약 및 전망

1. Knowledge Butler 프로그램 요약

Knowledge Butler의 기술적 특징은 주로 다음과 같은 6가지 측면을 포함합니다. 고정밀 검색, 편리한 ETL 파이프라인 , 고가용성 및 확장성, 보안 규정 준수, 지능형 데이터 융합 및 풍부한 시나리오.

대규모 모델 응용 프로그램 탐색 - 기업 지식 관리자

지식집사의 핵심가치는 지식관리의 기본역량과 지능적인 영감을 제공하고, 기업의 모든 데이터를 포함하여 안전하고 신뢰할 수 있는 애플리케이션 민영화 전개방식을 제공하여 지식관리 융합 및 지능적인 상호작용. 지능형 기반으로서 유연한 확장 기능을 제공하고 Knowledge Manager의 대규모 모델을 기반으로 새로운 Agent를 개발할 수 있습니다.

대규모 모델 응용 프로그램 탐색 - 기업 지식 관리자


2. 미래 전망

Knowledge Manager는 Jiuzhang Yunji DataCanvas를 기반으로 하는 AIFS로, 베어 메탈부터 GPU 컴퓨팅 성능 및 모델 스케줄링까지 완전한 파이프라인 모드 세트를 제공하고 모델 미세 조정을 구현합니다. 일반 언어 모델과 회사의 개인 도메인 데이터를 사용하여 조합 및 미세 조정을 수행하여 회사 고유의 대규모 언어 모델을 형성합니다. 대규모 언어 모델의 확장성을 기반으로 DingoDB 다중 모드 벡터 데이터베이스와 결합하여 기업 내 검색 Q&A, 요약 생성 및 기타 응용 프로그램을 실현하고 기업 지식 관리를 수행할 수 있습니다.

대규모 모델 응용 프로그램 탐색 - 기업 지식 관리자

위 내용은 대규모 모델 응용 프로그램 탐색 - 기업 지식 관리자의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 51cto.com에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제