>백엔드 개발 >파이썬 튜토리얼 >d[IA]gnosis: Healt용 IRIS를 사용하여 RAG 애플리케이션 개발

d[IA]gnosis: Healt용 IRIS를 사용하여 RAG 애플리케이션 개발

WBOY
WBOY원래의
2024-08-29 06:32:351248검색

IRIS에 벡터 데이터 유형과 벡터 검색 기능이 도입되면서 애플리케이션 개발에 대한 가능성이 무궁무진해졌습니다. 이러한 애플리케이션의 예는 제가 최근 공개 콘테스트에서 공개한 것을 본 것입니다. 발렌시아 보건부는 AI 모델을 사용하여 ICD-10 코딩을 지원하는 도구를 요청했습니다.

요청한 것과 유사한 애플리케이션을 어떻게 구현할 수 있습니까? 무엇이 필요한지 살펴보겠습니다.

  1. 일반 텍스트 내에서 진단을 검색하기 위해 RAG 애플리케이션의 컨텍스트로 사용할 ICD-10 코드 목록입니다.
  2. ICD-10 코드에서 동등성을 찾을 텍스트를 벡터화하는 훈련된 모델입니다.
  3. ICD-10 코드 및 텍스트의 수집 및 벡터화에 필요한 Python 라이브러리입니다.
  4. 가능한 진단을 찾는 텍스트를 지원하는 친숙한 프런트 엔드.
  5. 프런트엔드에서 받은 요청을 조정합니다.

위 요구사항을 충족하기 위해 IRIS는 무엇을 제공하나요?

  1. RecordMapper 기능을 사용하거나 Embedded Python을 사용하여 직접 CSV 가져오기
  2. Embedded Python을 사용하면 선택한 모델을 사용하여 벡터를 생성하는 데 필요한 Python 코드를 구현할 수 있습니다.
  3. 프런트엔드 애플리케이션에서 호출될 REST API를 게시합니다.
  4. IRIS 내에서 정보를 추적할 수 있는 상호 운용성 프로덕션.

개발된 예제만 보면 됩니다.

d[IA]그노시스

이 기사와 관련하여 개발된 애플리케이션에 액세스할 수 있으며, 다음 기사에서는 모델 사용, 벡터 저장, 벡터 검색 사용 등 각 기능을 구현하는 방법을 자세히 살펴보겠습니다. .

지원서를 검토해 보겠습니다.

ICD-10 코드 가져오기

d[IA]gnosis: developing RAG applications with IRIS for Healt

구성 화면에는 CSV 파일이 가져올 ICD-10 코드를 준수해야 한다는 형식이 표시됩니다. 로딩 및 벡터화 프로세스는 많은 시간과 리소스를 소비하므로 Docker 컨테이너 배포에서는 Docker가 사용할 수 있는 RAM 메모리뿐 아니라 요구 사항이 할당된 RAM을 초과하는 경우를 대비해 디스크 메모리도 구성합니다.

  # iris
  iris:
    init: true
    container_name: iris
    build:
      context: .
      dockerfile: iris/Dockerfile
    ports:
      - 52774:52773
      - 51774:1972
    volumes:
    - ./shared:/shared
    environment:
    - ISC_DATA_DIRECTORY=/shared/durable
    command: --check-caps false --ISCAgent false
    mem_limit: 30G
    memswap_limit: 32G

ICD-10 코드가 포함된 파일은 프로젝트 경로 /shared/cie10/icd10.csv에서 사용할 수 있으며, 100%에 도달하면 애플리케이션을 사용할 수 있습니다.

우리 애플리케이션에서는 진단 코딩을 위한 두 가지 기능을 정의했습니다. 하나는 시스템에서 수신된 HL7 메시지를 기반으로 하고 다른 하나는 일반 텍스트를 기반으로 합니다.

HL7의 진단 캡처

프로젝트에는 테스트용으로 준비된 일부 HL7 메시지가 포함되어 있습니다. /shared/hl7/messagesa01_en.hl7 파일을 /shared/HL7In 폴더에 복사하고 관련 생산업체는 진단을 추출하여 웹 애플리케이션에 표시할 책임이 있습니다.

d[IA]gnosis: developing RAG applications with IRIS for Healt

진단 요청 화면에서는 HL7 메시지를 통해 받은 모든 진단을 볼 수 있습니다. ICD-10으로 코딩하려면 돋보기를 클릭하기만 하면 받은 진단과 가장 가까운 ICD-10 코드 목록이 표시됩니다.

d[IA]gnosis: developing RAG applications with IRIS for Healt

선택하면 목록에 진단 및 관련 ICD-10 코드가 표시됩니다. 봉투 아이콘이 있는 버튼을 클릭하면 원본을 사용하고 진단 세그먼트 내에서 선택한 새 메시지를 포함하는 메시지가 생성됩니다.

MSH|^~\&|HIS|HULP|EMPI||||ADT^A08|592956|P|2.5.1
EVN|A01|
PID|||1556655212^^^SERMAS^SN~922210^^^HULP^PI||GARCÍA PÉREZ^JUAN^^^||20150403|M|||PASEO PEDRO ÁLVAREZ 195 1 CENTRO^^LEGANÉS^MADRID^28379^SPAIN||555283055^PRN^^JUAN.GARCIA@YAHOO.COM|||||||||||||||||N|
PV1||N
DG1|1||O10.91^Unspecified pre-existing hypertension complicating pregnancy^CIE10-ES|Gestational hypertension||A||

이 메시지는 /shared/HL7Out

경로에서 확인할 수 있습니다.

일반 텍스트 진단 스크린샷

텍스트 분석기 옵션에서 사용자는 분석 프로세스가 수행될 일반 텍스트를 포함할 수 있습니다. 애플리케이션은 3개의 표제어로 구성된 단어 튜플을 검색합니다(관사, 대명사 및 관련성이 낮은 기타 단어 제거). 분석이 완료되면 시스템은 관련 밑줄이 그어진 텍스트와 가능한 진단 위치를 표시합니다:

d[IA]gnosis: developing RAG applications with IRIS for Healt

분석이 완료되면 분석 내역에서 언제든지 확인할 수 있습니다.

분석 내역

수행된 모든 분석은 기록되고 언제든지 참조할 수 있으며 사용 가능한 모든 ICD-10 코드를 볼 수 있습니다.

다음 글에서...

Embedded Python을 사용하여 컨텍스트와 자유 텍스트로 사용할 ICD-10 코드의 벡터화를 위해 특정 LLM 모델을 사용하는 방법을 살펴보겠습니다.

질문이나 제안사항이 있으시면 언제든지 기사에 댓글을 남겨주세요.

위 내용은 d[IA]gnosis: Healt용 IRIS를 사용하여 RAG 애플리케이션 개발의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.