隨著IRIS 中向量資料類型和向量搜尋功能的引入,為應用程式的開發打開了一個充滿可能性的世界,這些應用程式的一個範例是我最近在公開競賽中看到的一個範例巴倫西亞衛生部要求提供一種工具來協助使用人工智慧模型進行ICD-10 編碼。
我們如何實現與所要求的應用程式類似的應用程式?讓我們看看我們需要什麼:
- ICD-10 代碼列表,我們將使用它作為 RAG 應用程式的上下文來搜尋純文字中的診斷。
- 經過訓練的模型,可對文字進行向量化,我們將在其中尋找 ICD-10 程式碼中的等效項。
- ICD-10 程式碼和文字的攝取和向量化所需的 Python 函式庫。
- 友善的前端,支援我們尋找可能診斷的文字。
- 對從前端收到的請求進行編排。
IRIS 為我們提供什麼來滿足上述需求?
- CSV 導入,可以使用 RecordMapper 功能或直接使用嵌入式 Python。
- 嵌入式 Python 讓我們實作使用所選模型產生向量所需的 Python 程式碼。
- 發布將從前端應用程式呼叫的 REST API。
- 互通性產品,允許在 IRIS 內追蹤資訊。
好吧,我們只需要看看開發的範例:
d[IA]靈知
與本文相關,您可以訪問已開發的應用程序,在接下來的文章中,我們將詳細了解如何實現每個功能,從模型的使用、向量的存儲和向量搜索的使用.
讓我們回顧一下應用程式:
導入 ICD-10 代碼
從設定畫面中,我們被告知 CSV 檔案的格式必須符合我們要匯入的 ICD-10 代碼。載入和向量化過程會消耗大量時間和資源,這就是為什麼 Docker 容器的部署不僅要配置 Docker 可用的 RAM 內存,還要配置磁碟內存,以防需求超出分配的 RAM:
# iris iris: init: true container_name: iris build: context: . dockerfile: iris/Dockerfile ports: - 52774:52773 - 51774:1972 volumes: - ./shared:/shared environment: - ISC_DATA_DIRECTORY=/shared/durable command: --check-caps false --ISCAgent false mem_limit: 30G memswap_limit: 32G
帶有ICD-10程式碼的檔案位於專案路徑/shared/cie10/icd10.csv,一旦達到100%,應用程式就可以使用了。
在我們的應用程式中,我們定義了兩種不同的診斷編碼功能,一種基於系統中接收到的 HL7 訊息,另一種基於純文字。
來自 HL7 的診斷捕獲
專案包含一些準備測試的HL7訊息,只需將/shared/hl7/messagesa01_en.hl7檔案複製到/shared/HL7In資料夾和相關生產將負責從中提取診斷結果並將其顯示在Web 應用程式中:
從診斷請求畫面中,我們可以看到透過 HL7 訊息傳遞收到的所有診斷。要將它們編碼為 ICD-10,我們只需點擊放大鏡即可顯示最接近收到的診斷結果的 ICD-10 代碼清單:
選擇後,我們將在清單中看到診斷及其相關的 ICD-10 代碼。透過點擊帶有信封圖示的按鈕,將使用原始訊息產生一則訊息,並包含在診斷段中選擇的新訊息:
MSH|^~\&|HIS|HULP|EMPI||||ADT^A08|592956|P|2.5.1 EVN|A01| PID|||1556655212^^^SERMAS^SN~922210^^^HULP^PI||GARCÍA PÉREZ^JUAN^^^||20150403|M|||PASEO PEDRO ÁLVAREZ 195 1 CENTRO^^LEGANÉS^MADRID^28379^SPAIN||555283055^PRN^^JUAN.GARCIA@YAHOO.COM|||||||||||||||||N| PV1||N DG1|1||O10.91^Unspecified pre-existing hypertension complicating pregnancy^CIE10-ES|Gestational hypertension||A||
這則訊息可以在路徑/shared/HL7Out
中找到明文診斷截圖
透過文字分析器選項,使用者可以包含將對其執行分析過程的純文字。該應用程式將搜尋 3 個詞形還原單字的元組(消除冠詞、代名詞和其他不太相關的單字)。分析後,系統將向我們顯示相關的帶下劃線的文本以及可能的診斷:
分析完成後,可以隨時從分析歷史記錄中查閱。
分析歷史
所有進行的分析都會被記錄並可以隨時查閱,能夠查看所有可能的 ICD-10 代碼:
在下一篇文章...
我們將了解如何使用嵌入式 Python,使用特定的 LLM 模型對用作上下文的 ICD-10 程式碼和自由文字進行向量化。
如果您有任何問題或建議,請隨時在文章中發表評論。
以上是d[IA]gnosis:使用 IRIS for Healt 開發 RAG 應用程式的詳細內容。更多資訊請關注PHP中文網其他相關文章!

Python在遊戲和GUI開發中表現出色。 1)遊戲開發使用Pygame,提供繪圖、音頻等功能,適合創建2D遊戲。 2)GUI開發可選擇Tkinter或PyQt,Tkinter簡單易用,PyQt功能豐富,適合專業開發。

Python适合数据科学、Web开发和自动化任务,而C 适用于系统编程、游戏开发和嵌入式系统。Python以简洁和强大的生态系统著称,C 则以高性能和底层控制能力闻名。

2小時內可以學會Python的基本編程概念和技能。 1.學習變量和數據類型,2.掌握控制流(條件語句和循環),3.理解函數的定義和使用,4.通過簡單示例和代碼片段快速上手Python編程。

Python在web開發、數據科學、機器學習、自動化和腳本編寫等領域有廣泛應用。 1)在web開發中,Django和Flask框架簡化了開發過程。 2)數據科學和機器學習領域,NumPy、Pandas、Scikit-learn和TensorFlow庫提供了強大支持。 3)自動化和腳本編寫方面,Python適用於自動化測試和系統管理等任務。

兩小時內可以學到Python的基礎知識。 1.學習變量和數據類型,2.掌握控制結構如if語句和循環,3.了解函數的定義和使用。這些將幫助你開始編寫簡單的Python程序。

如何在10小時內教計算機小白編程基礎?如果你只有10個小時來教計算機小白一些編程知識,你會選擇教些什麼�...

使用FiddlerEverywhere進行中間人讀取時如何避免被檢測到當你使用FiddlerEverywhere...

Python3.6環境下加載Pickle文件報錯:ModuleNotFoundError:Nomodulenamed...


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

Atom編輯器mac版下載
最受歡迎的的開源編輯器

SAP NetWeaver Server Adapter for Eclipse
將Eclipse與SAP NetWeaver應用伺服器整合。

PhpStorm Mac 版本
最新(2018.2.1 )專業的PHP整合開發工具

Dreamweaver CS6
視覺化網頁開發工具

mPDF
mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),