의료 산업은 가장 데이터가 풍부한 산업 중 하나이지만, 엄격한 개인 정보 보호 및 보안법으로 인해 데이터 과학자는 이 데이터로 많은 일을 할 수 없습니다. 그러나 이제 클라우드 컴퓨팅의 강력한 보안 설정과 개인 정보 보호 분석 덕분에 Providence Health는 데이터 과학자의 "수갑"을 풀고 빅 의료 데이터에 대한 혁신을 시작하고 있습니다.
Providence Health and Services는 52개 병원, 1,000개 이상의 진료소, 약 120,000명의 직원을 보유한 미국 최대 의료 그룹 중 하나입니다. 대부분의 의료 회사와 마찬가지로 Providence Health는 환자 데이터의 무결성을 유지하기 위한 조치를 취합니다. 결국, 위반할 때마다 $50,000의 벌금이 부과되는 HIPAA(건강 보험 이동성 및 책임에 관한 법률/의료 전자 교환법)를 위반하고 싶어하는 사람은 아무도 없습니다.
워싱턴주 렌톤에 본사를 둔 이 회사는 레거시 SQL Server 데이터 웨어하우스를 Microsoft Azure 클라우드로 마이그레이션하는 것을 시작으로 데이터 분석 아키텍처 업데이트에 착수하면서 보안이 가장 큰 관심사였습니다. 프로비던스의 데이터 과학 이사인 린지 미코(Lindsey Miko)는 회사가 2019년 말에 새로운 데이터 환경을 설정하기 위해 Databricks 및 다른 업체와 협력하면서 데이터에 대한 엄격한 통제가 유지되도록 추가 예방 조치를 취했다고 말했습니다.
Miko는 “Providence는 보안 클라우드에 대해 독특하고 높은 표준을 설정합니다.”라고 말했습니다. "제가 함께 일하는 모든 기술 회사는 이것이 안전한 클라우드의 모습이라고 생각합니다. 그러다가 그들은 우리와 함께 일하기 시작하고 곧 표준 설정에 대해 의구심을 갖게 됩니다. 우리는 Microsoft와 협력하고 있으며 구축할 Databricks 새로운 배포 아키텍처를 통해 우리는 공용 인터넷에서 격리되고 환자 데이터를 적절하게 보호할 수 있는 것이 필요했습니다.
Snowflake는 Providence의 새로운 클라우드 기반 데이터 아키텍처에도 포함되어 있습니다. 초기 프로젝트는 노후화된 SQL Server 웨어하우스를 Snowflake 데이터 웨어하우스로 마이그레이션하여 비즈니스 및 임상 데이터 분석을 위한 보다 확장 가능한 시스템을 제공하는 것이었습니다. 프로비던스는 여러 데이터 웨어하우스의 사용자를 수용할 수 있을 만큼 규모가 크므로 Databricks 및 Snowflake 환경은 독립적으로 존재합니다.
비용 관리는 전통적인 분석은 물론 기계 학습 모델 구축 및 실행을 위한 프로비던스의 새로운 클라우드 웨어하우스의 중요한 목표입니다. 가난하고 궁핍한 사람들을 돕는 사명을 가진 비영리 가톨릭 병원인 프로비던스는 합리적인 가격의 진료를 제공할 책임이 있으며, 분석은 그러한 점에서 도움이 될 수 있습니다.
"우리는 또한 의료에 비용 거품이 있다는 것을 알고 있습니다. 환자 비용은 항상 상승하고 있습니다. 의료 시스템의 마진은 매우 얇습니다. 이는 손실과 손실입니다."라고 그는 말했습니다. "따라서 데이터 및 분석을 활용하여 비용을 제어하는 방법을 찾는 것이 전체 의료 시스템의 기본입니다.
초기 사용 사례 중 일부에는 질병률 및 기간과 같은 환자 요구 사항을 예측하기 위해 기계 학습 모델을 사용하는 것이 포함됩니다." 숙박. 이러한 예측은 향후 2개월 동안 서비스 인력 요구 사항이 어떤 모습일지 프로비던스에 알려주는 인력 배치 모델에 반영됩니다.
클라우드의 무한한 탄력성은 회사가 이전에 사용했던 것보다 크게 업그레이드되었습니다. 데이터 웨어하우스 마이그레이션은 코로나19 팬데믹 이전에 시작되었지만 Miko와 그의 팀은 팬데믹 기간 동안 많은 작업을 완료했습니다. 이 의료 회사는 Epic Systems의 전자 의료 기록(EMR) 소프트웨어와 함께 기본적으로 제공되는 여러 기계 학습 모델을 활용했으며 제대로 작동했습니다. Epic의 최대 사용자로서, 머신러닝 모델의 성공은 Epic의 R&D 팀에 좋은 징조입니다.
동시에 원격의료를 포함한 차세대 시스템 구축을 가속화합니다. "우리는 준비가 되었습니다. 우리는 원격 의료를 처리할 수 있는 매우 강력한 인프라를 갖추고 있습니다. 많은 데이터를 원격 의료로 이동할 수 있다는 것입니다. 이는 또한 예측 분석의 개발을 주도하고 있습니다. 사망 위험, ICU 입원 기간 및 대유행 초기에 거기에 있습니다. 다른 여러 모델이 배포되어 있습니다. 이는 Epic에 내장된 애플리케이션입니다. 이것은 인공 지능이 임상 치료를 개선할 수 있는 더 많은 기회가 있는 긴 여정의 첫 번째 단계일 뿐입니다."라고 Miko는 말했습니다.
예를 들어 회사는 Epic에서 소스를 가져온 HL7(Health Level 7) 의료 파일에 대한 실시간 분석을 수행하고 있습니다. 이 데이터는 Spark Streaming을 사용하여 처리된 후 Databricks 웨어하우스의 양식에 실시간으로 로드됩니다.
그는 이렇게 말했습니다. "이 작업은 병원에서 무슨 일이 일어나고 있는지 실시간으로 볼 수 있는 임무 통제 센터를 구축하기 위해 시작되었습니다."
Mission Control Center의 초기 사용 사례 중 하나는 개별 병원의 리소스에 대한 가시성을 확보하여 들어오는 환자를 처리할 수 있는지 여부를 결정하는 것입니다. 이는 코로나19 팬데믹이 최고조에 달했을 때 매우 실질적인 위협이 되었던 병원 과밀화를 방지하는 데 도움이 되는 유용한 도구입니다.
분석과 인공 지능을 활용하여 비즈니스 및 임상 운영을 개선하면서 그는 다음과 같이 말했습니다. “의료 시스템에서 무슨 일이 일어나고 있는지, 즉 누가 있는지, 무엇이 필요한지, 그리고 그래프와 연결되어 다음에 무슨 일이 일어날지 예측할 수 있습니다. 그래서 저는 미션 컨트롤에 매우 관심이 있습니다."
회사는 그 중 일부를 활용하려고 합니다. 딥 러닝을 포함한 더욱 강력한 인공 지능 기술, 운영을 더욱 최적화하고 의료 서비스를 개선합니다. 특히 John Snow Labs 및 Spark NLP 모델과 협력하여 의사의 의료 기록에서 의미 있는 데이터를 추출할 수 있습니다.
이러한 수준의 민감한 데이터를 다룰 때는 보안과 개인 정보 보호가 가장 중요하므로 Spark NLP의 최우선 순위는 환자에 대한 의사 기록을 식별하는 것입니다. 이 의료 회사는 날짜, 이름, 주소, 우편번호와 같은 식별자를 인식할 수 있는 John Snow 연구실의 사전 훈련된 모델을 사용하고 있습니다.
프로비던스가 소유한 기술 및 서비스 회사인 Tegria의 수석 데이터 과학자 Nadaa Taiyab은 "놀랍도록 잘 작동합니다."라고 말했습니다.
Providence는 식별자에 태그를 지정한 후 더미 데이터를 사용하여 데이터를 교체함으로써 개인 건강 정보의 위험을 제거합니다. (PHI). 이 프로세스를 통해 Providence는 집계된 의료 데이터를 사용하여 고급 분석을 수행하고 기계 학습 모델을 교육할 수 있습니다.
난독화 단계는 PHI가 잘못된 손에 들어갈 위험을 줄이는 반면, 특히 기계 학습 모델을 사용할 때 실제 환자 데이터가 필요할 때가 있다고 Taiyab은 말했습니다. "이를 집계하면 환자 수준에서 무언가를 예측하려는 경우 기계 학습에 사용할 수 없습니다." "인구 수준에서 예측하려는 경우에는 한 가지입니다. 하지만 환자 수준 데이터”를 사용하여 환자 수준 예측을 수행합니다.
Providence는 시스템 생물학 연구소(ISB)를 통해 추가 의학 연구를 위해 환자 데이터를 사용할 수도 있습니다. ISB는 인간 게놈 프로젝트의 연구원 중 한 명인 Leroy Hood 박사가 설립한 워싱턴 주 시애틀에 본사를 둔 의료 분석 회사입니다. 프로비던스는 데이터 보안 작업을 통해 2016년에 인수한 ISB와 데이터를 공유할 수 있었습니다.
Miko는 프로비던스의 대규모 의료 데이터 웨어하우스를 채굴하는 ISB의 능력이 장기적인 코로나19와 같은 건강 상태에 대한 ISB의 연구에 중요할 것이라고 말했습니다. "이것은 안전한 클라우드 환경에서 데이터를 배포하고 통합할 수 있다는 것이 무엇을 의미하는지 보여주는 한 가지 예일 뿐입니다."라고 그는 말했습니다.
프로비던스가 의료 임무를 개선하기 위해 고급 분석 및 인공 지능을 사용하는 다른 방법을 모색함에 따라 안전한 클라우드 데이터 아키텍처 구축에 대한 투자가 성과를 거둘 것으로 예상됩니다.
“Providence는 의료를 위한 안전한 클라우드에 대한 청사진을 설계했습니다.”라고 Miko는 말했습니다. "많은 연습, 많은 학습, 파트너와의 많은 협업이 필요합니다. 모든 단계에서 이를 개선합니다. 배포 모델은 새로운 것을 배우면서 변경됩니다. 하지만 우리는 매우 견고한 청사진이 있다고 생각합니다. 데이터에 대한 접근은 이 분야의 발전을 가로막는 주요 장애물 중 하나입니다. 보안 및 개인 정보 보호 위험을 줄이기 위해 프로비던스가 수행한 작업은 좋은 첫 번째 단계이지만 더 많은 작업이 필요합니다.
위 내용은 보안 장벽을 극복하여 의료 데이터를 잠금 해제하는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!