醫療保健產業是資料最豐富的產業之一,但由於嚴格的隱私和安全法律,資料科學家無法利用這些資料做太多事情。但現在,由於雲端運算中強大的安全設定和隱私保護分析技術的使用,Providence健康公司開始解開資料科學家的“手銬”,並在大醫療資料上展開創新。
Providence健康與服務公司擁有52家醫院、1000多家診所和約12萬名員工,是美國最大的醫療保健集團之一。與大多數醫療保健公司一樣,Providence健康公司採取措施維護病患資料的完整性。畢竟,沒有人想要違反HIPAA(Health Insurance Portability and Accountability Act 健康保險攜帶和責任法案/醫療電子交換法案),每違反一次就要罰款5萬美元。
在這家總部位於華盛頓倫頓(Renton)的公司著手更新其資料分析架構時,安全性問題是他們最關心的問題,首先是將老舊的SQL Server資料倉儲到微軟Azure雲上。 Providence的數據科學總監林賽·米科表示,該公司在2019年底與Databricks和其他公司合作建立新的數據環境時,採取了額外的預防措施,以確保對數據保持嚴格的控制。
「Providence為安全雲設定了一個獨特的高標準,」米科說。 「與我合作的每家科技公司....認為這就是安全雲的樣子。然後他們開始與我們合作,他們很快就會對標準的設定產生疑慮。我們與微軟和Databricks攜手合作,打造新的部署架構,我們需要一些與公共互聯網隔絕的東西能夠妥善保護患者資料。」
Snowflake也參與了Providence新的基於雲端的資料架構。最初的專案是將老化的SQL Server倉庫遷移到Snowflake資料倉儲中,後者將為分析業務和臨床資料提供更可伸縮的系統。 Providence足夠大,可以容納多個資料倉儲中的用戶,因此Databricks和Snowflake環境是獨立存在的。
成本控制是Providence新雲端倉庫的一個重要目標,該雲端倉庫用於傳統分析以及建置和運行機器學習模型。作為一家非營利天主教醫院,Providence的使命是幫助窮人和有需要的人,它有責任提供負擔得起的醫療服務,而分析可以在這方面提供幫助。
「我們還知道,醫療保健存在成本泡沫。病人的費用一直在上漲。醫療保健系統的利潤極其微薄。這是雙輸,」他說。 「因此,找到利用數據和分析控製成本的方法——這是整個醫療保健體系的存在價值。」
一些最初的用例涉及到使用機器學習模型來預測患者需求,包括像發病率和住院時間等。這些預測被輸入到一個人員配置模型中,該模型告訴Providence,在接下來的兩個月裡,服務人員需求可能會是什麼樣子。
雲端的無限彈性是公司之前使用的重大升級。雖然資料倉儲在COVID-19大流行之前就開始了,但米科和他的團隊在大流行期間完成了大部分工作。這家醫療保健公司利用了Epic Systems公司的電子病歷(EMR)軟體自帶的幾個開箱即用的機器學習模型,這些模型運作良好。身為Epic最大的用戶,機器學習模式的成功對Epic的研發團隊來說是個好兆頭。
同時它加速了下一代系統的部署,包括遠距醫療。 「我們已經準備好了。我們有一個非常強大的基礎設施來處理遠距醫療。能夠向遠距醫療轉移大量的數據。它還推動了預測分析的發展。圍繞死亡風險、ICU住院時間和大流行早期的一些其他模型部署了一些模型。這些都是內建在Epic中的應用。這只是漫長旅程的第一步。人工智慧在改善臨床護理方面有更多的機會。」米科說。
例如,該公司正在對源自Epic的健康等級7 (HL7)醫療文件進行即時分析。使用Spark Streaming處理這些數據,然後將其實時載入到Databricks倉庫的表單中。
他說:「這項工作一開始是為了建立我們所說的任務控制中心,它可以即時查看醫院的情況。」
任務控制中心的早期用例之一是獲得單一醫院資源的可見性,以確定它是否能夠處理傳入的病人。這是有助於防止醫院人滿為患的有用工具,在COVID-19疫情高峰期,醫院人滿為患是一個非常現實的威脅。
利用分析和人工智慧改善業務和臨床運營,他說:「這是一個很好的起點,一旦你對醫療保健系統正在發生的事情有了即時的了解——誰在那裡,你需要什麼,並與他們的圖表聯繫起來——你就可以開始預測接下來會發生什麼。你可以開始優化關於臨床護理或手術的決策。所以我對任務控制非常感興趣。」
該公司正在考慮利用一些更強大的人工智慧技術,包括深度學習,以進一步優化其營運和改善醫療服務。具體來說,它正在與John Snow實驗室及其Spark NLP模型合作,以便能夠從醫生的病歷中提取有意義的數據。
在處理這種程度的敏感資料時,安全性和隱私性是最重要的,因此Spark NLP的首要任務是去識別關於病人的醫生記錄。這家醫療保健公司正在使用來自John Snow實驗室的經過預先訓練的模型,該模型可以識別日期、姓名、地址和郵政編碼等識別碼。
Providence旗下的技術和服務公司Tegria的高級資料科學家納達·泰亞布(Nadaa Taiyab)說,「它的工作效果令人驚訝地好。」
在標記標識符之後,Providence以虛擬數據取代數據,從而消除了私人健康資訊(PHI)的風險。這個過程使Providence能夠使用聚合的醫療資料進行進階分析和訓練機器學習模型。
Taiyab說,雖然混淆步驟降低了PHI落入錯誤之手的風險,但有時需要真實的患者數據,特別是在使用機器學習模型時。 「如果你把它聚合起來,就不能把它用於機器學習,如果你試圖在病人的層面上預測一些東西。」「如果你想在群體層面預測它,這是一回事。但你需要有患者層級的數據」來進行患者層級的預測。
Providence也可以透過系統生物學研究所(ISB),將其病患資料用於進一步的醫學研究。 ISB是一家位於華盛頓州西雅圖的醫學分析公司,由人類基因組計畫的研究人員之一Leroy Hood博士創建。 Providence所做的資料安全工作使其能夠與2016年收購的ISB共享資料。
米科表示,ISB挖掘Providence的大型醫療資料倉儲的能力對ISB對健康狀況的研究非常重要,例如長期COVID-19。 「這只是一個例子,說明當你能夠在安全的雲端環境中部署和整合資料時意味著什麼。」他說。
隨著Providence探索使用進階分析和人工智慧的其他方法來改善其醫療保健使命,對建構安全雲端資料架構的投資有望獲得回報。
「Providence已經為醫療保健的安全雲設計了一幅藍圖,」米科說。 「這需要大量的反覆練習,大量的學習,與我們的合作夥伴進行大量的合作。在每一步都在改進它。當我們學習新東西時,部署模型會發生變化。但我們認為有一個非常可靠的藍圖。」取得數據仍然是這方面取得進展的主要障礙之一。 Providence為降低安全和隱私風險所做的工作是良好的第一步,但還有更多的工作要做。
以上是如何克服安全障礙去解鎖醫療數據的詳細內容。更多資訊請關注PHP中文網其他相關文章!

軟AI(被定義為AI系統,旨在使用近似推理,模式識別和靈活的決策執行特定的狹窄任務 - 試圖通過擁抱歧義來模仿類似人類的思維。 但是這對業務意味著什麼

答案很明確 - 只是雲計算需要向雲本地安全工具轉變,AI需要專門為AI獨特需求而設計的新型安全解決方案。 雲計算和安全課程的興起 在

企業家,並使用AI和Generative AI來改善其業務。同時,重要的是要記住生成的AI,就像所有技術一樣,都是一個放大器 - 使得偉大和平庸,更糟。嚴格的2024研究O

解鎖嵌入模型的力量:深入研究安德魯·NG的新課程 想像一個未來,機器可以完全準確地理解和回答您的問題。 這不是科幻小說;多虧了AI的進步,它已成為R

大型語言模型(LLM)和不可避免的幻覺問題 您可能使用了諸如Chatgpt,Claude和Gemini之類的AI模型。 這些都是大型語言模型(LLM)的示例,在大規模文本數據集上訓練的功能強大的AI系統

最近的研究表明,根據行業和搜索類型,AI概述可能導致有機交通下降15-64%。這種根本性的變化導致營銷人員重新考慮其在數字可見性方面的整個策略。 新的

埃隆大學(Elon University)想像的數字未來中心的最新報告對近300名全球技術專家進行了調查。由此產生的報告“ 2035年成為人類”,得出的結論是,大多數人擔心AI系統加深的採用


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

DVWA
Damn Vulnerable Web App (DVWA) 是一個PHP/MySQL的Web應用程序,非常容易受到攻擊。它的主要目標是成為安全專業人員在合法環境中測試自己的技能和工具的輔助工具,幫助Web開發人員更好地理解保護網路應用程式的過程,並幫助教師/學生在課堂環境中教授/學習Web應用程式安全性。 DVWA的目標是透過簡單直接的介面練習一些最常見的Web漏洞,難度各不相同。請注意,該軟體中

SublimeText3漢化版
中文版,非常好用

MantisBT
Mantis是一個易於部署的基於Web的缺陷追蹤工具,用於幫助產品缺陷追蹤。它需要PHP、MySQL和一個Web伺服器。請查看我們的演示和託管服務。

SublimeText3 英文版
推薦:為Win版本,支援程式碼提示!

mPDF
mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),