死亡和數(shù)據(jù)科學:看機器學習如何改善臨終關懷
KenSci是一家為醫(yī)療行業(yè)開發(fā)機器學習風險預測平臺的公司,該公司最近發(fā)表了一篇關于預測臨終死亡率并改善護理的論文。
本文引用地址:http://butianyuan.cn/article/201803/376461.htm這篇論文針對的是一個非常棘手的話題,對患者的最近六至十二個月內(nèi)的死亡風險進行預測,它已經(jīng)被人工智能促進協(xié)會(Association for the Advancement of Artificial Intelligence)接受。處于危急關頭的是,在個人生命最后一年的護理花費了2050億美元。但這不僅僅是成本的問題。以下內(nèi)容摘自《死亡與數(shù)據(jù)科學:預測生命的終結》(《Death vs. Data Science: Predicting End of Life》)這篇論文。
使用姑息治療服務的美國人的人數(shù)持續(xù)增長,估計已經(jīng)有170萬人,即死亡人數(shù)的46%(NHPCO 2016)。然而,這些服務被利用得太晚了:2016年病患在臨終關懷醫(yī)院停留時間的中值只有23天。此外,28%的臨終關懷患者在入院后7天內(nèi)出院或死亡(NHPCO 2016)。在Christakis及其同事的工作中,他們認為臨終關懷醫(yī)師覺得80-90天的臨終關懷護理最適合患者及其家屬的需求(Christakis 1997)。對死者家屬進行的調(diào)查表明,對臨終關懷的滿意度與他們對臨終關懷轉(zhuǎn)診及時性的看法相關(Teno等人的研究。2007)。最后,那些在那些經(jīng)常遇到住院病人死亡的醫(yī)療機構中,緊急醫(yī)護人員和重癥監(jiān)護護士等醫(yī)護人員的職業(yè)倦怠比例非常高(Embriaco 等人的研究。2007)。因此,最終得出的結論是,及時和適當?shù)呐R終關懷護理會影響Quadruple Aim醫(yī)療保健的所有方面(質(zhì)量、滿意度、成本節(jié)約和提供者滿意度)。
我們正在組織一系列關于數(shù)據(jù)科學家及其使用的方法的文章,作為這個系列的一部分,我們“抓住了”KenSci的首席技術官及該論文的作者之一——Ankur Teredesai,這篇論文在這個新興的技術類別中得到了認可。
你用什么數(shù)據(jù)集來建模?
預測六至十二個月內(nèi)的死亡率風險是一項非常復雜的挑戰(zhàn)。在美國,這是一個價值2050億美元的問題。在KenSci,我們有一個旨在提高機器學習的規(guī)模和運營效率的平臺,以解決諸如此類有巨大社會影響的問題。在這個特定的環(huán)境中,我們已經(jīng)有了根據(jù)以前的努力預測六至十二個月內(nèi)死亡率的機器學習模型。我們與美國西北部的兩家主要的醫(yī)療系統(tǒng)進行了合作,并重新訓練了我們的模型,并且用新數(shù)據(jù)創(chuàng)建了更多的模型。
來自Health System A的數(shù)據(jù)包含的是患有心力衰竭(HF)病史的患者群體,其中包括4,888名病患,以及他們的各種電子病歷數(shù)據(jù),這些數(shù)據(jù)包括:
人口統(tǒng)計學上的特征
病人停留的時間長度
總體成本相關特征
具體的費用相關特征(住院病人、門診病人、家庭健康、臨終關懷、熟練護理機構)的再入院信息
通過醫(yī)療保健通用程序編碼系統(tǒng)(Healthcare Common Procedure Coding System,包括救護車、醫(yī)療設備和假肢等)對所執(zhí)行的程序進行跟蹤
Health System B的數(shù)據(jù)包含了48,365名患者,這些患者患有各種類型的疾病。Health System B只有醫(yī)療索賠數(shù)據(jù)可用。
這篇論文詳細介紹了用于建模的數(shù)據(jù)元素。
大數(shù)據(jù)技術如何應用于你的研究?這項工作缺少了哪些夢想中的數(shù)據(jù)集?
我們使用了微軟的Azure云來運行一些底層組件。我們還與現(xiàn)有的企業(yè)大數(shù)據(jù)投資無縫集成,以確保醫(yī)療保健行業(yè)可以從大量數(shù)據(jù)源中受益。
KenSci與世界各地的醫(yī)療保健合作伙伴進行了合作,收集了從EMR(電子醫(yī)療記錄)、社會心理學數(shù)據(jù)到醫(yī)療索賠和財務信息等各種數(shù)據(jù)集,從而實現(xiàn)了對患者和整個醫(yī)院人口狀況的縱向觀察。該系統(tǒng)基于云,因此可以在新的數(shù)據(jù)源可用時連接到這些數(shù)據(jù)源。
對六至十二個月的死亡率進行預測,并根據(jù)據(jù)此獲得的見解幫助醫(yī)生將患者轉(zhuǎn)為姑息治療,在這種情況下的預測是一項非常復雜的工作。諸如人口統(tǒng)計學和共病的數(shù)據(jù)提供了良好的結果,但諸如醫(yī)生輸入或處方中的變化之類的額外數(shù)據(jù)源經(jīng)常也可以提供額外的信息。歸根結底,機器學習中從未有過一個理想的“夢想中的”數(shù)據(jù)集。EMR中包含的關于一個患者的信息傾向于少于10%。在日益聯(lián)系的世界中,我們將繼續(xù)生成額外的數(shù)據(jù)資產(chǎn),從而增加數(shù)據(jù)驅(qū)動型決策的復雜性。機器學習的優(yōu)勢在于能夠逐步學習,并通過更多的數(shù)據(jù)和反饋進行改進。
你是如何建立這個模型的?在建立它的過程中,人類輸入起到了什么作用?
我們在腦海中建立了具有輔助智能的模型。我們在KenSci開發(fā)的每一種模型都建立在這樣的理念之上:人的輸入將成為提供護理的每一個步驟的關鍵因素。KenSci機器學習(ML)平臺有利于可解釋的機器學習模型,這些模型可以解釋其正確性并進行驗證,然后KenSci的醫(yī)生和臨床醫(yī)生不僅僅會驗證機器學習模型的輸出,還會幫助確定臨床工作流中的輸入特征,然后再將其集成到任何工具中。整個過程非常嚴格,我們一直在尋找方法使其更具輔助性,同時還要保持嚴謹。
這個話題是一個非常敏感的話題,對于用算法決定護理的做法自然會引發(fā)種種擔憂。什么方法最適合用來決定在臨終護理過程中應該采取哪些護理措施呢?
在KenSci,我們致力于通過提高醫(yī)院和護理人員的效率來提高患者治療結果的質(zhì)量。使用人工智能算法可以提供誰可能會生病、如何生病、何時生病,以及在整個護理持續(xù)過程中如何有效地服務患者方面的見解。雖然人工智能仍然是醫(yī)療保健的新丁,但它的智能可以被看護人和醫(yī)院系統(tǒng)用來提高效率。醫(yī)生永遠是決策者,算法不會介入醫(yī)生和患者之間的關系。廣義的智能是我們需要使用的一種工具,但是當涉及到醫(yī)療保健和臨終問題的時候,決定權在醫(yī)生和患者手中。
在KenSci,我們將人工智能視為輔助智能,即它旨在幫助正在使用該技術的專家,而不是要替代他們。這也適用于這里討論的臨終關懷轉(zhuǎn)變的問題。這些模型旨在幫助醫(yī)生注意到可能疏忽掉的屬性,因為機器學習可以在分層中注意大量變量,因此人工智能可以提供額外的知識以做出更明智的決定。
如果沒有EHRs,這項研究是否可能?您如何處理醫(yī)療系統(tǒng)中尚未結構化的數(shù)據(jù)(即紙張上的數(shù)據(jù)或者是更糟糕的一些數(shù)據(jù))?
EHR數(shù)據(jù)是必要的,但不足以在醫(yī)療領域中產(chǎn)生深刻的見解和預測。盡管非結構化數(shù)據(jù)可以為預測模型增加有用的附加信息,但即使是醫(yī)療系統(tǒng)內(nèi)一些簡單的問題也仍未得到解決,因為即使是結構化的數(shù)據(jù)也還沒有發(fā)揮它們?nèi)康淖饔谩=Y構化數(shù)據(jù)提供了足夠的豐富性來提供描述性統(tǒng)計數(shù)據(jù),并為再入院風險、死亡率預測、急診部門利用率預測等問題提供足夠好的預測模型。然而,EHR和其他結構化數(shù)據(jù)尚未發(fā)揮的其最大潛力。
這些預測從本質(zhì)上來說是因人而異的,既然如此,你是如何在宏觀層面上處理像成本節(jié)約這樣的話題的呢?
盡管臨終關懷本質(zhì)上是個性化的,但預測高成本患者隊列并確定導致高成本和高利用率的模式對醫(yī)院和衛(wèi)生系統(tǒng)來說是至關重要的。KenSci的解決方案可以通過分析縱向的醫(yī)療記錄來幫助確定高成本人群,通過對疾病進行建模并預測生命終點來提高姑息治療的利用率,從而預測未來高用量人群。
然而,一個像這樣的系統(tǒng)可以做的可不僅僅提供生命終點預測這么簡單——它還可以讓醫(yī)護人員探索患者的風險狀況,并且預測潛在的再入院可能。雖然降低成本對于醫(yī)療系統(tǒng)顯然極具吸引力,但是這樣的系統(tǒng)也能夠在各個領域中為患者提供更好的護理。在各種情況下,機器學習系統(tǒng)可以幫助減少醫(yī)生的職業(yè)倦怠,協(xié)助人員配置并提示出可能需要進行醫(yī)療干預的患者。從機器學習系統(tǒng)中獲得的見解可以幫助看護者就客戶對于臨終關懷的愿望與其進行知情程度更高、更為積極主動的交流。
評論