<thead id="bf9jf"></thead>
        <sub id="bf9jf"></sub><sub id="bf9jf"></sub>

        專業咨詢
        致力推進中國醫療衛生信息化

        【鄭西川專欄】善用信息工具,保障醫學真實世界研究的重復性

        來源:HIT專家網 作者:鄭西川

        在臨床研究中,研究結果的重復性是必不可少的,只有可以被重復驗證的研究結果才是真實存在的規律。醫學臨床研究環境復雜,難以保證每個臨床研究的結果一定揭示了真實規律,如果將有偏差的臨床研究結果應用到臨床實踐中,則可能造成嚴重的臨床后果。

        傳統的臨床科研方法,如雙盲隨機臨床對照的試驗結果重復成本巨大,臨床科研的可重復性已成為日益突出的問題,某些學者甚至稱之為“臨床科研危機”。與此同時,醫療健康正在經歷一場數字革命,醫院臨床電子病歷應用已經普及,大數據機器學習以及人工智能等應用日益深入,醫學真實世界數據利用為克服臨床實踐中缺乏證據的難題提供了契機,臨床科研正在從傳統研究方法轉向真實世界研究。

        信息技術的普及為真實世界臨床科研結果的重復性提供了基礎保障。重癥監護醫療數據集MIMIC就是具體實例。該數據集免費提供給世界各地的研究人員,被廣泛應用于??萍膊☆A測等科學研究和研究機構教育課程?;诔R幣R床診療過程中的原始數據,MIMIC數據集將數據轉換為臨床科研可用形式,進行了大量標準化預處理工作,為真實世界數據臨床專病數據庫建設提供了范例。

        本文討論用于保障臨床研究重復性的信息工具及其應用。我們認為,先進的信息工具與開放數據、開源代碼同樣重要。信息工具的應用,能夠加速研究人員對數據集的理解,提升臨床數據二次分析質量,并促進臨床研究的一致性和有效性。

        工具之一:Jupyter Notebooks

        Jupyter Notebook 是一個基于Web的交互式計算可執行文檔環境,允許用戶創建和共享各種內容,包括實時代碼、方程式、可視化和敘述文本文檔等。其用途包括:數據清理和轉換、數值模擬、統計建模、數據可視化與機器學習等。

        臨床研究中,當??茢祿颓叭搜芯看a都可以免費獲得時,就為研究人員提供了一個能夠完全復制別人研究的環境。使用Jupyter Notebook工具,能夠將文檔和代碼無縫地結合起來創建可執行文檔。MIMIC代碼庫提供了Jupyter Notebook可執行文檔示例,圖1顯示了利用Jupyter Note提取患者信息的應用示例。Jupyter Notebook不受語言限制,支持用Python、R、MATLAB、SAS和其他語言編寫的源程序代碼。

        圖1 運用Jupyter Notebook提取患者ICU病房住院天數

        Jupyter Notebook可執行文件有助于數據分析師和領域專家之間的協作溝通。使用Jupyter Notebook有三個目的:(1)允許以有組織且易于閱讀的文檔方式(MarkDown,MD格式)描述代碼背后的邏輯;(2)有助于快速編寫代碼,特別是在需要協作討論期間的代碼;(3)提供了一種共享已發布臨床科研項目的機制與手段。

        Jupyter Notebook的可執行文檔也是一個非常合適的科研輔導平臺,其交互性有助于實驗數據處理過程透明,促進了項目參與者的協作學習。例如,將臨床參數(如腎臟內科血液過濾)轉換為所需的臨床參數概念(如血液凈化治療CRRT的長度)時,使用Jupyter Notebook可執行文檔,可以概述收集MIMIC數據預處理過程,評估數據庫中符合CRRT定義的數據;除了解釋CRRT,還可作為在MIMIC數據庫和其他類似ICU EHR中定義概念的模板,為臨床醫生基于真實世界的科研提供了很好的示范。

        工具之二:Github開源網絡社區

        GitHub是一個面向開源及私有軟件項目的托管平臺,每天都有成千上萬的項目在上面誕生。作為全球最大的代碼托管平臺,它為開源社區做出了不可磨滅的貢獻。

        MIMIC代碼庫除具有源代碼分發和增強結果再現性等特點外,還建立了MIMIC數據用戶和數據開發者之間的交流渠道。通過Github MIMIC代碼社區(https://github.com/MIT-LCP/mimic-code/discussions,圖2所示),研究人員可以了解源數據的基礎細節,實驗室和臨床工作人員能為下游數據提供上下文分析,有助于臨床研究人員對數據的理解把握。研究人員可以發布問題,詢問所關心領域的數據收集和分析數據的最佳實踐,同時也可以提供見解和建議。通過Github社區的這些做法,促進了真實世界數據有意義的使用,并且社區內的所有討論公開可用,鼓勵研究人員逐步改進建立代碼庫,開放源代碼,從而提升重癥醫學的臨床研究質量。

        圖2 MIMIC開源社區

        總結與思考

        正如開放數據、臨床科研透明化能夠幫助臨床醫療質量改進和管理水平提升一樣,為了實現臨床科研的過程透明,研究者需要提供臨床科研數據以及實現科研結果過程的程序代碼。MIMIC數據集面向所有重癥醫學研究者,免費提供真實世界源數據;同時,MIMIC代碼倉庫提供了一個完整的重癥醫學真實世界數據驅動臨床科研的框架,通過先進的信息技術工具,保證了臨床科研結果的可重復性。MIMIC數據集、代碼庫及相關工具應用為未來的臨床科研數據采集、代碼復用及研究過程重復迭代提供了保障,對于新功能開發以及建立新模型提供了可復制的案例,這在目前醫院數字化轉型背景下顯然具有特別重要的意義。

        不過,這種方法也有一些局限性。首先,臨床科研人員需要熟悉技術工具,如GIT和SQL,這就要求臨床人員與信息技術人員加強協作;其次,SQL代碼依賴于具體的數據庫系統,需要對不同具體數據庫系統進行調整,研究人員需要具備數據庫的基礎知識;第三,MIMIC代碼倉庫是為MIMIC數據庫量身定制的,盡管大部分代碼廣泛適用于重癥監護發展的數據模型,但對于現實世界具體醫療機構的數據而言,仍需要進行改進;最后,隨著時間的推移和數據模型變化,代碼倉庫需要不斷發展以適應新的發展。

        【作者簡介】

        鄭西川,上海交通大學附屬第六人民醫院計算機中心教授級高工。上海交通大學醫學院生物醫學工程專業碩士研究生導師,蘇州大學放射醫學與公共衛生學院生物醫學工程專業碩士研究生導師。中國醫院協會信息專業委員會(CHIMA)委員,中國醫藥信息學會(CMIA)委員,上海市醫院協會信息管理專業委員會委員,中國醫藥信息學會上海分會常委,中國生物醫藥技術協會醫藥信息分會常委,《醫療衛生裝備》雜志特約審稿專家。

        研究方向:①基于PACS電子病歷的臨床信息共享;②HL7/XML電子轉診相關技術及應用研究;③區域臨床信息共享及協同醫療信息技術研究;④數字化醫院的相關標準及實現技術。近年來,先后承擔上海市“十一五”重大科技項目、上海市科委自然科學基金項目、上海市經濟信息委信息化專項基金以及院級課題多項。發表論文40余篇。

        此圖片的alt屬性為空;文件名為HIT%E4%B8%93%E5%AE%B6%E7%BD%91%E8%AE%A2%E9%98%85%E5%8F%B7.png
        關注HIT專家網微信訂閱號
        精彩不容錯過!
        尋求“商務合作”請掃碼填寫需求
        我們將盡快與您聯系!

        【責任編輯:秦勉】

        贊(2)

        評論 搶沙發

        評論前必須登錄!

         


        未經允許不得轉載:HIT專家網 » 【鄭西川專欄】善用信息工具,保障醫學真實世界研究的重復性
        分享到: 更多 (0)
        黄色性交一级老太婆网站|欧美一区免费观看|黄色w网站免费|中国91区26黄片

          <thead id="bf9jf"></thead>
              <sub id="bf9jf"></sub><sub id="bf9jf"></sub>