編輯導語:如今隨著科技的發展,醫院里的很多種方式都使用互聯網系統的方式進行,比如病人病歷的記錄,以前用本子,現在用數據庫,查找起來比較方便;本文作者分享了關于醫學數據科研中的數據手動錄入,我們一起來了解一下。
一、背景
三甲醫院由于其具備頂尖的醫療資源,會吸引疑難雜癥的患者前去就診,該部分患者所患疾病多為稀缺疾病,專病科研數據庫由于疾病的稀缺性所以數據庫內數據量較少。
在某疾病方向上,截止到2019年全國共有1516家三甲醫院,現階段約有600W份病例,每年仍將以30萬的速度增長。
對于醫院而言,這些數據為本院的醫學科研提供了數據基礎。
醫學科研,一方面可以提升本院的治療水平,進而提高本院患者治愈率;另一方面可以增加本院的醫學論文數量。通過醫學科研,可以提升醫院在該疾病領域的業界地位,提升競爭力,吸引更多的患者前來治療,最終為本院創造更多營收。
但是由于歷史原因,目前600W份的病歷數據依然是紙質數據。
在數據搜索方面,紙質形式存儲的數據,需要人工翻閱紙質病歷查找。當數據量小的時候,數據量查找成本較高,但是人力尚可企及。當數據量大的時候,數據查找幾乎成為不可能。
電子化存儲的數據,數據查找效率縮短至秒級。
在數據統計方面,紙質形式存儲的數據,一次只能被一個人查閱,并且容易損壞;電子化存儲的數據支持多人同時查看,并且不容易損壞。
電子數據為科研提供了便利。所以需要將紙質的病歷數據轉化成電子的病歷數據。數據手動錄入是將數據轉換成電子化的一個方法。
二、數據手動錄入
指,由人工將讀取到的數據,填入可視化的頁面中,并將數據保存至數據庫,將數據轉換成電子數據的方法。
包括自定義表單生成器和錄入數據兩個部分:
1. 自定義表單生成器
由于每個科研的研究方向不同,科研所需要的數據不同,采集數據的電子表單也將不同。
如果每個電子表單都由開發人員手動開發,隨著研究課題的數量增加,隨之增加的是人工成本、時間成本,降低項目交付的效率,自定義表單生成器是解決該問題的一款工具。
自定義表單生成器,是一款用戶可以根據自己需要自定義電子表單的工具。將生成電子表單的工作由技術人員轉移至現場項目人員,甚至有可能將工具的使用方法教給客戶使用。大大減低了企業生產電子表單的成本。
以表單“手術情況”為例,演示表單配置的過程,包括三步——第一步:創建表單;第二步:配置表單變量;第三步:選擇控件并配置控件屬性。
第一步:創建表單
創建表單時,需要根據表單所代表的業務含義設置“表單名稱”為“手術情況”。
“表單名稱”是表單的中文名稱,命名方式一般是表單的中文名稱,代表該表單的業務方向;具有可讀性,不具備唯一性,主要用于用戶在填寫或查看表單時快速了解該表單的內容。
第二步:配置表單變量及變量控件屬性。
假設“手術情況”表單有4個字段,手術執行時間、手術方式、麻醉方式、手術經過。以手術執行時間舉例說明,配置表單的過程。
配置字段的變量名稱:手術執行時間;設置字段的變量ID:operate_data。
“變量名稱”是變量的中文名稱,具備可讀性,不具備唯一性,主要用于用戶在填寫數據時快速了解該變量的含義。命名方式一般是變量的中文名稱。
“變量ID”是變量的英文名稱,具備唯一性,可讀性較差。主要用于系統識別字段。命名方式一般是變量的英文名稱。
第三步:選擇控件并配置控件屬性
為變量“手術執行時間”設置日期型控件。并配置控件的屬性,不同的控件需要配置不同的控件屬性。日期型控件關鍵屬性包括日期類型。
“控件類型”指的是該變量適合使用的控件展示。該控件用于用戶在前端頁面準確且快速的錄入數據庫需要存儲的數據。
“日期類型”指的是日期的精確度。有三種日期類型,年月日、年月日時分、年月日時分秒。
通過上述的配置過程,可以抽象出來表單配置的三個步驟:
- 創建表單
- 創建變量
- 選擇控件
創建表單:
根據業務情況,設置表單名稱和表單ID。
創建變量:
為該表單創建變量,設置變量名稱和變量ID。
選擇控件:
為變量設置合適的控件,并填寫控件的相關屬性,不同類型的控件,需要配置不同的屬性。
通過上述步驟完成其余變量的配置,完成整張表單“手術情況”的配置,最終前端頁面效果如下圖:
2. 自定義表單發布上線
配置完畢表單以后,表單處于一種草稿狀態。而科研數據由于其科研的嚴謹性,科研數據無法經常變化,需要建立在一種相對確定的數據結構上。所以需要把配置完成的表單發布上線。
在系統首次部署時,發布成功以后,所有數據直接使用該表單錄入數據。
系統在運行過程中,隨著系統的使用,用戶對表單的需求存在發生變動的可能性。此時,需要對線上表單重新編輯,然后發布上線。
由于歷史數據擁有很高的研究價值,需要根據新的表單將歷史數據進行清洗,以保證舊數據在新的表單結構下可以被使用。
3. 創建患者并錄入數據
錄入數據指的是,用戶在前端頁面以電子表單的形式將紙質數據錄入到系統中,形成電子化的過程。由兩個步驟組成,創建患者、錄入患者數據。
1)創建患者
指,在系統中增加一個新的患者。將新增患者的操作由用戶直接在頁面上完成,使得沒有編程能力的人也可以將數據插入到系統中,降低了用戶往數據庫中新增數據的操作成本。
對于創建患者所使用的字段,不同病種數據庫,因為數據質量不一致和對數據安全要求不同,所以在創建患者時填寫的字段也不相同。所以需要配置創建患者所使用的變量。
對于患者唯一標示,創建患者時,系統會自動生成患者唯一標識。但是為了再次創建患者時,能夠識別出來患者是否存在。所以需要根據創建患者時使用的字段生成患者ID。如果患者ID的生成規則發生變化,需要對歷史數據進行清洗。
2)錄入數據
指,在系統中完善患者信息。用戶在前端頁面以電子表單的形式,完善患者信息。使得沒有編程能力的人也可以將數據插入到系統中,降低了用戶往數據庫中錄入數據的操作成本。
科研所需的數據質量高,只有經過審核,確認數據達到使用要求,才可以被科研所使用。需要對表單數據設置狀態來表示數據是否可用,包括暫存、提交待審核、審核通過、審核駁回等。
手動錄入的數據量較大,需要提高數據錄入的效率。例如在設計表單時將數據分組分類;通過鍵盤快捷鍵快速切換變量;快速切換到下一頁等快捷操作。
三、總結
紙質數據通過手動錄入的方式進入數據庫,由于人腦在處理數據上更靈活性,數據填充率相比于系統填寫會比較高。但是數據錄入的效率會低效。
可以通過以下方式保持高效率和高填充率:將病歷分成不同模塊,由專業的醫學人員對非專業的人員按病歷模塊進行培訓,數據錄入的問題將轉換成如何管理數據錄入員的問題。
本文由 @申bobo 原創發布于人人都是產品經理,未經許可,禁止轉載
題圖來自 Unsplash,基于 CC0 協議