Top
最新消息 電子報 回首頁 意見箱 ENGLISH
 使用注意事項


2000年抽樣歸人檔使用經驗談
一般注意事項
 
五年資料之所有檔案皆可順利串接,唯需注意由於本資料量較大,除了需要注意個人PC之處理能力外,另需注意若將所有欄位讀入串接可能出現無法串接成功或資料無法處理的情況發生,解決的方法有以下兩種方法(以SAS統計軟體為例)。
  將資料減量,例如減少欄位數只讀取需要的欄位。
  建議使用Win NT或Win2000作業系統並支援NTFS partitions,因為以Win98/95/ME作業系統(僅支援FAT partitions)運算時將有資料量2GB的限制。此外,並建議至少需要有15GB以上之可用硬碟空間。
  承保抽樣歸人檔擷取方法說明文件(詳全文
 
承保資料檔為依身份證統一編號隨機抽樣產生之5萬人全部資料。
 
本資料為截至2000年底為止之歷史資料,亦即資料為自健保開辦以來至2000年之累積資料。
 
個人身份證號等於被保險人身份字號時表示為同一人,若個人身份證號不等於被保險人身份字號時表示為依附之眷屬。
 
軍保自2001/2/1開始加入。
  請注意92年承保檔為最後異動承保資料,詳細內容請見92年資料清單中之承保檔說明。
  除了2000年以外的承保檔均為同一批人在當年度的承保記錄。另外,除了2000年承保資料外,歸人後各年均會有不到五萬人。
  各組承保抽樣歸人檔與母群體之代表性檢測,請參考說明


第一組
承保抽樣歸人檔
在性別、年齡與資料筆數的單變項分析資料皆呈常態分配。
承保資料與明細檔皆以身份證統一編號(ID)相串接。
就住院資料(有住院紀錄者)或承保資料(無住院紀錄者)分析此50000名被保險人之平均年齡(年齡之計算=1998-出生年):無住院紀錄者,N=39181,平均年齡=29.77(SD=19.83);有住院紀錄者,N=10819,平均年齡=39.40(SD=24.10)。
門診就醫紀錄與承保資料之出生年一致者共有47402筆(47402/47865=99.03%),出生年不一致者共有463筆(463/47865=0.97%)。
住院就醫紀錄與承保資料之出生年一致者共有10727筆(10727/10819=99.15%),出生年不一致者共有92筆(92/10819=0.85%)。

承保資料檔
份證統一編號長度等於10者,共有47965筆;長度小於10者,共有2035筆。


第二組
承保抽樣歸人檔
在性別、年齡與資料筆數的單變項分析資料皆呈常態分配。
承保資料與明細檔皆以身份證統一編號(ID)相串接。
50000人中男性佔51.28%,女性佔48.7%。

承保資料檔
身份證統一編號長度等於10者,共有47875筆;長度小於10者,共有2125筆。
50000人之平均投保金額為26886.86元。
年齡分佈 。
年齡層
百分比
0-20
27.948
21-60
54.646
61-80
11.124
80+
2.012


第三組
承保抽樣歸人檔
在性別、年齡與資料筆數的單變項分析資料皆呈常態分配。
承保資料與明細檔皆以身份證統一編號(ID)相串接。
50000人中男性佔51.22%,女性佔48.75%。

承保資料檔
身份證統一編號長度等於10者,共有47966筆;長度小於10者,共有2034筆。
50000人之平均投保金額為26878.72元。
年齡分佈(2筆年齡負值) 。
年齡層
百分比
0-20
28.23
21-60
58.51
61-80
11.32
80+
1.94


第四組
承保抽樣歸人檔
在性別、年齡與資料筆數的單變項分析資料皆呈常態分配。
承保資料與明細檔皆以身份證統一編號(ID)相串接。
50000人中男性佔51.32%,女性佔48.65%。

承保資料檔
身份證統一編號長度等於10者,共有47956筆;長度小於10者,共有2044筆。
50000人之平均投保金額為27285.64元。
年齡分佈(1筆年齡負值,1筆大於120歲) 。
年齡層
百分比
0-20
27.76
21-60
58.86
61-80
11.33
80+
2.04

回首頁