Popis: |
Claims data of the statutory health insurance (SHI) are an important data source for the evaluation of cancer prevention programs. However, this source does not contain relevant information on cause of death. This study examined whether individual claims data can be enriched with data on the required cause of death using record linkage procedures with suitable external data sources.In the German pharmacoepidemiologic research database (GePaRD) we identified a sample of 25,528 deceased female residents of North Rhine Westphalia (NRW) who, according to GePaRD information, died between 2006 and 2013. Date and cause of all deaths among inhabitants of NRW since 2005 were available in the epidemiological cancer registry of NRW. In cooperation with 2 SHI companies, we tried to match each individual of the sample with a case of death in NRW and the corresponding cause of death using a probabilistic and, alternatively, a deterministic linkage procedure.Of the study sample, 94.72% were successfully matched by the probabilistic and 93.36% by the deterministic method.The probabilistic and the deterministic record linkage approach produced comparably high matching rates. Cases without matches are probably due to errors occurring at the stage of personal data entry. Given the lower technical efforts, the deterministic approach appears to be the method of choice for the enrichment of claims data with cause of death information from suitable external data sources in Germany.Für die Evaluation von Krebsvorsorgeprogrammen stellen Daten der Gesetzlichen Krankenversicherung (GKV) eine wichtige Datenquelle dar, die jedoch nicht die benötigten Daten zum genauen Sterbedatum und zur Todesursache enthält. Diese Studie sollte prüfen, ob eine diesbezügliche Anreicherung individueller GKV-Daten über einen Abgleich mit einer geeigneten externen Datenquelle erfolgen kann.In der pharmako-epidemiologischen Forschungsdatenbank GePaRD identifizierten wir eine Versichertenstichprobe von 25 528 Frauen, die laut den Angaben in GePaRD im Zeitraum 2006–2013 verstorben waren und ihren Wohnsitz in Nordrhein-Westfalen (NRW) hatten. Datum und Ursache des Todes aller Einwohner von NRW seit 2005 liegen im Epidemiologischen Krebsregister von NRW vor. In Kooperation mit 2 gesetzlichen Krankenkassen wurde mit einem probabilistischen bzw. deterministischen Abgleichverfahren versucht, jeder Verstorbenen der Stichprobe einen Todesfall aus NRW und damit eine Todesursache zuzuordnen.Für 94,72% der Verstorbenen der Versichertenstichprobe konnte probabilistisch und für 93,36% deterministisch ein Todesfall aus NRW zugeordnet werden.Das probabilistische und das deterministische Verfahren erreichten vergleichbar hohe Trefferquoten. Nicht erfolgte Zuordnungen sind vermutlich größtenteils auf Fehler bei der Erfassung der Personendaten zurückzuführen. Aufgrund des geringeren technischen Aufwands erscheint das deterministische Verfahren als die Methode der Wahl für die Anreicherung von GKV-Daten mit amtlichen Todesursachen aus geeigneten externen Datenquellen. |