Erfahrungen mit der Datenverknüpfung von Primär- und Sekundärdaten in einer Interventionsstudie

Abstract
Die Datenverknüpfung von Primär- und Sekundärdaten wird in der Versorgungsforschung als Möglichkeit gesehen, die Vorteile beider Datenquellen synergistisch zu nutzen und dabei deren Nachteile zu überwinden. Für die Evaluation einer Intervention im Kontext eines Projekts zur Integrierten Versorgung (,Gesundes Kinzigtal‘) werden Rahmenbedingungen und Voraussetzung für eine individuelle Verknüpfung von Primärdaten (Befragungen) und Routinedaten einer gesetzlichen Krankenversicherung dargestellt. Die Hinzuziehung von Sekundärdaten erlaubt über die Evaluation der Intervention bzgl. körperlicher Aktivität, Ernährung und sozialer Teilhabe bei älteren Menschen (,AGil‘) hinaus die Analyse der Auswirkungen des Programms auf die Inanspruchnahme medizinischer Leistungen. Aus den Erfahrungen der AGil-Studie werden Empfehlungen für die Datenverknüpfung von Primär- und Sekundärdaten im Rahmen der Versorgungsforschung abgeleitet. Die Empfehlungen betreffen die Wahl geeigneter Pseudonymisierungsalgorithmen für Primär- und Sekundärdaten, das Matching-Verfahren und Ansätze zur Verringerung der Missmatches und deren Validierung sowie die rechtlichen Grundlagen einer derartigen Datenverknüpfung. Insgesamt stellt eine individuelle Verlinkung von Primär- und Sekundärdaten kein technisches Problem dar. Zwar müssen dabei eine Reihe von datenschutzrechtlichen Vorschriften beachtet werden (z. B. Verhinderung einer De-Pseudonymisierungsmöglichkeit; Sicherstellung, dass keine Studiendaten an die Krankenkasse geraten), doch zugunsten eines maximalen Erkenntnisgewinns bietet sich eine individuelle Datenverknüpfung für viele versorgungsepidemiologische Fragestellungen als Königsweg an. The data linkage of health-related primary and secondary data provides new opportunities for health services research. The advantages of both data sources can be used synergistically, in this way their disadvantages can be overcome. In the context of the evaluation of a health intervention – the integrated health services project (,Gesundes Kinzigtal‘) – the conditions and requirements for an individualised data linkage of primary data (survey) and claims data of a statutory health insurance are described in this paper. The integration of secondary data permits us not only to assess the intervention concerning physical activity, nutrition and social participation of elderly people (,AGil‘) but, above all, also to measure and analyse the program effects on the utilisation of health care services. Recommendations regarding the data linkage of primary and secondary data in health services research are derived from the results and experiences of the AGil study. Suggestions are made concerning the suitable pseudonymisation algorithm for primary and secondary data, the matching method, approaches to reduce mismatching and their validation, as well as the legal basis for such a data linkage. Overall, an individualised data linkage of primary and secondary data does not pose any technical problems. Nevertheless a couple of data protection rules have to be followed; the data linkage offers a high knowledge insight to many health and epidemiological research questions and might be the new gold standard for health services research.