Verknüpfung des Sozio-oekonomischen Panels mit administrativen Daten der Renten-versicherung - ein kombinierter Datensatz für ...
←
→
Transkription von Seiteninhalten
Wenn Ihr Browser die Seite nicht korrekt rendert, bitte, lesen Sie den Inhalt der Seite unten
Verknüpfung des Sozio-oekonomischen Panels mit administrativen Daten der Renten- versicherung – ein kombinierter Datensatz für Lebensverlaufsanalysen (SOEP-RV)1 Holger Lüthen, Jan Goebel, Markus Grabka, Carsten Schröder SOEP-RV ist eine neuartige Dateninfrastruktur, die die Umfragedaten des Sozio-oekonomischen Panels (SOEP) mit den Administrativdaten der Deutschen Rentenversicherung mithilfe der Sozialversicherungsnummer ver- bindet. SOEP-RV vereint so die Vorteile beider Datenquellen und bietet langfristige und genaue biographische sowie Renteninformationen auf Haushaltsebene. Das ermöglicht die Beantwortung völlig neuer Fragestellungen z. B. zu Alterssicherung oder Lebensverläufen. 1. Einleitung Daten aus dem Rentenbestand (RTBN) sind seit März Im Zuge eines vom Forschungsnetzwerk Alterssiche- 2020 verknüpfbar; im Herbst 2020 folgen die Ver- rung (FNA) geförderten Forschungsprojekts entsteht sichertenbiographien im Format der VSKT. SOEP-RV der Forschungsdatensatz SOEP-RV, welcher durch ein kombiniert somit die Stärken von Umfrage- und Ad- Record Linkage die Umfragedaten des SOEP mit den ministrativdaten. Insbesondere ermöglicht SOEP-RV Administrativdaten der Deutschen Rentenversiche- eine umfassende Darstellung der Einkommens- und rung per Sozialversicherungsnummer verbindet. Vermögenssituation von Versicherten der Deutschen Rentenversicherung in Deutschland. Das SOEP liefert jedes Jahr detaillierte Einkommens- informationen sowie seit 2002 alle Im Abschnitt 2 werden die Hinter- fünf Jahre die kompletten Vermögens- gründe, Ziele und mögliche For- portfolios der Befragten – jeweils auf Holger Lüthen, Jan schungsfragen des Projekts erläutert. Individual- und Haushaltsebene. Dar- Goebel, Markus Grabka Der 3. Abschnitt gibt eine Übersicht über hinaus liegen im SOEP Informa- und Carsten Schröder über die beteiligten Einzeldatensätze, tionen über nichtmonetäre Einkom- sind Mitarbeiter am Abschnitt 4 zeigt den aktuellen Stand menskomponenten vor, z. B. der Miet- Sozio-oekonomischen und die weiteren Pläne auf, während wert selbstgenutzten Wohneigentums Panel am DIW in Berlin. Abschnitt 5 einen Ausblick gibt und („imputed rent“), also der Einkom- ein Fazit zieht. mensvorteil aus selbstgenutztem Im- mobilienbesitz bzw. durch verbilligt überlassenen 2. Hintergründe, Ziele und Forschungspotenziale Wohnraum. Ein weiterer zentraler Vorteil der SOEP- der Daten Daten ist, dass Informationen zum Haushaltskontext In den letzten drei Jahrzehnten ist das deutsche Ren- vorliegen, womit u. a. die gesamte materielle und so- tenrecht mehrfach reformiert worden, um die finan- ziale Lage einer Person in ihrem Haushalt beschrie- zielle Nachhaltigkeit zu sichern und den Beitragssatz ben werden kann. der gesetzlichen Rentenversicherung (RV) zu stabili- Die Stärken der Administrativdaten liegen zum einen sieren. Die Schwerpunkte lagen darauf, den Verren- in der Beschreibung der kompletten individuellen tungszeitpunkt der demographischen Entwicklung Versicherungsbiographien der Versicherten. Diese anzupassen, das Wachstum der Rentenauszahlungen Daten werden derzeit durch die Verknüpfung von unter Berücksichtigung der demographischen Ent- SOEP und Daten der Versicherungskontenstichprobe wicklung an die allgemeine Lohnentwicklung zu kop- (VSKT) erschlossen. Sie liegen zum anderen in den peln und zusätzlich eine private Vorsorge außerhalb sehr detaillierten und exakten Informationen zum der gesetzlichen RV zu fördern. Datum des Renteneintritts, zur Rentenhöhe und den Aufgrund der fortschreitenden Bevölkerungsalterung Rentenarten. Diese detaillierten Angaben sind über ist allerdings abzusehen, dass der Reformdruck wei- den Datensatz SOEP-Rentenbestand (SOEP-RTBN) ter bestehen bleibt, insbesondere ab dem Zeitpunkt mit dem SOEP verknüpfbar. des Renteneintritts der geburtenstarken Jahrgänge, der sog. Baby-Boomer. Gleichzeitig unterliegt der 1 Arbeitsmarkt in Deutschland spätestens seit den Der Artikel basiert auf einem für die Jahrestagung 2020 des For- schungsdatenzentrums der Rentenversicherung vorgesehenen Hartz-Reformen einem spürbaren Wandel. Dies Vortrag, der wegen der Covid-19-Pandemie leider abgesagt wer- äußert sich einerseits in einer Zunahme sog. atypi- den musste. scher Beschäftigungsformen wie Minijobs, häufigeren RVaktuell 9/10/2020 229
Arbeitsplatzwechseln und ganz allgemein in einer Zu- tengruppen. Somit ist das SOEP prinzipiell für die nahme unterbrochener Erwerbsbiographien2, aber oben skizzierten Analysen geeignet. Allerdings ist das andererseits auch in Höchstständen der Beschäfti- SOEP, wie alle Befragungsdaten, mit survey-spezifi- gungsquote nach der Wiedervereinigung. schen Problemen konfrontiert. Das betrifft zunächst Das Zusammenspiel aus demographischer Entwick- die Freiwilligkeit aller Angaben und damit fehlende lung und veränderten Erwerbsbiographien wirkt sich Antworten auf möglicherweise als sensitiv empfun- auf das individuelle Einkommen während der Er- dene Fragen wie nach dem Einkommen oder dem werbsphase, auf das jeweilige Armutsrisiko und die Vermögen. Auch ist die retrospektive Erfassung von Rolle des Wohlfahrtsstaats sowie letztlich auf die Informationen, die vor der Panelteilnahme liegen, künftige Entwicklung der individuellen Absicherung aufgrund von Erinnerungsfehlern nur eingeschränkt im Alter aus. Zwar hat die Politik mit dem RV-Leis- möglich. Daher wird im SOEP primär nur die jeweils tungsverbesserungs- und -Stabilisierungsgesetz aktuelle Lebenssituation und die des unmittelbaren (2018) eine „Haltelinie“ für das Bruttorentenniveau Vorjahres erfragt. Erwerbsbiographische Informatio- bis 2030 festgeschrieben; für die Zeit danach ist aber nen liegen somit nicht für den gesamten Karrierever- von einem Rückgang dieses Niveaus auszugehen. lauf vor, wenn eine Person nicht durchgehend am Weiterhin ist der deutsche Wohlfahrtsstaat primär SOEP teilgenommen hat. Hinzu kommt, dass ein Teil darauf ausgelegt, das Wohlstandsniveau des Normal- der Befragten nach einiger Zeit nicht mehr weiter an arbeitsverhältnisses abzusichern. Hierdurch sind z. B. der Befragung teilnimmt (Panelmortalität). Somit sind atypisch oder prekär Beschäftigte durch die gesetz- die Ansprüche an die gesetzliche RV und deren zeit- liche Rente schlechter abgesichert, da ihre Löhne liche Entwicklung nur unvollständig berücksichtigt. niedriger und ihre Erwerbsverläufe oft lückenhaft Administrativdaten der Deutschen Rentenversiche- sind. Sie sorgen auch privat oft nur unzureichend für rung hingegen sind vollständig ab Versicherungs- das Alter vor (weil hierfür auch die finanziellen Mittel beginn erfasst und weisen kaum Messfehler auf. Ins- fehlen) und profitieren selten von betrieblicher Alters- besondere die Längsschnittdaten im Format der vorsorge, da diese oftmals wegen der Notwendigkeit Versiche rungskontenstichprobe dokumentieren mehrjähriger Betriebszugehörigkeit nicht greift. komplette Erwerbsbiographien sozialversicherungs- Mit SOEP-RV wird der Wissenschaft ein Datensatz pflichtig Beschäftigter vom 14. bis zum 67. Lebens- bereitgestellt, der Analysen über die materielle Situa- jahr. Auch Rentenansprüche und Übergänge in die tion von Personen über den gesamten Lebensverlauf Rente werden monatsgenau erhoben. Informationen erlaubt. Insbesondere kann das Zusammenspiel der über Rentenempfänger finden sich im Datensatz sich verändernden Arbeitsmarktsituation und der „Rentenbestand“ wieder, der ebenfalls den genauen finanziellen Situation vor und nach dem Renten- Antritt der jeweiligen Rente und die Ansprüche an die eintritt untersucht werden. Idealerweise liegen für gesetzliche RV abdeckt. Wie bei den meisten der Wis- Lebensverlaufsanalysen Informationen über alle Per- senschaft zur Verfügung stehenden deutschen Admi- sonen im Haushalt, wie der Familienstand und die Be- nistrativdaten, gibt es jedoch keinerlei Informationen schäftigungssituation der einzelnen Haushaltsmit- über den Haushaltskontext, da diese für die betref- glieder, vor. Außerdem sind vollständige erwerbs- fende administrative Aufgabe nicht benötigt werden. biographische Informationen über einen repräsen- Die Erwerbssituation bzw. das Einkommen außerhalb tativen Bevölkerungsquerschnitt erforderlich, um einer sozialversicherungspflichtigen Beschäftigung Entwicklungen über die Zeit komplett nachverfolgen kann ebenfalls aufgrund der administrativen Vor- zu können. All diese Informationen sind simultan gaben nicht nachvollzogen werden – genauso wie nicht in einem existierenden Datensatz für Deutsch- jegliches Vermögen außerhalb der Ansprüche an die land vorhanden. Forschungsfragen zur langfristigen Deutsche Rentenversicherung. ökonomischen Entwicklung von Personen im Kontext SOEP-RV kombiniert die Vorteile von Befragungs- und von Haushalten sind daher mit vorhandenen Daten Administrativdaten und stellt die kombinierten Daten nur unter Verwendung starker methodischer Annah- Forschenden für wissenschaftliche Zwecke zur Ver- men zu beantworten. fügung, wodurch Analysen zu Einkommen und Ver- So erhebt der bekannteste deutsche Datensatz unter mögen für Personen und Haushalte über den komplet- den längsschnittlichen Befragungsdaten, die Haus- ten Lebensverlauf möglich sind. Die beiden Datensätze haltsstichprobe SOEP, einmal jährlich detaillierte In- werden getrennt vom Forschungsdatenzentrum der formationen von Personen über deren Erwerbsstatus, Rentenversicherung (FDZ-RV) und dem Forschungs- Einkommen sowie im Fünfjahresrhythmus über datenzentrum des SOEP (FDZ-SOEP) übermittelt und deren Vermögen. Das beinhaltet auch Informationen können vom Forschenden anhand einer eindeutigen über Ansprüche aus privater Vorsorge oder Betriebs- Identifikationsnummer (ID) verknüpft werden. renten. Neben Zufallsstichproben für die Gesamt- bevölkerung umfasst das SOEP auch Sonderstichpro- 2 Vgl. Bönke, Corneo und Lüthen (2015). Lifetime Earnings In- ben, mit deren Hilfe auch Personengruppen berück- equality in Germany. Journal of Labor Economics 33 (1), und sichtigt werden, für die auf Grundlage einfacher Zu- Westermeier, Grabka, Jotzo und Rasner (2017). Veränderung fallsstichproben nur unzureichend Fallzahlen zur der Erwerbs- und Familienbiografien lässt einen Rückgang des Verfügung stehen würden – z. B. spezifische Migran- Gender-Pension-Gap erwarten. DIW Wochenbericht 12/2017. 230 RVaktuell 9/10/2020
Als Vorbild für eine solche Verknüpfung dient der sozialversicherungspflichtigen Beschäftigungszeiten Datensatz SHARE-RV, der auf einem Record Linkage vor dem jetzigen Status. Diese Personen haben in den beruht und daher keine statistische Unsicherheit bei Administrativdaten zum Teil nur sehr geringe Ren- der Verknüpfung der Daten aufweist3. Bei SHARE-RV tenanwartschaften, die aber ihre faktische Vorsorge- werden auch die Administrativdatensätze VSKT und situation nicht adäquat widerspiegeln – z. B. ein lang- RTBN mit den Umfragedaten Survey of Health, Ageing jähriger Beamter, der nur für kurze Zeit Anwartschaf- and Retirement in Europe (SHARE) verbunden. ten bei der Deutschen Rentenversicherung gesammelt SHARE ist eine auf Personen ab Alter 50 fokussierte hat. Eine deutliche Verbesserung im Analysepotential Stichprobe, die europaweit einheitlich erhoben wird. ergibt sich außerdem für Frauen, die oftmals auf- Bei SHARE stehen neben Alters- und Gesundheits- grund von Kindererziehungszeiten Unterbrechungen fragen die Vergleichsmöglichkeiten mit anderen Län- in ihrer Erwerbsbiographie aufweisen und nur dern Europas im Vordergrund. Beim SOEP handelt es schwer mithilfe eines statistischen Matchings adäquat sich um eine auf Deutschland beschränkte, größere verbunden werden können. Des Weiteren können In- und im Längsschnitt länger erhobene Stichprobe als formationen über Einkommen oberhalb der Beitrags- SHARE, die entsprechend für Deutschland mehr bemessungsgrenze nun den richtigen Individuen zu- Kalenderjahre, einen größeren Stichprobenumfang geordnet werden. Hierdurch lassen sich Analysen und spezifische Schwerpunktstichproben, z. B. zu über Ungleichheit und Verteilung von Einkommen Migranten, bietet. In diesem Sinn ist SOEP-RV als und Vermögen im Lebensverlauf deutlich verbessern. Ergänzung der Datenlandschaft für Deutschland zu Im Rahmen des hier dargestellten Projekts sind auch verstehen und füllt eine bestehende Datenlücke. wissenschaftliche Analysen mit den verknüpften SOEP-RV ist nicht der erste Ansatz einer gemeinsamen Daten geplant, die zur Qualität des Datensatzes bei- Nutzung von Informationen aus SOEP und Administra- tragen. Hier ist insbesondere die umfangreiche Vali- tivdaten der Deutschen Rentenversicherung4. Im Ge- dierung der Daten zu nennen, wie z. B. Vergleiche des gensatz zum bisherigen Vorgehen, das auf einer Zu- verknüpften Samples mit den jeweils vollständigen, sammenführung der Informationen mittels statis- nichtverknüpften Datensätzen des SOEP und der tischem Matching basierte, erfolgt ein eindeutiges VSKT. Im Zuge dessen lassen sich individuelle Infor- Record Linkage der Versicherten über ihre Sozialver- mationen plausibilisieren und eventuell abweichende sicherungsnummer. Das bei vorigen Studien verwen- Angaben auf Konsistenz prüfen. Ein Beispiel für dete statistische Matching verbindet Individuen auf potenziell abweichende Angaben ist der Bildungs- Basis ähnlicher Eigenschaften (z. B. Einkommen) in status, der in den RV-Daten vom Arbeitgeber übertra- beiden Datensätzen. Ein statistisches Matching gelingt gen wird und sich von der Eigenauskunft im SOEP allerdings in der Regel nur für diejenigen gut, die unterscheiden kann. Eine ausführliche Dokumenta- ohnehin in beiden Datensätzen mit vielen Datenpunk- tion der Daten soll sicherstellen, dass künftige Daten- ten vertreten sind – in diesem Fall zumeist sozialver- nutzer über vergleichbare Fälle informiert werden. sicherungspflichtig beschäftigte Männer mit stabilen Erwerbsbiographien. Es gelingt deutlich weniger gut, 3. Übersicht über die beteiligten Datensätze Frauen bzw. Männer mit unterbrochenen Biogra- Nachfolgend sollen die Einzel-Datensätze von SOEP- phien, Selbständige oder Beamte zu verbinden. Außer- RV nochmals etwas detaillierter, als bislang gesche- dem werden Einkommen in den Administrativdaten hen, beschrieben werden, um den Lesern einen bes- an der Beitragsbemessungsgrenze gekappt, so dass es seren Einblick in SOEP-RV geben zu können. für Personen oberhalb der Grenze schwieriger ist, ihnen einen passenden Matching-Partner zuzuordnen. 3.1 SOEP SOEP-RV enthält auch für Individuen mit kurzem Be- Das SOEP ist eine seit 1984 laufende Längsschnitt- obachtungszeitraum im SOEP erwerbsbiographische erhebung von privaten Haushalten in Deutschland Informationen ab dem 14. Lebensjahr. Hiermit gelingt mit einem interdisziplinären Befragungsprogramm. es, ca. 80 % der Erwerbsbevölkerung biographisch Das SOEP dokumentiert für zumeist sämtliche Haus- abzubilden5. Auch für zum Befragungszeitpunkt ver- haltsmitglieder neben der Höhe aller Einkommens- beamtete oder selbständige Individuen kann eine arten, dem Vermögen, dem Erwerbs- oder Gesund- Ergänzung des Lebenslaufs stattfinden, z. B. durch heitszustand viele weitere Informationen wie politi- Informationen zu Zivildienst, Ausbildungszeiten oder sche Einstellung, Lebenszufriedenheit, Bildungslauf- bahn oder familiärer Hintergrund. Seit 1984 wurden 3 mehr als 15 Auffrischungs- oder Ergänzungsstich- S. auch Herold (in dieser Ausgabe): SHARE-RV: Erste Ergebnisse proben integriert, z. B. 1990 eine Stichprobe für Ost- der achten Erhebungswelle. 4 deutschland oder spezielle Migrantenstichproben Für eine ausführliche Beschreibung eines statistischen Matchings zwischen SOEP und administrativen Biographiedaten (1984, 1995, 2013, 2015, 2016 und 2017). Seit 2010 der Deutschen Rentenversicherung s. Rasner, Himmelreicher, umfasst das SOEP jährlich mehr als 25 000 befragte Grabka, Frick (2007). Best of Both Worlds: Preparatory Steps Personen. Die Befragung für die SOEP-Daten wird in Matching Survey Data with Administrative Pension Records. durch Kantar (ehemals Infratest) durchgeführt. Die DIW Data Documentation 24. Teilnahme an der Studie ist freiwillig; trotzdem sind 5 Vgl. Bönke, Corneo, Lüthen (2015), a. a. O. die jährlichen Wiederbefragungsquoten im langjähri- RVaktuell 9/10/2020 231
gen Mittel mit ca. 94 % sehr hoch. So wurden von den 4. Aktueller Stand: Befragung und weitere Projekte ca. 12 500 Personen der ersten beiden Stichproben Der Datensatz SOEP-RV verbindet die genannten der ersten Ziehung 1984 im Jahr 2015 immerhin noch Datensätze auf Individualebene mittels Record Link- etwa 3 500 Personen erfolgreich befragt6. age. Zum Zeitpunkt der Entstehung dieses Aufsatzes Die Daten des SOEP werden als faktisch anonymisier- (Mitte Juli 2020) liegt die Zustimmungsquote der Be- ter Scientific-Use-File durch das FDZ-SOEP der Wis- fragten bei 54,4 %. Das entspricht ca. 8 000 Fällen, senschaft national wie international bereitgestellt. wobei Substichproben des SOEP hierbei noch nicht Das SOEP wird derzeit von über 1 000 Nutzern welt- berücksichtigt wurden, da deren Befragung noch weit genutzt. Bislang wurden fast 9 000 Publikationen nicht abgeschlossen ist11. Von diesen konnten 1 412 mit SOEP-Bezug veröffentlicht (s. www.diw.de/ Fälle aus befragungstechnischen Gründen 2018 nicht soeplit)7. befragt werden, was 2020 allerdings nachgeholt wird. Das Forschungsprojekt SOEP-RV wird sukzessive aus- 3.2 RTBN geweitet. Seit 2019 wird die Substichprobe SOEP- Der RTBN ist ein administrativer Datensatz der deut- Innovationsstichprobe (SOEP-IS) befragt12. Außerdem schen RV. Er führt sämtliche gesetzlichen Renten auf, wird seit 2019 bei der schriftlichen Einwilligungs- die in Deutschland vorliegen. Hierbei ist jede Rente erklärung der Befragten zur Verknüpfung der Daten ein Fall, und es wird zwischen einzelnen Rentenarten auf die (freiwillige) Angabe der Sozialversicherungs- wie Erwerbsminderungsrenten, Altersrenten oder nummer verzichtet. Für einige Befragte ist es in der Hinterbliebenenrenten unterschieden. Für jede Rente Befragungssituation schwierig, die korrekte Sozial- liegen u. a. der Zahlbetrag, die Bezugsdauer, die Ent- versicherungsnummer anzugeben bzw. zu finden; geltpunktegrundlage oder spezielle Merkmale wie daher sollte die Zustimmungsrate ohne diese Hürde Anrechnungsbeträge (im Fall von Hinterbliebenen- merklich steigen, was sich auf Grundlage erster renten) vor8. Für die Bestimmung der Rentenbezüge SOEP-IS-Zahlen bestätigt. 2020 folgen die SOEP-Sub- liegen in diesem Datensatz also genaue Informatio- stichproben L2/3 (kinderreiche Familien), M1/M2 (Mi- nen vor, wobei Hinterbliebenenrenten aus dem RTBN granten), O (Soziale Stadt) und Q (LGB Personen) nicht berücksichtigt werden können (diese werden (s. Tabelle 1). Das ermöglicht insbesondere detail- allerdings im SOEP erfragt)9. Insgesamt komplemen- lierte Vergleiche der Erwerbsbiographien und der tiert der RTBN das SOEP an wichtigen Stellen, vor erworbenen Rentenansprüche von Migranten und allem durch die Rentenartinformation, die exakte Nicht-Migranten. Dieser Aufsatz bezieht sich aller- Rentenhöhe und den Rentenbeginn. dings auf den aktuellen Stand vor der SOEP-Welle 2020 und somit auf die 8 141 Fälle, die einer Ver- 3.3 Die Versicherungskontenstichprobe (VSKT) knüpfung ihrer Daten bereits schriftlich zugestimmt haben. Während die Verknüpfung mit der VSKT Ende Die VSKT ist ein administrativer Individualdatensatz 2020 vorgenommen werden kann, zeigen erste Ana- der deutschen RV. Die Daten sind in unveränderliche lysen, dass für 2 122 der bisherigen 8 141 Fälle eine Merkmale wie Geschlecht oder Geburtsjahr und in Rente aus dem RTBN verbunden werden kann. Neben biographische Merkmale aufgeteilt. Die inhaltliche Stärke der VSKT besteht vor allem in den enthaltenen biographischen Verlaufsmerkmalen über das Ver- 6 Vgl. Goebel, Grabka, Liebig, Kroh, Richter, Schröder, Schupp sichertenleben, die monatsgenau und valide erfasst (2019). The German Socio-Economic Panel (SOEP). Jahrbücher sind. Hier sind vor allem die Entgeltpunkte und die für Nationalökonomie und Statistik 239. 7 soziale Erwerbssituation hervorzuheben. Aus den Eine Übersicht der Forschungspotenziale und der aktuellen Ent- Verlaufsmerkmalen lässt sich, bis zur Beitragsbemes- wicklungen findet sich in Schröder, König, Fedorets, Goebel, sungsgrenze, das Bruttoarbeitsentgelt berechnen. Grabka, Lüthen, Metzing, Schikora, Liebig (2020). The Economic Research Potentials of the German Socio-Economic Panel Stu- Aus der sozialen Erwerbssituation lässt sich bestim- dy, German Economic Review (im Erscheinen). men, welcher rentenversicherungsrelevante Status 8 Für Forschung mit dem RTBN s. z. B. Haan, Kemptner und (z. B. Arbeitslosigkeit, Beschäftigung oder Krankheit) Lüthen (2020). The rising longevity gap by lifetime earnings – in welchem Monat vorlag. Die monatsgenauen Bio- Distributional implications for the pension system. Journal of graphien sind vom Kalenderjahr, in dem das Indivi- the Economics of Aging (im Erscheinen). duum 14 Jahre alt wird, bis zum Kalenderjahr des 9 Hinterbliebenenrenten sind unter der Sozialversicherungsnum- 65. Geburtstags belegt. Insgesamt sind hierdurch mer der verstorbenen Person gespeichert, die nicht abgefragt Informationen über bis zu 624 Monate vorhanden. wird. Somit kann keine Zuordnung an Empfangspersonen statt- Für jeden dieser Monate können außerdem die An- finden. 10 sprüche an die RV berechnet werden. S. auch Bönke, Corneo und Lüthen (2015), a. a. O., für Über- sichten und Darstellungen der VSKT. Für weiterführende Informationen über die VSKT sei 11 Für einen Überblick über die Substichproben im SOEP s. Goebel auf die in diesem Aufsatz erwähnten Quellen oder die et al. (2019), a. a. O., oder das entsprechende Kapitel im SOEP Literatursuche des FDZ-RV verwiesen, die momentan Companion (companion.soep.de). knapp 350 Publikationen mit Daten des FDZ-RV auf- 12 Abschließende Zahlen zu SOEP-IS liegen aufgrund der Verzöge- listet: http://forschung.deutsche-rentenversicherung. rung durch COVID-19 bei Abschluss dieses Aufsatzes noch nicht de/FdzPortalWeb/10. vor. 232 RVaktuell 9/10/2020
Tabelle 1: Zustimmungsbefragung des Record Linkage der Deutschen Rentenversicherung: Stand 2019 und Plan 2020* Stichproben A-L1+N L2/3 M1/2 O Q IS Brutto-Fallzahl 2018 auf Personenebene 16 378 Hiervon befragt 14 966 Einverständnis auf Personenebene 8 141 Einverständnis in % 54,4 Befragt in 2018 × Befragung 2019 × Befragung 2020 ×** × × × × Geschätzte Brutto-Fallzahl 2020 auf Haus- haltsebene (Zahlen von Kantar) ~10 560 ~1 600 ~1 600 ~660 ~900 ~2 960 * Legende: A-L1+N: Alt-Stichproben des SOEP, L2/3: CAWI-Screening-Stichproben aus der ehemaligen FiD-Studie (Familien in Deutschland), M1/M2: IAB-SOEP Migrationsstichproben (Personen, die nach 1995 zugewandert sind), O: „Soziale Stadt“ (Personen aus Gebieten des Städte- bauförderprogramms „Soziale Stadt“), Q: LGB*-Stichprobe (Nicht-Heterosexuelle + Personen mit diverser Geschlechtsidentität), IS: SOEP- Innovationsstichprobe. ** Zweite Abfrage derer, die ihr Einverständnis bisher nicht gegeben haben. den Arbeiten an der Verknüpfung finden am SOEP Das Record Linkage verläuft schrittweise über die bereits Arbeiten statt, um Validierungs- und Prüf- Substichproben des SOEP. Ein besonderer Vorteil des routinen für den verknüpften Datensatz zu ent- SOEP ist es, dass es neben allgemeinen Stichproben wickeln. der Gesamtbevölkerung auch Schwerpunktstichpro- ben, wie z. B. zu Migranten, beinhaltet. 2018 wurden 5. Fazit und Ausblick die Alt-Stichproben des SOEP befragt, 2019 das Inno- Mit SOEP-RV entsteht ein Datensatz, der die Umfrage- vationssample und 2020 die weiteren Substichpro- daten des SOEP mit Administrativdaten der deutschen ben. Da auch geplant ist, diese Datenzusammenfüh- RV mittels Record Linkage verbindet. Hierdurch ent- rung auf künftige, momentan noch nicht bestehende fällt die ansonsten auftretende statistische Unsicher- Substichproben auszuweiten, erscheint die Weiter- heit traditioneller Matching-Methoden. Der verbun- führung von SOEP-RV durch die Kooperation der be- dene Datensatz weist sowohl Vorteile von Umfrage- teiligten Forschungsdatenzentren auch in der Zukunft daten, wie z. B. Haushaltsinformationen, als auch sichergestellt. Vorteile von Administrativdaten, wie z. B. monats- SOEP-RV wird von den Forschungsdatenzentren der genaue biographische Informationen, auf. Insbeson- Rentenversicherung und des SOEP erstellt, wobei dere bietet SOEP-RV die Möglichkeit, die Bedeutung jedes Forschungsdatenzentrum einen Teildatensatz des Zusammenlebens und -wirtschaftens in Haus- erstellt, der dann von den Nutzenden anhand einer halten auf den materiellen Wohlstand über den ge- eindeutigen ID zusammengefügt werden kann. Die samten Lebenszyklus zu messen. Ein weiterer Daten werden voraussichtlich 2021 veröffentlicht. Schwerpunkt von SOEP-RV liegt bei der Beantwor- Nähere Informationen finden sich zeitnah sowohl tung von Forschungsfragen zur Alterssicherung, da beim FDZ-RV als auch beim FDZ SOEP: http://for das SOEP durch die Daten der RV an dieser Stelle schung.deutsche-rentenversicherung.de/FdzPortal besonders gut ergänzt wird. Web/ bzw. diw.de/soepfdz. RVaktuell 9/10/2020 233
Sie können auch lesen