Verknüpfung des Sozio-oekonomischen Panels mit administrativen Daten der Renten-versicherung - ein kombinierter Datensatz für ...

Die Seite wird erstellt Silvester Rösch
 
WEITER LESEN
Verknüpfung des Sozio-oekonomischen
Panels mit administrativen Daten der Renten-
versicherung – ein kombinierter Datensatz für
Lebensverlaufsanalysen (SOEP-RV)1
Holger Lüthen, Jan Goebel, Markus Grabka, Carsten Schröder

SOEP-RV ist eine neuartige Dateninfrastruktur, die die Umfragedaten des Sozio-oekonomischen Panels (SOEP)
mit den Administrativdaten der Deutschen Rentenversicherung mithilfe der Sozialversicherungsnummer ver-
bindet. SOEP-RV vereint so die Vorteile beider Datenquellen und bietet langfristige und genaue biographische
sowie Renteninformationen auf Haushaltsebene. Das ermöglicht die Beantwortung völlig neuer Fragestellungen
z. B. zu Alterssicherung oder Lebensverläufen.

1. Einleitung                                                          Daten aus dem Rentenbestand (RTBN) sind seit März
Im Zuge eines vom Forschungsnetzwerk Alterssiche-                      2020 verknüpfbar; im Herbst 2020 folgen die Ver-
rung (FNA) geförderten Forschungsprojekts entsteht                     sichertenbiographien im Format der VSKT. SOEP-RV
der Forschungsdatensatz SOEP-RV, welcher durch ein                     kombiniert somit die Stärken von Umfrage- und Ad-
Record Linkage die Umfragedaten des SOEP mit den                       ministrativdaten. Insbesondere ermöglicht SOEP-RV
Administrativdaten der Deutschen Rentenversiche-                       eine umfassende Darstellung der Einkommens- und
rung per Sozialversicherungsnummer verbindet.                          Vermögenssituation von Versicherten der Deutschen
                                                                       Rentenversicherung in Deutschland.
Das SOEP liefert jedes Jahr detaillierte Einkommens-
informationen sowie seit 2002 alle                                                    Im Abschnitt 2 werden die Hinter-
fünf Jahre die kompletten Vermögens-                                                  gründe, Ziele und mögliche For-
portfolios der Befragten – jeweils auf      Holger Lüthen, Jan                        schungsfragen des Projekts erläutert.
Individual- und Haushaltsebene. Dar-        Goebel, Markus Grabka                     Der 3. Abschnitt gibt eine Übersicht
über hinaus liegen im SOEP Informa-         und Carsten Schröder                      über die beteiligten Einzeldatensätze,
tionen über nichtmonetäre Einkom-           sind Mitarbeiter am                       Abschnitt 4 zeigt den aktuellen Stand
menskomponenten vor, z. B. der Miet-        Sozio-oekonomischen                       und die weiteren Pläne auf, während
wert selbstgenutzten Wohneigentums          Panel am DIW in Berlin.                   Abschnitt 5 einen Ausblick gibt und
(„imputed rent“), also der Einkom-                                                    ein Fazit zieht.
mensvorteil aus selbstgenutztem Im-
mobilienbesitz bzw. durch verbilligt überlassenen                      2. Hintergründe, Ziele und Forschungspotenziale
Wohnraum. Ein weiterer zentraler Vorteil der SOEP-                        der Daten
Daten ist, dass Informationen zum Haushaltskontext                     In den letzten drei Jahrzehnten ist das deutsche Ren-
vorliegen, womit u. a. die gesamte materielle und so-                  tenrecht mehrfach reformiert worden, um die finan-
ziale Lage einer Person in ihrem Haushalt beschrie-                    zielle Nachhaltigkeit zu sichern und den Beitragssatz
ben werden kann.                                                       der gesetzlichen Rentenversicherung (RV) zu stabili-
Die Stärken der Administrativdaten liegen zum einen                    sieren. Die Schwerpunkte lagen darauf, den Verren-
in der Beschreibung der kompletten individuellen                       tungszeitpunkt der demographischen Entwicklung
Versicherungsbiographien der Versicherten. Diese                       anzupassen, das Wachstum der Rentenauszahlungen
Daten werden derzeit durch die Verknüpfung von                         unter Berücksichtigung der demographischen Ent-
SOEP und Daten der Versicherungskontenstichprobe                       wicklung an die allgemeine Lohnentwicklung zu kop-
(VSKT) erschlossen. Sie liegen zum anderen in den                      peln und zusätzlich eine private Vorsorge außerhalb
sehr detaillierten und exakten Informationen zum                       der gesetzlichen RV zu fördern.
Datum des Renteneintritts, zur Rentenhöhe und den                      Aufgrund der fortschreitenden Bevölkerungsalterung
Rentenarten. Diese detaillierten Angaben sind über                     ist allerdings abzusehen, dass der Reformdruck wei-
den Datensatz SOEP-Rentenbestand (SOEP-RTBN)                           ter bestehen bleibt, insbesondere ab dem Zeitpunkt
mit dem SOEP verknüpfbar.                                              des Renteneintritts der geburtenstarken Jahrgänge,
                                                                       der sog. Baby-Boomer. Gleichzeitig unterliegt der
1                                                                      Arbeitsmarkt in Deutschland spätestens seit den
    Der Artikel basiert auf einem für die Jahrestagung 2020 des For-
    schungsdatenzentrums der Rentenversicherung vorgesehenen           Hartz-Reformen einem spürbaren Wandel. Dies
    Vortrag, der wegen der Covid-19-Pandemie leider abgesagt wer-      äußert sich einerseits in einer Zunahme sog. atypi-
    den musste.                                                        scher Beschäftigungsformen wie Minijobs, häufigeren

                                                                                                 RVaktuell 9/10/2020 229
Arbeitsplatzwechseln und ganz allgemein in einer Zu-       tengruppen. Somit ist das SOEP prinzipiell für die
nahme unterbrochener Erwerbsbiographien2, aber             oben skizzierten Analysen geeignet. Allerdings ist das
andererseits auch in Höchstständen der Beschäfti-          SOEP, wie alle Befragungsdaten, mit survey-spezifi-
gungsquote nach der Wiedervereinigung.                     schen Problemen konfrontiert. Das betrifft zunächst
Das Zusammenspiel aus demographischer Entwick-             die Freiwilligkeit aller Angaben und damit fehlende
lung und veränderten Erwerbsbiographien wirkt sich         Antworten auf möglicherweise als sensitiv empfun-
auf das individuelle Einkommen während der Er-             dene Fragen wie nach dem Einkommen oder dem
werbsphase, auf das jeweilige Armutsrisiko und die         Vermögen. Auch ist die retrospektive Erfassung von
Rolle des Wohlfahrtsstaats sowie letztlich auf die         Informationen, die vor der Panelteilnahme liegen,
künftige Entwicklung der individuellen Absicherung         aufgrund von Erinnerungsfehlern nur eingeschränkt
im Alter aus. Zwar hat die Politik mit dem RV-Leis-        möglich. Daher wird im SOEP primär nur die jeweils
tungsverbesserungs- und -Stabilisierungsgesetz             aktuelle Lebenssituation und die des unmittelbaren
(2018) eine „Haltelinie“ für das Bruttorentenniveau        Vorjahres erfragt. Erwerbsbiographische Informatio-
bis 2030 festgeschrieben; für die Zeit danach ist aber     nen liegen somit nicht für den gesamten Karrierever-
von einem Rückgang dieses Niveaus auszugehen.              lauf vor, wenn eine Person nicht durchgehend am
Weiterhin ist der deutsche Wohlfahrtsstaat primär          SOEP teilgenommen hat. Hinzu kommt, dass ein Teil
darauf ausgelegt, das Wohlstandsniveau des Normal-         der Befragten nach einiger Zeit nicht mehr weiter an
arbeitsverhältnisses abzusichern. Hierdurch sind z. B.     der Befragung teilnimmt (Panelmortalität). Somit sind
atypisch oder prekär Beschäftigte durch die gesetz-        die Ansprüche an die gesetzliche RV und deren zeit-
liche Rente schlechter abgesichert, da ihre Löhne          liche Entwicklung nur unvollständig berücksichtigt.
niedriger und ihre Erwerbsverläufe oft lückenhaft          Administrativdaten der Deutschen Rentenversiche-
sind. Sie sorgen auch privat oft nur unzureichend für      rung hingegen sind vollständig ab Versicherungs-
das Alter vor (weil hierfür auch die finanziellen Mittel   beginn erfasst und weisen kaum Messfehler auf. Ins-
fehlen) und profitieren selten von betrieblicher Alters-   besondere die Längsschnittdaten im Format der
vorsorge, da diese oftmals wegen der Notwendigkeit         Versiche rungskontenstichprobe dokumentieren
mehrjähriger Betriebszugehörigkeit nicht greift.           komplette Erwerbsbiographien sozialversicherungs-
Mit SOEP-RV wird der Wissenschaft ein Datensatz            pflichtig Beschäftigter vom 14. bis zum 67. Lebens-
bereitgestellt, der Analysen über die materielle Situa-    jahr. Auch Rentenansprüche und Übergänge in die
tion von Personen über den gesamten Lebensverlauf          Rente werden monatsgenau erhoben. Informationen
erlaubt. Insbesondere kann das Zusammenspiel der           über Rentenempfänger finden sich im Datensatz
sich verändernden Arbeitsmarktsituation und der            „Rentenbestand“ wieder, der ebenfalls den genauen
finanziellen Situation vor und nach dem Renten-            Antritt der jeweiligen Rente und die Ansprüche an die
eintritt untersucht werden. Idealerweise liegen für        gesetzliche RV abdeckt. Wie bei den meisten der Wis-
Lebensverlaufsanalysen Informationen über alle Per-        senschaft zur Verfügung stehenden deutschen Admi-
sonen im Haushalt, wie der Familienstand und die Be-       nistrativdaten, gibt es jedoch keinerlei Informationen
schäftigungssituation der einzelnen Haushaltsmit-          über den Haushaltskontext, da diese für die betref-
glieder, vor. Außerdem sind vollständige erwerbs-          fende administrative Aufgabe nicht benötigt werden.
biographische Informationen über einen repräsen-           Die Erwerbssituation bzw. das Einkommen außerhalb
tativen Bevölkerungsquerschnitt erforderlich, um           einer sozialversicherungspflichtigen Beschäftigung
Entwicklungen über die Zeit komplett nachverfolgen         kann ebenfalls aufgrund der administrativen Vor-
zu können. All diese Informationen sind simultan           gaben nicht nachvollzogen werden – genauso wie
nicht in einem existierenden Datensatz für Deutsch-        jegliches Vermögen außerhalb der Ansprüche an die
land vorhanden. Forschungsfragen zur langfristigen         Deutsche Rentenversicherung.
ökonomischen Entwicklung von Personen im Kontext           SOEP-RV kombiniert die Vorteile von Befragungs- und
von Haushalten sind daher mit vorhandenen Daten            Administrativdaten und stellt die kombinierten Daten
nur unter Verwendung starker methodischer Annah-           Forschenden für wissenschaftliche Zwecke zur Ver-
men zu beantworten.                                        fügung, wodurch Analysen zu Einkommen und Ver-
So erhebt der bekannteste deutsche Datensatz unter         mögen für Personen und Haushalte über den komplet-
den längsschnittlichen Befragungsdaten, die Haus-          ten Lebensverlauf möglich sind. Die beiden Datensätze
haltsstichprobe SOEP, einmal jährlich detaillierte In-     werden getrennt vom Forschungsdatenzentrum der
formationen von Personen über deren Erwerbsstatus,         Rentenversicherung (FDZ-RV) und dem Forschungs-
Einkommen sowie im Fünfjahresrhythmus über                 datenzentrum des SOEP (FDZ-SOEP) übermittelt und
deren Vermögen. Das beinhaltet auch Informationen          können vom Forschenden anhand einer eindeutigen
über Ansprüche aus privater Vorsorge oder Betriebs-        Identifikationsnummer (ID) verknüpft werden.
renten. Neben Zufallsstichproben für die Gesamt-
bevölkerung umfasst das SOEP auch Sonderstichpro-          2
                                                               Vgl. Bönke, Corneo und Lüthen (2015). Lifetime Earnings In-
ben, mit deren Hilfe auch Personengruppen berück-              equality in Germany. Journal of Labor Economics 33 (1), und
sichtigt werden, für die auf Grundlage einfacher Zu-           Westermeier, Grabka, Jotzo und Rasner (2017). Veränderung
fallsstichproben nur unzureichend Fallzahlen zur               der Erwerbs- und Familienbiografien lässt einen Rückgang des
Verfügung stehen würden – z. B. spezifische Migran-            Gender-Pension-Gap erwarten. DIW Wochenbericht 12/2017.

230 RVaktuell 9/10/2020
Als Vorbild für eine solche Verknüpfung dient der                    sozialversicherungspflichtigen Beschäftigungszeiten
Datensatz SHARE-RV, der auf einem Record Linkage                     vor dem jetzigen Status. Diese Personen haben in den
beruht und daher keine statistische Unsicherheit bei                 Administrativdaten zum Teil nur sehr geringe Ren-
der Verknüpfung der Daten aufweist3. Bei SHARE-RV                    tenanwartschaften, die aber ihre faktische Vorsorge-
werden auch die Administrativdatensätze VSKT und                     situation nicht adäquat widerspiegeln – z. B. ein lang-
RTBN mit den Umfragedaten Survey of Health, Ageing                   jähriger Beamter, der nur für kurze Zeit Anwartschaf-
and Retirement in Europe (SHARE) verbunden.                          ten bei der Deutschen Rentenversicherung gesammelt
SHARE ist eine auf Personen ab Alter 50 fokussierte                  hat. Eine deutliche Verbesserung im Analysepotential
Stichprobe, die europaweit einheitlich erhoben wird.                 ergibt sich außerdem für Frauen, die oftmals auf-
Bei SHARE stehen neben Alters- und Gesundheits-                      grund von Kindererziehungszeiten Unterbrechungen
fragen die Vergleichsmöglichkeiten mit anderen Län-                  in ihrer Erwerbsbiographie aufweisen und nur
dern Europas im Vordergrund. Beim SOEP handelt es                    schwer mithilfe eines statistischen Matchings adäquat
sich um eine auf Deutschland beschränkte, größere                    verbunden werden können. Des Weiteren können In-
und im Längsschnitt länger erhobene Stichprobe als                   formationen über Einkommen oberhalb der Beitrags-
SHARE, die entsprechend für Deutschland mehr                         bemessungsgrenze nun den richtigen Individuen zu-
Kalenderjahre, einen größeren Stichprobenumfang                      geordnet werden. Hierdurch lassen sich Analysen
und spezifische Schwerpunktstichproben, z. B. zu                     über Ungleichheit und Verteilung von Einkommen
Migranten, bietet. In diesem Sinn ist SOEP-RV als                    und Vermögen im Lebensverlauf deutlich verbessern.
Ergänzung der Datenlandschaft für Deutschland zu                     Im Rahmen des hier dargestellten Projekts sind auch
verstehen und füllt eine bestehende Datenlücke.                      wissenschaftliche Analysen mit den verknüpften
SOEP-RV ist nicht der erste Ansatz einer gemeinsamen                 Daten geplant, die zur Qualität des Datensatzes bei-
Nutzung von Informationen aus SOEP und Administra-                   tragen. Hier ist insbesondere die umfangreiche Vali-
tivdaten der Deutschen Rentenversicherung4. Im Ge-                   dierung der Daten zu nennen, wie z. B. Vergleiche des
gensatz zum bisherigen Vorgehen, das auf einer Zu-                   verknüpften Samples mit den jeweils vollständigen,
sammenführung der Informationen mittels statis-                      nichtverknüpften Datensätzen des SOEP und der
tischem Matching basierte, erfolgt ein eindeutiges                   VSKT. Im Zuge dessen lassen sich individuelle Infor-
Record Linkage der Versicherten über ihre Sozialver-                 mationen plausibilisieren und eventuell abweichende
sicherungsnummer. Das bei vorigen Studien verwen-                    Angaben auf Konsistenz prüfen. Ein Beispiel für
dete statistische Matching verbindet Individuen auf                  potenziell abweichende Angaben ist der Bildungs-
Basis ähnlicher Eigenschaften (z. B. Einkommen) in                   status, der in den RV-Daten vom Arbeitgeber übertra-
beiden Datensätzen. Ein statistisches Matching gelingt               gen wird und sich von der Eigenauskunft im SOEP
allerdings in der Regel nur für diejenigen gut, die                  unterscheiden kann. Eine ausführliche Dokumenta-
ohnehin in beiden Datensätzen mit vielen Datenpunk-                  tion der Daten soll sicherstellen, dass künftige Daten-
ten vertreten sind – in diesem Fall zumeist sozialver-               nutzer über vergleichbare Fälle informiert werden.
sicherungspflichtig beschäftigte Männer mit stabilen
Erwerbsbiographien. Es gelingt deutlich weniger gut,                 3. Übersicht über die beteiligten Datensätze
Frauen bzw. Männer mit unterbrochenen Biogra-                        Nachfolgend sollen die Einzel-Datensätze von SOEP-
phien, Selbständige oder Beamte zu verbinden. Außer-                 RV nochmals etwas detaillierter, als bislang gesche-
dem werden Einkommen in den Administrativdaten                       hen, beschrieben werden, um den Lesern einen bes-
an der Beitragsbemessungsgrenze gekappt, so dass es                  seren Einblick in SOEP-RV geben zu können.
für Personen oberhalb der Grenze schwieriger ist,
ihnen einen passenden Matching-Partner zuzuordnen.                   3.1 SOEP
SOEP-RV enthält auch für Individuen mit kurzem Be-                   Das SOEP ist eine seit 1984 laufende Längsschnitt-
obachtungszeitraum im SOEP erwerbsbiographische                      erhebung von privaten Haushalten in Deutschland
Informationen ab dem 14. Lebensjahr. Hiermit gelingt                 mit einem interdisziplinären Befragungsprogramm.
es, ca. 80 % der Erwerbsbevölkerung biographisch                     Das SOEP dokumentiert für zumeist sämtliche Haus-
abzubilden5. Auch für zum Befragungszeitpunkt ver-                   haltsmitglieder neben der Höhe aller Einkommens-
beamtete oder selbständige Individuen kann eine                      arten, dem Vermögen, dem Erwerbs- oder Gesund-
Ergänzung des Lebenslaufs stattfinden, z. B. durch                   heitszustand viele weitere Informationen wie politi-
Informationen zu Zivildienst, Ausbildungszeiten oder                 sche Einstellung, Lebenszufriedenheit, Bildungslauf-
                                                                     bahn oder familiärer Hintergrund. Seit 1984 wurden
3
                                                                     mehr als 15 Auffrischungs- oder Ergänzungsstich-
    S. auch Herold (in dieser Ausgabe): SHARE-RV: Erste Ergebnisse
                                                                     proben integriert, z. B. 1990 eine Stichprobe für Ost-
    der achten Erhebungswelle.
4
                                                                     deutschland oder spezielle Migrantenstichproben
    Für eine ausführliche Beschreibung eines statistischen
    Matchings zwischen SOEP und administrativen Biographiedaten
                                                                     (1984, 1995, 2013, 2015, 2016 und 2017). Seit 2010
    der Deutschen Rentenversicherung s. Rasner, Himmelreicher,       umfasst das SOEP jährlich mehr als 25 000 befragte
    Grabka, Frick (2007). Best of Both Worlds: Preparatory Steps     Personen. Die Befragung für die SOEP-Daten wird
    in Matching Survey Data with Administrative Pension Records.     durch Kantar (ehemals Infratest) durchgeführt. Die
    DIW Data Documentation 24.                                       Teilnahme an der Studie ist freiwillig; trotzdem sind
5
    Vgl. Bönke, Corneo, Lüthen (2015), a. a. O.                      die jährlichen Wiederbefragungsquoten im langjähri-

                                                                                                RVaktuell 9/10/2020 231
gen Mittel mit ca. 94 % sehr hoch. So wurden von den     4. Aktueller Stand: Befragung und weitere Projekte
ca. 12 500 Personen der ersten beiden Stichproben        Der Datensatz SOEP-RV verbindet die genannten
der ersten Ziehung 1984 im Jahr 2015 immerhin noch       Datensätze auf Individualebene mittels Record Link-
etwa 3 500 Personen erfolgreich befragt6.                age. Zum Zeitpunkt der Entstehung dieses Aufsatzes
Die Daten des SOEP werden als faktisch anonymisier-      (Mitte Juli 2020) liegt die Zustimmungsquote der Be-
ter Scientific-Use-File durch das FDZ-SOEP der Wis-      fragten bei 54,4 %. Das entspricht ca. 8 000 Fällen,
senschaft national wie international bereitgestellt.     wobei Substichproben des SOEP hierbei noch nicht
Das SOEP wird derzeit von über 1 000 Nutzern welt-       berücksichtigt wurden, da deren Befragung noch
weit genutzt. Bislang wurden fast 9 000 Publikationen    nicht abgeschlossen ist11. Von diesen konnten 1 412
mit SOEP-Bezug veröffentlicht (s. www.diw.de/            Fälle aus befragungstechnischen Gründen 2018 nicht
soeplit)7.                                               befragt werden, was 2020 allerdings nachgeholt wird.
                                                         Das Forschungsprojekt SOEP-RV wird sukzessive aus-
3.2 RTBN                                                 geweitet. Seit 2019 wird die Substichprobe SOEP-
Der RTBN ist ein administrativer Datensatz der deut-     Innovationsstichprobe (SOEP-IS) befragt12. Außerdem
schen RV. Er führt sämtliche gesetzlichen Renten auf,    wird seit 2019 bei der schriftlichen Einwilligungs-
die in Deutschland vorliegen. Hierbei ist jede Rente     erklärung der Befragten zur Verknüpfung der Daten
ein Fall, und es wird zwischen einzelnen Rentenarten     auf die (freiwillige) Angabe der Sozialversicherungs-
wie Erwerbsminderungsrenten, Altersrenten oder           nummer verzichtet. Für einige Befragte ist es in der
Hinterbliebenenrenten unterschieden. Für jede Rente      Befragungssituation schwierig, die korrekte Sozial-
liegen u. a. der Zahlbetrag, die Bezugsdauer, die Ent-   versicherungsnummer anzugeben bzw. zu finden;
geltpunktegrundlage oder spezielle Merkmale wie          daher sollte die Zustimmungsrate ohne diese Hürde
Anrechnungsbeträge (im Fall von Hinterbliebenen-         merklich steigen, was sich auf Grundlage erster
renten) vor8. Für die Bestimmung der Rentenbezüge        SOEP-IS-Zahlen bestätigt. 2020 folgen die SOEP-Sub-
liegen in diesem Datensatz also genaue Informatio-       stichproben L2/3 (kinderreiche Familien), M1/M2 (Mi-
nen vor, wobei Hinterbliebenenrenten aus dem RTBN        granten), O (Soziale Stadt) und Q (LGB Personen)
nicht berücksichtigt werden können (diese werden         (s. Tabelle 1). Das ermöglicht insbesondere detail-
allerdings im SOEP erfragt)9. Insgesamt komplemen-       lierte Vergleiche der Erwerbsbiographien und der
tiert der RTBN das SOEP an wichtigen Stellen, vor        erworbenen Rentenansprüche von Migranten und
allem durch die Rentenartinformation, die exakte         Nicht-Migranten. Dieser Aufsatz bezieht sich aller-
Rentenhöhe und den Rentenbeginn.                         dings auf den aktuellen Stand vor der SOEP-Welle
                                                         2020 und somit auf die 8 141 Fälle, die einer Ver-
3.3 Die Versicherungskontenstichprobe (VSKT)             knüpfung ihrer Daten bereits schriftlich zugestimmt
                                                         haben. Während die Verknüpfung mit der VSKT Ende
Die VSKT ist ein administrativer Individualdatensatz
                                                         2020 vorgenommen werden kann, zeigen erste Ana-
der deutschen RV. Die Daten sind in unveränderliche
                                                         lysen, dass für 2 122 der bisherigen 8 141 Fälle eine
Merkmale wie Geschlecht oder Geburtsjahr und in
                                                         Rente aus dem RTBN verbunden werden kann. Neben
biographische Merkmale aufgeteilt. Die inhaltliche
Stärke der VSKT besteht vor allem in den enthaltenen
biographischen Verlaufsmerkmalen über das Ver-            6
                                                              Vgl. Goebel, Grabka, Liebig, Kroh, Richter, Schröder, Schupp
sichertenleben, die monatsgenau und valide erfasst            (2019). The German Socio-Economic Panel (SOEP). Jahrbücher
sind. Hier sind vor allem die Entgeltpunkte und die           für Nationalökonomie und Statistik 239.
                                                          7
soziale Erwerbssituation hervorzuheben. Aus den               Eine Übersicht der Forschungspotenziale und der aktuellen Ent-
Verlaufsmerkmalen lässt sich, bis zur Beitragsbemes-          wicklungen findet sich in Schröder, König, Fedorets, Goebel,
sungsgrenze, das Bruttoarbeitsentgelt berechnen.              Grabka, Lüthen, Metzing, Schikora, Liebig (2020). The Economic
                                                              Research Potentials of the German Socio-Economic Panel Stu-
Aus der sozialen Erwerbssituation lässt sich bestim-          dy, German Economic Review (im Erscheinen).
men, welcher rentenversicherungsrelevante Status          8
                                                              Für Forschung mit dem RTBN s. z. B. Haan, Kemptner und
(z. B. Arbeitslosigkeit, Beschäftigung oder Krankheit)        Lüthen (2020). The rising longevity gap by lifetime earnings –
in welchem Monat vorlag. Die monatsgenauen Bio-               Distributional implications for the pension system. Journal of
graphien sind vom Kalenderjahr, in dem das Indivi-            the Economics of Aging (im Erscheinen).
duum 14 Jahre alt wird, bis zum Kalenderjahr des          9
                                                              Hinterbliebenenrenten sind unter der Sozialversicherungsnum-
65. Geburtstags belegt. Insgesamt sind hierdurch              mer der verstorbenen Person gespeichert, die nicht abgefragt
Informationen über bis zu 624 Monate vorhanden.               wird. Somit kann keine Zuordnung an Empfangspersonen statt-
Für jeden dieser Monate können außerdem die An-               finden.
                                                         10
sprüche an die RV berechnet werden.                           S. auch Bönke, Corneo und Lüthen (2015), a. a. O., für Über-
                                                              sichten und Darstellungen der VSKT.
Für weiterführende Informationen über die VSKT sei       11
                                                              Für einen Überblick über die Substichproben im SOEP s. Goebel
auf die in diesem Aufsatz erwähnten Quellen oder die          et al. (2019), a. a. O., oder das entsprechende Kapitel im SOEP
Literatursuche des FDZ-RV verwiesen, die momentan             Companion (companion.soep.de).
knapp 350 Publikationen mit Daten des FDZ-RV auf-        12
                                                              Abschließende Zahlen zu SOEP-IS liegen aufgrund der Verzöge-
listet: http://forschung.deutsche-rentenversicherung.         rung durch COVID-19 bei Abschluss dieses Aufsatzes noch nicht
de/FdzPortalWeb/10.                                           vor.

232 RVaktuell 9/10/2020
Tabelle 1: Zustimmungsbefragung des Record Linkage der Deutschen Rentenversicherung: Stand 2019 und
           Plan 2020*

    Stichproben                                              A-L1+N         L2/3         M1/2           O            Q            IS
    Brutto-Fallzahl 2018 auf Personenebene                    16 378
    Hiervon befragt                                           14 966
    Einverständnis auf Personenebene                            8 141
    Einverständnis in %                                         54,4
    Befragt in 2018                                              ×
    Befragung 2019                                                                                                                ×
    Befragung 2020                                              ×**           ×            ×            ×            ×
    Geschätzte Brutto-Fallzahl 2020 auf Haus-
    haltsebene (Zahlen von Kantar)                            ~10 560      ~1 600       ~1 600        ~660         ~900        ~2 960
*  Legende: A-L1+N: Alt-Stichproben des SOEP, L2/3: CAWI-Screening-Stichproben aus der ehemaligen FiD-Studie (Familien in Deutschland),
   M1/M2: IAB-SOEP Migrationsstichproben (Personen, die nach 1995 zugewandert sind), O: „Soziale Stadt“ (Personen aus Gebieten des Städte-
   bauförderprogramms „Soziale Stadt“), Q: LGB*-Stichprobe (Nicht-Heterosexuelle + Personen mit diverser Geschlechtsidentität), IS: SOEP-
   Innovationsstichprobe.
** Zweite Abfrage derer, die ihr Einverständnis bisher nicht gegeben haben.

den Arbeiten an der Verknüpfung finden am SOEP                          Das Record Linkage verläuft schrittweise über die
bereits Arbeiten statt, um Validierungs- und Prüf-                      Substichproben des SOEP. Ein besonderer Vorteil des
routinen für den verknüpften Datensatz zu ent-                          SOEP ist es, dass es neben allgemeinen Stichproben
wickeln.                                                                der Gesamtbevölkerung auch Schwerpunktstichpro-
                                                                        ben, wie z. B. zu Migranten, beinhaltet. 2018 wurden
5. Fazit und Ausblick                                                   die Alt-Stichproben des SOEP befragt, 2019 das Inno-
Mit SOEP-RV entsteht ein Datensatz, der die Umfrage-                    vationssample und 2020 die weiteren Substichpro-
daten des SOEP mit Administrativdaten der deutschen                     ben. Da auch geplant ist, diese Datenzusammenfüh-
RV mittels Record Linkage verbindet. Hierdurch ent-                     rung auf künftige, momentan noch nicht bestehende
fällt die ansonsten auftretende statistische Unsicher-                  Substichproben auszuweiten, erscheint die Weiter-
heit traditioneller Matching-Methoden. Der verbun-                      führung von SOEP-RV durch die Kooperation der be-
dene Datensatz weist sowohl Vorteile von Umfrage-                       teiligten Forschungsdatenzentren auch in der Zukunft
daten, wie z. B. Haushaltsinformationen, als auch                       sichergestellt.
Vorteile von Administrativdaten, wie z. B. monats-                      SOEP-RV wird von den Forschungsdatenzentren der
genaue biographische Informationen, auf. Insbeson-                      Rentenversicherung und des SOEP erstellt, wobei
dere bietet SOEP-RV die Möglichkeit, die Bedeutung                      jedes Forschungsdatenzentrum einen Teildatensatz
des Zusammenlebens und -wirtschaftens in Haus-                          erstellt, der dann von den Nutzenden anhand einer
halten auf den materiellen Wohlstand über den ge-                       eindeutigen ID zusammengefügt werden kann. Die
samten Lebenszyklus zu messen. Ein weiterer                             Daten werden voraussichtlich 2021 veröffentlicht.
Schwerpunkt von SOEP-RV liegt bei der Beantwor-                         Nähere Informationen finden sich zeitnah sowohl
tung von Forschungsfragen zur Alterssicherung, da                       beim FDZ-RV als auch beim FDZ SOEP: http://for
das SOEP durch die Daten der RV an dieser Stelle                        schung.deutsche-rentenversicherung.de/FdzPortal
besonders gut ergänzt wird.                                             Web/ bzw. diw.de/soepfdz.

                                                                                                        RVaktuell 9/10/2020 233
Sie können auch lesen