FDZ-DATENREPORT 06|2021 DE Linked-Employer-Employee-Daten des IAB: LIAB-Längsschnittmodell (LIAB LM) 1975-2019 - Doku.iab .
←
→
Transkription von Seiteninhalten
Wenn Ihr Browser die Seite nicht korrekt rendert, bitte, lesen Sie den Inhalt der Seite unten
FDZ-DATENREPORT Dokumentation zu Arbeitsmarktdaten 06|2021 DE Linked-Employer-Employee-Daten des IAB: LIAB-Längsschnittmodell (LIAB LM) 1975–2019 Kevin Ruf, Lisa Schmidtlein, Stefan Seth, Heiko Stüber, Matthias Umkehrer IAB-Regional, IAB Bayern Nr|JJJJ 0
Linked-Employer-Employee-Daten des IAB: LIAB-Längsschnittmodell (LIAB LM) 1975–2019 Kevin Ruf (IAB), Lisa Schmidtlein (IAB), Stefan Seth (IAB), Heiko Stüber (IAB), Matthias Umkehrer (IAB) Die FDZ-Datenreporte beschreiben die Daten des FDZ im Detail. Diese Reihe hat somit eine doppelte Funktion: zum einen stellen Nutzerinnen und Nutzer fest, ob die angebotenen Daten für das Forschungsvorhaben geeignet sind, zum anderen dienen sie zur Vorbereitung der Auswertungen. FDZ-Datenreporte (FDZ data reports) describe FDZ data in detail. As a result, this series of reports has a dual function: on the one hand, those using the reports can ascertain whether the data offered is suitable for their research task; on the other, the data reports can be used to prepare evaluations.
Inhaltsverzeichnis 1 Einleitung und Kurzbeschreibung .......................................................................................6 1.1 Einleitung ............................................................................................................................. 6 1.2 Datennutzung....................................................................................................................... 8 1.2.1 Datenzugang ............................................................................................................. 8 1.2.2 Datenhaltung............................................................................................................. 8 1.2.3 Dateinamen im LIAB LM 7519 ................................................................................. 12 1.3 Veränderungen zum LIAB LM 7517 .................................................................................... 12 1.3.1 Beobachtungszeitraum........................................................................................... 12 1.3.2 Merkmalskanon ....................................................................................................... 12 1.3.3 Merkmalsbeschreibungen ...................................................................................... 13 1.3.4 Bereinigung der Schlüsseldatei .............................................................................. 13 1.4 Steckbrief ........................................................................................................................... 14 1.5 Merkmalsliste ..................................................................................................................... 16 1.6 Mengengerüst .................................................................................................................... 18 2 Datenquellen .................................................................................................................... 20 2.1 Beschäftigtenhistorik (BeH)............................................................................................... 21 2.2 Leistungsempfängerhistorik (LeH) .................................................................................... 22 3 Datenaufbereitung und Stichprobenziehung .................................................................... 23 3.1 Bereinigungen und Aufbereitungen .................................................................................. 23 3.1.1 Beschäftigtenhistorik (BeH) .................................................................................... 23 3.1.2 Leistungsempfängerhistorik (LeH) ......................................................................... 24 3.2 Episodensplitting ............................................................................................................... 24 3.3 Stichprobenziehung........................................................................................................... 25 3.4 Fehlende Werte .................................................................................................................. 26 4 Datenqualität und Probleme ............................................................................................ 26 4.1 Gesamte IEB ....................................................................................................................... 26 4.1.1 Lücken in den Erwerbsbiografien ........................................................................... 26 4.1.2 Einführung des SGB II und spätere Trägerwechsel ................................................ 28 4.2 Beschäftigtenhistorik (BeH)............................................................................................... 29 4.3 Leistungsempfängerhistorik (LeH) .................................................................................... 31 5 Variablenbeschreibung ..................................................................................................... 32 5.1 Identifikatoren ................................................................................................................... 32 5.1.1 Systemfreie Personennummer (persnr) ................................................................. 32 5.1.2 Systemfreie Betriebsnummer (betnr)..................................................................... 32 FDZ-Datenreport 06|2021 DE 2
5.1.3 Betriebsnummer nach Betriebspanel (idnum) ...................................................... 33 5.2 Generierte technische Merkmale ...................................................................................... 33 5.2.1 Satzzähler pro Konto (spell) ................................................................................... 33 5.2.2 Quelle des Satzes (quelle) ....................................................................................... 34 5.2.3 Jahr (jahr) ................................................................................................................ 34 5.2.4 Status der Betriebsnummer (betr_st) .................................................................... 34 5.3 Gültigkeitszeitraum ........................................................................................................... 35 5.3.1 Beginndatum Originalbeobachtung (begorig)....................................................... 35 5.3.2 Enddatum Originalbeobachtung (endorig)............................................................ 35 5.3.3 Beginndatum Episode (begepi) .............................................................................. 36 5.3.4 Enddatum Episode (endepi) ................................................................................... 36 5.4 Informationen zur Person .................................................................................................. 36 5.4.1 Geschlecht (frau) ..................................................................................................... 36 5.4.2 Geburtsjahr (gebjahr) .............................................................................................. 37 5.4.3 Geburtsmonat (gebmon) ........................................................................................ 37 5.4.4 Staatsangehörigkeit (nation) .................................................................................. 37 5.4.5 Staatsangehörigkeit vergröbert (nation_gr) .......................................................... 38 5.4.6 Familienstand (famst) ............................................................................................. 38 5.4.7 Kinderzahl (kind) ..................................................................................................... 38 5.4.8 Ausbildung (ausbildung) ......................................................................................... 39 5.4.9 Ausbildung (imputiert) (ausbildung_imp).............................................................. 40 5.4.10 Schulausbildung (schule)........................................................................................ 40 5.5 Informationen zu Beschäftigung und Leistungsbezug ..................................................... 41 5.5.1 Tagesentgelt/ täglicher Leistungssatz (tentgelt) ................................................... 41 5.5.2 Beruf – ausgeübte/letzte Tätigkeit (KldB 1988) (beruf) ......................................... 42 5.5.3 Berufsgruppe – ausgeübte/letzte Tätigkeit (KldB 2010) (beruf2010_3) ................ 43 5.5.4 Berufsuntergruppe – ausgeübte/letzte Tätigkeit (KldB 2010) (beruf2010_4) ....... 43 5.5.5 Anforderungsniveau – ausgeübte/letzte Tätigkeit (KldB 2010) (niveau) .............. 44 5.5.6 Teilzeit (teilzeit) ....................................................................................................... 45 5.5.7 Stellung im Beruf und Arbeitszeit (stib).................................................................. 46 5.5.8 Erwerbsstatus (erwstat) .......................................................................................... 46 5.5.9 Gleitzone (gleitz) ..................................................................................................... 47 5.5.10 Leiharbeit (leih) ....................................................................................................... 48 5.5.11 Befristung (befrist) .................................................................................................. 48 5.5.12 Abmeldegrund / Abgabegrund / Beendigungsgrund (grund) ............................... 48 5.5.13 Restanspruch/geplante Dauer (restanspruch) ...................................................... 49 5.5.14 Beginndatum der Arbeitslosigkeit (alo_beg) ......................................................... 50 5.5.15 Dauer der Arbeitslosigkeit (alo_dau)...................................................................... 50 5.6 Ortsangaben....................................................................................................................... 51 5.6.1 Wohnort – Kreis (wo_kreis) ..................................................................................... 51 5.6.2 Wohnort – Bundesland (wo_bula) .......................................................................... 52 5.6.3 Wohnort – Arbeitsagentur (wo_aa) ........................................................................ 52 5.6.4 Wohnort – Regionaldirektion (wo_rd) .................................................................... 53 FDZ-Datenreport 06|2021 DE 3
5.7 Betriebsmerkmale ............................................................................................................. 53 5.7.1 WZ73 3-Steller (w73_3) ........................................................................................... 53 5.7.2 WZ93 5-Steller (w93_5) ........................................................................................... 54 5.7.3 WZ93 3-Steller (w93_3) ........................................................................................... 54 5.7.4 WZ03 5-Steller (w03_5) ........................................................................................... 55 5.7.5 WZ03 3-Steller (w03_3) ........................................................................................... 55 5.7.6 WZ08 5-Steller (w08_5) ........................................................................................... 56 5.7.7 WZ08 3-Steller (w08_3) ........................................................................................... 56 5.7.8 w73_3 vervollständigt durch Extrapolation/Imputation (w73_3_gen)................. 56 5.7.9 Art der Vervollständigung w73_3 (group_w73_3) .................................................. 57 5.7.10 w93_3 vervollständigt durch Extrapolation/Imputation (w93_3_gen)................. 57 5.7.11 Art der Vervollständigung w93_3 (group_w93_3) .................................................. 58 5.7.12 w08_3 vervollständigt durch Extrapolation/Imputation (w08_3_gen)................. 58 5.7.13 Art der Vervollständigung w08_3 (group_w08_3) .................................................. 58 5.7.14 Jahr des 1. Auftretens der Betriebsnummer (grd_jahr) ......................................... 59 5.7.15 Erstes Auftreten Betriebsnummer (grd_dat).......................................................... 59 5.7.16 Jahr des letzten Auftretens der Betriebsnummer (lzt_jahr) .................................. 60 5.7.17 Letztes Auftreten Betriebsnummer (lzt_dat) ......................................................... 60 5.7.18 Anzahl Beschäftigte gesamt (az_ges) ..................................................................... 60 5.7.19 Anzahl in Vollzeit (Normalbeschäftigte + sonstige) (az_vz) ................................... 61 5.7.20 Anzahl geringfügig Beschäftigte (az_gf) ................................................................. 61 5.7.21 Mittelwert imp. Bruttotagesentgelt Vollzeitbeschäftigte (te_imp_mw) ............... 61 5.7.22 Arbeitsort – Kreis (ao_kreis) .................................................................................... 62 5.7.23 Arbeitsort – Bundesland (ao_bula)......................................................................... 63 6 Literatur ........................................................................................................................... 64 7 Anhang ............................................................................................................................. 66 7.1 Auszählungen ..................................................................................................................... 66 7.2 Abkürzungsverzeichnis ...................................................................................................... 66 FDZ-Datenreport 06|2021 DE 4
Zusammenfassung Dieser Datenreport beschreibt das LIAB-Längsschnittmodell 1975 – 2019 (LIAB LM 7519). Abstract This data report describes the LIAB Longitudinal Model 1975 – 2019 (LIAB LM 7519). Keywords German administrative micro data, labour market data, linked employer-employee data, data manual Danksagung Für ihre Mitarbeit und Unterstützung danken wir den Kolleginnen und Kollegen des Forschungsdatenzentrums (FDZ), des Bereichs Betriebe und Beschäftigung (D1) sowie des Geschäftsbereichs Daten- und IT-Management (DIM) des Instituts für Arbeitsmarkt- und Berufsforschung. Der vorliegende Datenreport ist eine Überarbeitung des FDZ-Datenreports 05/2019 (Autoren: Schmidtlein, Seth, Umkehrer). Darüber hinaus wurden einzelne Passagen aus dem FDZ-Datenreport 01/2021 (Autoren: Frodermann, Schmucker, Seth, vom Berge) und IAB- internen Datendokumentationen von IAB-DIM übernommen. Datenverfügbarkeit Der in diesem Beitrag beschriebene Datensatz ist für die Fachöffentlichkeit zugänglich. Nähere Informationen dazu auf der Internetseite https://fdz.iab.de/. FDZ-Datenreport 06|2021 DE 5
1 Einleitung und Kurzbeschreibung 1.1 Einleitung Das LIAB Längsschnittmodell (LM) 7519 ist einer der Linked-Employer-Employee-Datensätze des Instituts für Arbeitsmarkt- und Berufsforschung (IAB), die über das Forschungsdatenzentrum (FDZ) der Bundesagentur für Arbeit (BA) für wissenschaftliche Auswertungen zur Verfügung stehen. Es verknüpft Informationen zu Betrieben aus dem IAB-Betriebspanel, einer jährlich stattfindenden Betriebsbefragung, mit Information zu deren Beschäftigten aus den Prozessdaten der BA. Das IAB-Betriebspanel ist eine jährliche, repräsentative Arbeitgeberbefragung zu betrieblichen Determinanten der Beschäftigung. Die Erhebung wird seit 1993 in Westdeutschland und seit 1996 in Ostdeutschland durchgeführt. Sie stellt die zentrale Quelle für Analysen zur Arbeitskräftenachfrage auf dem deutschen Arbeitsmarkt dar. Dieser Datenreport konzentriert sich auf die Beschreibung der Personendaten im LIAB LM 7519. Nähere Informationen zum IAB-Betriebspanel finden sich auf den Internetseiten des FDZ (https://fdz.iab.de/de/FDZ_Establishment_Data/IAB_Establishment_Panel.aspx). Die administrativen Daten zu den Beschäftigten stammen aus den Integrierten Erwerbsbiographien (IEB) des IAB. Die IEB enthalten Daten zu allen Personen, die im Beobachtungszeitraum mindestens einmal einen der folgenden Zustände aufweisen: • sozialversicherungspflichtige Beschäftigung in Deutschland (erfasst ab 1975), • geringfügige Beschäftigung in Deutschland (erfasst ab 1999), • Bezug von Leistungen nach dem Rechtskreis SGB III (erfasst ab 1975) oder SGB II (erfasst ab 2005), • bei der Bundesagentur für Arbeit (BA) bzw. den Grundsicherungsträgern als arbeitsuchend gemeldet (erfasst ab 1997), • Teilnahme an arbeitsmarktpolitischer Maßnahme (erfasst ab 2000). Diese aus unterschiedlichen Datenquellen stammenden Informationen werden in den IEB zusammengeführt und tagesgenau abgebildet. Während die Beschäftigtenhistorik (BeH) Ursprung der Informationen zu sozialversicherungspflichtiger und geringfügiger Beschäftigung ist, wird der Bezug von Leistungen nach den Rechtskreisen des SGB III und des SGB II in der Leistungsempfängerhistorik (LeH) bzw. in der Leistungshistorik Grundsicherung (LHG) erfasst. Die Arbeitsuchendenhistoriken (ASU und XASU) stellen die Datenquelle für die durch die BA bzw. die durch die kommunalen Grundsicherungsträger erfassten Zeiten der Arbeitsuche dar, während die Teilnahme an arbeitsmarktpolitischen Maßnahmen in den Maßnahmeteilnahmehistoriken (MTH und XMTH) erfasst wird. Die Personendaten im LIAB LM 7519 umfassen nur Informationen aus den Quellen Beschäftigtenhistorik (BeH) und Leistungsempfängerhistorik (LeH). Die übrigen Quellen sind nicht in den Personendaten des LIAB LM 7519 enthalten. Das IAB-Betriebspanel bildet den Ausgangspunkt für die Ziehung der Personendaten des LIAB LM 7519. Abbildung 1 bietet einen Überblick über die einzelnen Schritte (nähere Details finden sich in Kapitel 3). Zuerst werden die Betriebe aus dem IAB-Betriebspanel ausgewählt, die Teil des Panel- FDZ-Datenreport 06|2021 DE 6
Zeitraums 2009 – 2016 sind (sogenannte Panelfälle). Diese Einschränkung ist aufgrund von Beschränkungen bei der Datensatzgröße notwendig. Anschließend werden sämtliche Personen ausgewählt, die laut den Prozessdaten mindestens einen Tag zwischen 2008 und 2017 bei zumindest einem dieser Betriebe beschäftigt waren. Letztlich werden die administrativen Erwerbsbiographien dieser Personen aus den IEB im Zeitraum 1975 – 2019 dem LIAB LM 7519 zugespielt. Trotz der genannten Einschränkung der Betriebe bei der Ziehung der Personendaten umfasst das LIAB LM 7519 die Befragungsdaten zu allen Betriebe, die im IAB-Betriebspanel zwischen 1993 und 2019 befragt wurden (also auch die Befragungsdaten zu den Betrieben, die keinen Panelfall darstellen). Allerdings können lediglich für die gewählten Panelfälle alle Beschäftigten eines Betriebes in den Personendaten beobachtet werden. Zudem bilden die Personendaten auch Beschäftigungszeiten bei Betrieben ab, die nicht befragt wurden. Für diese Betriebe kann abermals nicht die Gesamtheit aller Beschäftigten in den Personendaten beobachtet werden. Allerdings können administrative Betriebsinformationen aus dem Betriebs-Historik-Panel (BHP) allen im LIAB LM 7519 enthaltenen Betrieben zugespielt werden (siehe https://fdz.iab.de/de/FDZ_Establishment_Data/Establishment_History_Panel.aspx). Das LIAB LM 7519 wird im Forschungsdatenzentrum der Bundesagentur für Arbeit im IAB produziert. Der Datensatz umfasst die Erwerbsverläufe von 1.688.101 Individuen, deren Erwerbsbiografien in insgesamt 60.220.485 Datenzeilen dokumentiert sind. Der vorliegende Datenreport beschreibt die einzelnen Merkmale, welche weitgehend auf den Originaldaten, d. h. nicht vergröberte Daten, basieren. Einige Merkmale sind allerdings als besonders sensibel eingestuft und werden nur auf gesonderten Antrag (siehe Abschnitt 1.2) weitergegeben. In Abgrenzung zum Querschnittmodell des LIAB umfasst das Längsschnittmodell die gesamten zeitraumbezogenen Erwerbsbiographien von Personen einer Unterstichprobe der im IAB- Betriebspanel wiederholt befragten Betriebe. Für diese Untergruppe lassen sich Erwerbsbiographien somit auch bei Betriebswechseln und Übergängen in Arbeitslosigkeit verfolgen. Im Querschnittmodell hingegen werden die Erwerbsbiographien jeweils immer nur zum Stichtag 30. Juni abgebildet. Allerdings werden zu allen im IAB-Betriebspanel befragten Betrieben die Erwerbsbiographien aller Beschäftigten zugespielt, die im Befragungsjahr zum Stichtag 30. Juni bei einem dieser Betriebe beschäftigt waren. Eine Übersicht zu den verschiedenen LIAB- Datensätzen findet sich auf den Internetseiten des FDZ (https://fdz.iab.de/de/Integrated_Establishment_and_Individual_Data/LIAB.aspx). Dieser Datenreport gliedert sich wie folgt: Neben der Einleitung enthält Kapitel 1 unter anderem Informationen zum Datenzugang sowie eine Kurzbeschreibung der Daten, das Mengengerüst und eine Merkmalsliste. Eine detaillierte Beschreibung der einzelnen Datenquellen findet sich in Kapitel 2. Die Datenaufbereitung sowie die Datenqualität werden in den Kapiteln 3 und 4 diskutiert, während die einzelnen Merkmale in Kapitel 5 dargestellt werden. FDZ-Datenreport 06|2021 DE 7
Abbildung 1: Aufbau des LIAB LM 7519. Für Panelfälle lassen sich in den Personendaten alle Beschäftigten eines Betriebes beobachten, für alle anderen Betriebe sind jeweils nur einzelne Beschäftigte beobachtbar. Jedoch lassen sich für alle im LIAB LM 7519 enthaltenen Betriebe administrative Informationen auf Betriebsebene aus dem Betriebs-Historik-Panel (BHP) zuspielen. 1. Ausgangspunkt: Betriebsbefragung (IAB-Betriebspanel) IAB-Betriebspanel 2. Auswahl der Betriebe aus dem IAB-Betriebspanel, die Teil des Panel-Zeitraums 2009 – 2016 sind (Panelfälle) Panelfälle 3. Auswahl der Personen, die in den Panel-Betrieben zwischen 2008 und 2017 beschäftigt sind Beschäftigte aus Panel-Betrieben 4. Zuspielen der tagesgenauen administrativen Erwerbsbiographien von 1975 bis 2019 zu den in Schritt 3 gewählten Personen Erwerbsbiographien Fiktives Beispiel: persnr begepi endepi Betrieb ein Panelfall? (1=Ja) … 1 01.01.1975 31.12.1975 0 1 01.01.1976 30.06.1976 0 … 1 01.01.2019 31.12.2019 1 1.2 Datennutzung 1.2.1 Datenzugang Die LIAB-Daten liegen in schwach anonymisierter Form vor und können somit ausschließlich im Rahmen von Gastaufenthalten am FDZ und anschließender Datenfernverarbeitung ausgewertet werden. Für die Datennutzung ist ein Antrag beim FDZ einzureichen. Über die Genehmigung des Forschungsprojekts entscheidet das FDZ im Auftrag und ggf. unter Abstimmung mit dem Bundesministerium für Arbeit und Soziales (BMAS). Nach erfolgter Genehmigung wird ein Nutzungsvertrag mit der wissenschaftlichen Einrichtung der Forschenden geschlossen. Details zur Beantragung des Datensatzes und Datenverarbeitungsmöglichkeiten können der FDZ-Website entnommen werden. 1.2.2 Datenhaltung Die LIAB-Daten, die sowohl deutsch- als auch englischsprachige Labels enthalten, 1 sind modular gegliedert und in mehreren Dateien abgelegt (vgl. Abbildung 2). Ein erstes Modul umfasst alle Wellen des IAB-Betriebspanels, die jeweils als separater Datensatz abgelegt sind. In den Wellen 1 Mit den Stata-Befehlen label language en oder label language de kann auf englisch- bzw. deutschsprachige Labels umgestellt werden. FDZ-Datenreport 06|2021 DE 8
finden sich jahresspezifische Informationen zu Beschäftigungsentwicklung, Geschäftspolitik und Geschäftsentwicklung, betriebliche Investitionen, Innovationen im Betrieb, öffentliche Förderung, Personalstruktur, Berufsausbildung und Ausbildungsstellen, Personaleinstellungen und -abgänge, Personalsuche, Löhne und Gehälter, betriebliche Arbeitszeiten, Fort- und Weiterbildung oder auch allgemeine Angaben zum Betrieb. Das LIAB LM 7519 enthält die gesamten Befragungsdaten des IAB-Betriebspanels, unabhängig davon, ob ein Betrieb für die Ziehung der Personendaten ausgewählt wurde oder nicht. Ein zweites Modul, das im weiteren Verlauf Personendatei genannt wird, enthält Identifikatoren (systemfreie Personen- und Betriebsnummer), persönliche Merkmale, Informationen zu Beschäftigung und Leistungsbezug, Merkmale zum Wohnort sowie technische Merkmale. Ein drittes Modul, die Basis-Betriebsdatei, enthält die Betriebsnummer, das Jahr und Merkmale zu Arbeitsort und Wirtschaftszweigen sowie weitere Betriebsinformationen zum Stichtag 30. Juni. Für Ostdeutschland liegen diese administrativen Betriebsdaten erst ab 1992 vor. Die Basis- Betriebsdatei stammt aus dem Betriebs-Historik-Panel (BHP). Das BHP umfasst alle Betriebe in Deutschland, die zum 30. Juni eines Jahres mindestens einen sozialversicherungspflichtigen oder seit 1999 auch geringfügig Beschäftigten aufweisen. Quelle des BHP ist die Beschäftigten-Historik (BeH) des IAB. Im BHP werden die Personendaten der BeH mit Hilfe der Betriebsnummern auf die Betriebs-Jahrebene aggregiert. Nähere Informationen zum BHP finden sich auf den Internetseiten des FDZ (https://fdz.iab.de/de/FDZ_Establishment_Data/Establishment_History_Panel.aspx). Einige der in der Merkmalsliste (vgl. Tabelle 4), in der Spalte „BHP“, aufgeführten Merkmale sind bereits in der Basis-Betriebsdatei enthalten. Auf begründeten Antrag können aus dem BHP weitere Betriebsmerkmale in Variablenblöcken bereitgestellt werden (vgl. Abbildung 2). Zudem können die Erweiterungsmodule Beschäftigungsströme (Eintritte/Austritte) und Betriebsdynamik (Gründungen/Schließungen) mit gesonderter Begründung beantragt werden. Einen Überblick bietet die Liste der BHP-Zusatzmerkmale: http://doku.iab.de/fdz/access/BHP_Variablen.pdf. Betriebs- und Personendaten sind organisatorisch voneinander getrennt, was die Struktur der Daten deutlich macht und Speicherplatz spart. Die Verknüpfung der einzelnen Dateien erfolgt über die programmspezifischen Kommandos der zur Datenaufbereitung und -analyse genutzten Softwarepakete. So können Verknüpfungen beispielsweise in Stata unter Verwendung des „merge“-Befehls durchgeführt werden. Die Verknüpfung der Wellen des IAB-Betriebspanels und der Personendatei erfolgt über die in beiden Modulen enthaltene Betriebsnummer des IAB- Betriebspanels (idnum; siehe Kasten 1). Basis-Betriebsdatei und Personendatei werden dagegen über die systemfreie Betriebsnummer (betnr) und das Jahr (jahr) verknüpft (siehe Kasten 2). Gleiches gilt für die Erweiterungsmodule aus dem BHP. FDZ-Datenreport 06|2021 DE 9
Abbildung 2: Datenhaltung der Linked-Employer-Employee-Daten im LIAB LM 7519 IAB-Betriebspanel in „Wellen“ Personendatei von 1993 bis 2019 Datei: Betriebs-Historik-Panel Datei: iabbp_jjjj.dta liab_lm_7519_v1_pers.dta (BHP) (jjjj = 1993 – 2019) (ggf. mit sensiblen Merkmalen) Basis-Betriebsdatei Beschäftigungsströme: Eintritte Datei: liab_lm_7519_v1_bhp_basis_v2.dta Datei: liab_lm_7519_v1_bhp_inflow_v2.dta (ggf. mit sensiblen Merkmalen) Beschäftigungsströme: Austritte Datei: liab_lm_7519_v1_bhp_outflow_v2.dta Betriebsdynamik: Gründungen Datei: liab_lm_7519_v1_bhp_entry_v2.dta Betriebsdynamik: Schließungen Datei: liab_lm_7519_v1_bhp_exit_v2.dta Variablenblöcke in „Jahresscheiben“ von 1975 bis 2019 Datei: liab_lm_7519_v1_bhp_v2_jjjj.dta (jjjj = 1975 – 2019) „auf begründeten Antrag hin verfügbar“ Kasten 1: Beispielcode Stata 14; Verknüpfung der Personendatei mit einer Welle des IAB- Betriebspanels use liab_lm_7519_v1_pers.dta merge m:1 idnum using iabbp_2000.dta Kasten 2: Beispielcode Stata 14; Verknüpfung der Personendatei mit der Basis-Betriebsdatei use liab_lm_7519_v1_pers.dta merge m:1 betnr jahr using liab_lm_7519_v1_bhp_basis_v2.dta Wie bereits erwähnt enthalten die LIAB Modelle zwei unterschiedliche Betriebsidentifikatoren, die „Systemfreie Betriebsnummer“ (betnr) der administrativen Daten (siehe Abschnitt 5.1.2) und die „Betriebsnummer nach Betriebspanel“ (idnum) (siehe Abschnitt 5.1.3). Die idnum wird benötigt, um die Wellen des IAB-Betriebspanels an die Personendatei zu spielen (siehe Kasten 1). Hierzu FDZ-Datenreport 06|2021 DE 10
wurde bei der Erstellung des LIAB LM bisher der originale betnr-idnum Schlüssel genutzt. In aktuelleren Jahren gibt es im betnr-idnum Schlüssel jedoch einige nicht eineindeutige Verknüpfungen. In einigen sehr wenigen Fällen sind in einigen Jahren jeweils zwei betnr einer idnum zugeordnet. Daher wurde für das LIAB LM 7519 der Schlüssel um diese Fälle bereinigt, indem alle Beobachtungen für diese Betriebe gelöscht wurden. Somit ist innerhalb eines Jahres eine betnr nun eineindeutig einer idnum zugewiesen. Beim Zusammenspielen der Datensätze ist jedoch zu beachten, dass einer „Betriebsnummer nach Betriebspanel“ (idnum) — über die Jahre — mehrere „Systemfreie Betriebsnummern“ (betnr) der administrativen Daten zugeordnet sein können. Dies kann beispielsweise dann auftreten, wenn ein Betrieb, der am IAB-Betriebspanel teilgenommen hat, die Befragung aussetzt und zu einem späteren Zeitpunkt wieder an der Befragung teilnimmt. In solchen Fällen wird dem Betrieb bei der erneuten Teilnahme eine neue idnum zugewiesen. Innerhalb eines Jahres ist eine idnum jedoch immer eineindeutig einer betnr zugeordnet. Daher ist es wichtig, dass beim Zusammenspielen der Personendatei mit den Wellen des IAB-Betriebspanels immer von der Personendatei ausgegangen wird, wie im Kasten 1 beispielhaft dargestellt. 2 Bestimmte Merkmale, die eine Deanonymisierung von Personen oder Betrieben erleichtern, werden nur dann im Original weitergegeben, wenn es für das Analyseziel notwendig ist und dies im Antrag auf den Datenzugang explizit begründet wird. Diese aus datenschutzrechtlicher Sicht besonders sensiblen Merkmale sind: Personendatei: • Staatsangehörigkeit (nation) • Geburtsmonat (gebmon) • Berufsuntergruppe (beruf2010_4) • Wohnort – Arbeitsagentur (wo_aa) • Wohnort –Kreis (wo_kreis) Basis-Betriebsdatei: • Arbeitsort – Kreis (ao_kreis) • Wirtschaftszweig – Wirtschaftsunterklasse (5-Steller) (w93_5) • Wirtschaftszweig – Wirtschaftsunterklasse (5-Steller) (w03_5) • Wirtschaftszweig – Wirtschaftsunterklasse (5-Steller) (w08_5) • Erstes Auftreten Betriebsnummer (grd_dat) • Letztes Auftreten Betriebsnummer (lzt_dat) Sofern sie beantragt und genehmigt wurden, befinden sich die hier aufgeführten sensiblen Merkmale in den entsprechenden Dateien (siehe Abbildung 2). 2 Spielt man hingegen die Personendatei an die Wellen des IAB-Betriebspanels, kann es vorkommen, dass eine betnr zwei idnums zugeordnet wird. Dies kommt zustande, da Betriebsnummern im IAB-Betriebspanel zum Teil auch nach der letzten Befragung in den Datensätzen enthalten sind, damit die Betriebsgewichte weiterhin verfügbar sind (Fälle mit Wellenkennzeichen „Z“; siehe z. B. Ellguth et al. 2014). FDZ-Datenreport 06|2021 DE 11
1.2.3 Dateinamen im LIAB LM 7519 Wellen des IAB-Betriebspanels iabbp_jjjj.dta, jjjj = 1993 – 2019 Personendatei liab_lm_7519_v1_pers.dta Basis-Betriebsdatei liab_lm_7519_v1_bhp_basis_v2.dta Erweiterungsmodule BHP Bestandsdaten mit Variablenblöcken liab_lm_7519_v1_bhp_v2_jjjj.dta, jjjj = 1975 – 2019 Beschäftigtenströme liab_lm_7519_v1_bhp_inflow_v2.dta liab_lm_7519_v1_bhp_outflow_v2.dta Betriebsdynamik liab_lm_7519_v1_bhp_entry_v2.dta liab_lm_7519_v1_bhp_exit_v2.dta 1.3 Veränderungen zum LIAB LM 7517 1.3.1 Beobachtungszeitraum Das LIAB LM 7519 unterscheidet sich vom LIAB LM 7517 im abgebildeten Zeitraum für die Personen- und Betriebsdaten. 1.3.2 Merkmalskanon Im LIAB LM 7519 wurden gegenüber früheren Versionen die Angaben zum Wohnort Kreis (wo_kreis), Wohnort Bundesland (wo_bula), Wohnort Arbeitsagentur (ao_aa) und Wohnort Regionaldirektion (wo_rd) für die Beschäftigtendaten mit Gültigkeit zum Beginn der Originalepisode und nicht mehr mit Gültigkeit zum 31.12. des jeweiligen Jahres zugespielt (siehe Abschnitte 5.6.1 bis 5.6.4). Darüber hinaus haben sich die Werte der Ausprägungen in den Variablen Erwerbsstatus (erwstat) und Abmeldegrund / Abgabegrund / Beendigungsgrund (grund) aufgrund von internen technischen Umstellungen geändert (siehe Abschnitte 5.5.8 und 5.5.12). Die Inhalte sind unverändert. Zusätzlich gibt es neue Ausprägungen in der Variable grund. Zudem wurden unrealistische Werte im Merkmal „Restanspruch / geplante Dauer“ (restanspruch) als fehlende Angaben umkodiert (siehe Abschnitt 5.5.13). Tabelle 1 gibt einen Überblick über die Änderungen im Merkmalskanon über alle Quellen hinweg. FDZ-Datenreport 06|2021 DE 12
Tabelle 1: Neue, entfallene und veränderte Merkmale im LIAB LM 7519 Merkmal Erläuterung Wohnort (wo_kreis, wo_bula, Für Beschäftigtendaten ab Version LIAB LM 7519 wo_aa, wo_rd) mit Gültigkeit zum Beginn der Originalepisode zugespielt Erwerbsstatus (erwstat) Umkodierung gegenüber der LIAB LM 7517: 1 auf 11, 2 auf 12, 3 auf 13, 5 auf15, 10 auf 2, 11 auf 8, 13 auf 1, 14 auf 6, 15 auf 7, 17 auf 5, 18 auf 9 Abmeldegrund / Abgabegrund / Umkodierung gegenüber der LIAB LM 7517 Beendigungsgrund (grund) (Wertebereiche): 10er auf 100er, 2000er auf 1100er (-1), 3000er auf 500er, 5000er auf 200er, 6000er auf 300er Neue Ausprägungen Restanspruch / geplante Dauer Umkodierung unrealistischer Werte auf fehlende (restanspruch) Angabe 1.3.3 Merkmalsbeschreibungen Im vorliegenden Datenreport wurden die Beschreibungen für folgende Merkmale überarbeitet bzw. ergänzt: • Familienstand (famst) • Kinderzahl (kind) • Ausbildung (ausbildung) • Ausbildung (imputiert) (ausbildung_imp) • Schulausbildung (schule) • Beruf – ausgeübte/letzte Tätigkeit (KldB 1988) (beruf) • Berufsgruppe – ausgeübte/letzte Tätigkeit (KldB 2010) (beruf2010_3) • Berufsuntergruppe – ausgeübte/letzte Tätigkeit (KldB 2010) (beruf2010_4) • Anforderungsniveau – ausgeübte/letzte Tätigkeit (KldB 2010) (niveau) • Teilzeit (teilzeit) • Stellung im Beruf und Arbeitszeit (stib) • Erwerbsstatus (erwstat) • Gleitzone (gleitz) • Leiharbeit (leih) • Befristung (befrist) • Abmeldegrund / Abgabegrund / Beendigungsgrund (grund) • Restanspruch/geplante Dauer (restanspruch) • Wohnort – Kreis (wo_kreis) • Wohnort – Arbeitsagentur (wo_aa) • Arbeitsort – Kreis (ao_kreis) 1.3.4 Bereinigung der Schlüsseldatei Um die Wellen des IAB-Betriebspanels an die Personendatei zu spielen wurde bei der Erstellung des LIAB LM bisher der originale betnr-idnum Schlüssel genutzt. In aktuelleren Jahren gibt es im FDZ-Datenreport 06|2021 DE 13
Schlüssel jedoch einige nicht eineindeutige Verknüpfungen. Deshalb wurde für das LIAB LM 7519 der Schlüssel um diese Fälle bereinigt. Außerdem wurde die Beschreibung des Vorgehens bei der Verknüpfung der Dateien in Kapitel 1.2.2 erweitert. 1.4 Steckbrief Tabelle 2: Steckbrief Themen/ Beschäftigtenhistorik (BeH): Merkmalsgruppen Jahres- und Abmeldungen zur Sozialversicherung für sozialversicherungspflichtig und geringfügig Beschäftigte Leistungsempfängerhistorik (LeH): Informationen zu Leistungsbezug nach SGB III für Bezieher von Arbeitslosengeld, Arbeitslosenhilfe und Unterhaltsgeld IAB-Betriebspanel: Informationen aus jährlicher Betriebsbefragung mit wechselnden Schwerpunktthemen Untersuchungseinheit Betriebe, sozialversicherungspflichtige Beschäftigte (ab 1999 auch geringfügig Beschäftigte), Leistungsempfänger Fallzahlen Verknüpfte Betriebe: 2.427 bis 12.270 pro Jahr, 44.703 insgesamt Personen: 135.755 bis 1.397 016 pro Jahr, 1.688.101 insgesamt Überschneidungsfreie Sätze (nach Episodensplitting): 60.220.485 Zeitraum Der Zeitraum hängt von der Datenquelle ab. BeH: 01.01.1975 – 31.12.2019 (2016: 36-Monats-Datei 2017 und 2018: 18-Monats-Datei, 2019: 6-Monats-Datei) LeH: 01.01.1975 – 31.12.2019 Zeitbezug Betriebe: Stichtag 30. Juni Personen: Tagesgenau Regionale Gliederung Bundesländer, Kreise Gebietsstand Gebietsstandbereinigt zum 31.12.2019 Erhebungsdesign Linked-Employer-Employee-Daten; Auswahl bestimmter Betriebe aus Betriebsbefragung und Zuspielen der Erwerbsbiographien ihrer Beschäftigten aus Prozessdaten. Beteiligte Sozialversicherungsträger, Bundesagentur für Arbeit, Kantar Public Institutionen (ehemals TNS Infratest Sozialforschung GmbH) in Zusammenarbeit mit dem Institut für Sozialökonomische Strukturanalysen GmbH (SÖSTRA) Frequenz der Administrative Daten: laufend Datensammlung Daten des IAB-Betriebspanels: einmal jährlich FDZ-Datenreport 06|2021 DE 14
Dateiformat/ -größe Stata Betriebsdaten (ohne sensible Merkmale): IAB-Betriebspanel: ca. 1,6 bis 10,5 MB pro Jahr Basis-Betriebsdatei: ca. 491 MB Personendatei (ohne sensible Merkmale): ca. 3,7 GB Dateiorganisation Die Personendaten werden in einer Datei abgelegt. Hinzu kommt eine Datei mit den betriebsbezogenen Informationen aus dem BHP, die über betnr und jahr an die Personendaten gespielt werden kann. Auf begründeten Antrag werden weitere Dateien mit zusätzlichen Betriebsinformationen aus dem BHP bereitgestellt. Die Dateien des IAB-Betriebspanels werden unverändert als eine Datei pro Welle übernommen und können über die idnum an die Personendaten gespielt werden. Datenzugang Gastaufenthalt und anschließende Datenfernverarbeitung Anonymisierungsgrad Schwach anonymisiert Sensible Merkmale Personendatei: Staatsangehörigkeit (nation), Geburtsmonat (gebmon), Berufsuntergruppe (beruf2010_4), Wohnort – Kreis (wo_kreis), Wohnort – Arbeitsagentur (wo_aa) Basis-Betriebsdatei: Arbeitsort – Kreis (ao_kreis), Wirtschaftsunterklasse (w93_5), Wirtschaftsunterklasse (w03_5), Wirtschaftsunterklasse (w08_5), Erstes Auftreten der Betriebsnummer (grd_dat), Letztes Auftreten der Betriebsnummer (lzt_dat) Zitierung der Daten Datensatz: und Linked-Employer-Employee-Daten des IAB, Längsschnittmodell 1975 – Datendokumentation 2019 (LIAB LM 7519), Nürnberg 2021 Datenzugriff: „Die Datengrundlage dieses Beitrags bildet das Längsschnittmodell 1975 – 2019 der Linked-Employer-Employee-Daten des IAB. Der Datenzugang erfolgte über einen Gastaufenthalt am Forschungsdatenzentrum der Bundesagentur für Arbeit im Institut für Arbeitsmarkt- und Berufsforschung (FDZ) und mittels kontrollierter Datenfernverarbeitung beim FDZ.“ DOI: 10.5164/IAB.LIABLM7519.de.en.v1 Datendokumentation: Ruf, Kevin; Schmidtlein, Lisa; Seth, Stefan; Stüber, Heiko; Umkehrer, Matthias (2021): Linked-Employer-Employee-Daten des IAB: LIAB Längsschnittmodell (LIAB LM) 1975 – 2019. FDZ-Datenreport, 06/2021 (de), Nürnberg. DOI: 10.5164/IAB.FDZD.2106.de.v1 Datensatzversion Linked-Employer-Employee-Daten des IAB, Längsschnittmodell 1975 – 2019 (LIAB LM 7519) – Version 7519 v1; DOI: 10.5164/IAB.LIABLM7519.de.en.v1 FDZ-Datenreport 06|2021 DE 15
1.5 Merkmalsliste Die Merkmalsübersicht in Tabelle 4 listet die Variablennamen und die längeren Merkmalsbezeichnungen auf. Weiterhin bietet sie eine Übersicht darüber, ob und wie gut Merkmale in den einzelnen Datenquellen gefüllt sind. Die Variablen in der Merkmalsliste, die in der Spalte „BHP“, mit hohem (h) oder wechselnden (m) Füllgrad gekennzeichnet sind, sind in der Basisbetriebsdatei enthalten. Tabelle 3 macht die Bedeutung der Schattierungen deutlich, die in Tabelle 4 den Füllgrad pro Merkmal und Quelle angeben. Beispiel: Das Merkmal „Beruf – ausgeübte/letzte Tätigkeit“ (beruf) ist nur für BeH-Sätze gefüllt. Die Sätze aus der Datenquelle LeH enthalten in dieser Variablen den Missing-Wert „.n“. Tabelle 3: Füllgrad der Merkmale h Merkmal ist für die Quelle gefüllt. Füllgrad immer > 0,85 m Merkmal ist für die Quelle gefüllt. Niedriger bzw. wechselnder Füllgrad, siehe Merkmalsbeschreibung und Häufigkeitsauszählung l Merkmal ist für diese Quelle nicht gefüllt. Füllgrad immer < 0,05 Eine weitere Besonderheit liegt darin, dass einige Merkmale je nach Datenquelle unterschiedliche Inhalte haben. So enthält der „Erwerbsstatus“ (erwstat) für BeH-Sätze die Personengruppe des Meldeverfahrens und für LeH-Sätze die Leistungsart. Nicht bei jedem Merkmal sind diese Unterschiede direkt aus dem Variablennamen ersichtlich. Tabelle 4: Merkmalsliste mit Füllgrad Merkmalsliste Seite BeH LeH BHP Identifikatoren 32 Systemfreie Personennummer (persnr) 32 h h l Systemfreie Betriebsnummer (betnr) 32 h l h Betriebsnummer nach Betriebspanel (idnum) 33 m l l Generierte technische Merkmale 33 Satzzähler pro Konto (spell) 33 h h l Quelle des Satzes (quelle) 34 h h l Jahr (jahr) 34 h h h Status der Betriebsnummer (betr_st) 34 h l l Gültigkeitszeitraum 35 Beginndatum Originalbeobachtung (begorig) 35 h h l Enddatum Originalbeobachtung (endorig) 35 h h l Beginndatum Episode (begepi) 36 h h l Enddatum Episode (endepi) 36 h h l FDZ-Datenreport 06|2021 DE 16
Merkmalsliste Seite BeH LeH BHP Informationen zur Person 36 Geschlecht (frau) 36 h h l Geburtsjahr (gebjahr) 37 h h l Geburtsmonat (gebmon) 37 h h l Staatsangehörigkeit (nation) 37 h h l Staatsangehörigkeit vergröbert (nation_gr) 38 h h l Familienstand (famst) 38 l h l Kinderzahl (kind) 38 l h l Ausbildung (ausbildung) 39 m l l Ausbildung (imputiert) (ausbildung_imp) 40 h l l Schulausbildung (schule) 40 m l l Informationen zu Beschäftigung und Leistungsbezug 41 Tagesentgelt/ täglicher Leistungssatz (tentgelt) 41 h h l Beruf – ausgeübte/letzte Tätigkeit (KldB 1988) (beruf) 42 h l l Berufsgruppe – ausgeübte/letzte Tätigkeit (KldB 2010) 43 h m l (beruf2010_3) Berufsuntergruppe – ausgeübte/letzte Tätigkeit (KldB 43 h m l 2010) (beruf2010_4) Anforderungsniveau – ausgeübte/letzte Tätigkeit (KldB 44 h m l 2010) (niveau) Teilzeit (teilzeit) 45 h l l Stellung im Beruf und Arbeitszeit (stib) 46 m l l Erwerbsstatus (erwstat) 46 h h l Gleitzone (gleitz) 47 m l l Leiharbeit (leih) 48 m l l Befristung (befrist) 48 m l l Abmeldegrund / Abgabegrund / Beendigungsgrund 48 h h l (grund) Restanspruch/geplante Dauer (restanspruch) 49 l h l Beginndatum der Arbeitslosigkeit (alo_beg) 50 m m l Dauer der Arbeitslosigkeit (alo_dau) 50 h h l Ortsangaben 51 Wohnort – Kreis (wo_kreis) 51 h m l Wohnort – Bundesland (wo_bula) 52 h m l Wohnort – Arbeitsagentur (wo_aa) 52 h h l Wohnort – Regionaldirektion (wo_rd) 53 h h l Betriebsmerkmale 53 WZ73 3-Steller (w73_3) 53 l l h WZ93 5-Steller (w93_5) 54 l l h WZ93 3-Steller (w93_3) 54 l l h WZ03 5-Steller (w03_5) 55 l l h FDZ-Datenreport 06|2021 DE 17
Merkmalsliste Seite BeH LeH BHP WZ03 3-Steller (w03_3) 55 l l h WZ08 5-Steller (w08_5) 56 l l h WZ08 3-Steller (w08_3) 56 l l h w73_3 vervollständigt durch Extrapolation/Imputation 56 l l h (w73_3_gen) Art der Vervollständigung w73_3 (group_w73_3) 57 l l h w93_3 vervollständigt durch Extrapolation/Imputation 57 l l h (w93_3_gen) Art der Vervollständigung w93_3 (group_w93_3) 58 l l h w08_3 vervollständigt durch Extrapolation/Imputation 58 l l h (w08_3_gen) Art der Vervollständigung w08_3 (group_w08_3) 58 l l h Jahr des 1. Auftretens der Betriebsnummer (grd_jahr) 59 l l h Erstes Auftreten Betriebsnummer (grd_dat) 59 l l h Jahr des letzten Auftretens der Betriebsnummer (lzt_jahr) 60 l l h Letztes Auftreten Betriebsnummer (lzt_dat) 60 l l h Anzahl Beschäftigte gesamt (az_ges) 60 l l h Anzahl in Vollzeit (Normalbeschäftigte + sonstige) (az_vz) 61 l l h Anzahl geringfügig Beschäftigte (az_gf) 61 l l h Mittelwert imp. Bruttotagesentgelt Vollzeitbeschäftigte 61 l l m (te_imp_mw) Arbeitsort – Kreis (ao_kreis) 62 l l h Arbeitsort – Bundesland (ao_bula) 63 l l h 1.6 Mengengerüst In Tabelle 5 gibt Spalte (2) die Anzahl der Personen pro Jahr im LIAB LM 7519 an. In Spalte (3) werden die in den Personendaten enthaltenen Betriebe pro Jahr abgebildet. Im Gegensatz dazu enthalten die Spalten (4) bis (7) die Zahl an verknüpften Betrieben im Längsschnittmodell. Spalte (4) gibt die Gesamtzahl an Betrieben aus dem IAB-Betriebspanel an, die mit den Personendaten verknüpft werden können. Dagegen unterscheiden die Spalten (5) bis (7) die Anzahl der Verknüpfungen anhand des Merkmals „Status der Betriebsnummer“ (betr_st, siehe Abschnitt 5.2.4). In Spalte (5) befinden sich alle originär für das Längsschnittmodell ausgewählten Betriebe. Diese sind als sogenannte Panelfälle für den Zeitraum 2009 – 2016 aus dem IAB-Betriebspanel gezogen worden (vgl. Abschnitt 0). Die dargestellten Zahlen in Spalte (5) beziehen sich dabei auf Verknüpfungen von Betrieben, bei denen • zum Stichtag der Befragung (30.06. des jeweiligen Jahres) ein gültiges Interview vorliegt und • dieser Stichtag vom Beginn- und Enddatum der Episode eingeschlossen wird. Bei der Anzahl in Spalte (6) handelt es sich dagegen um Verknüpfungen, bei denen • zum Stichtag der Befragung (30.06. des jeweiligen Jahres) ein gültiges Interview vorliegt, FDZ-Datenreport 06|2021 DE 18
• dieser Stichtag jedoch nicht vom Beginn- und Enddatum der Episode eingeschlossen wird. Spalte (7) beinhaltet schließlich die Zahl an Betrieben aus dem IAB-Betriebspanel, für die zwar eine Verknüpfung mit den Personendaten hergestellt werden kann, die jedoch keine Panelfälle für den Zeitraum 2009 bis 2016 darstellen. Tabelle 5: Mengengerüst Betriebe im IAB-Betriebspanel mit Verknüpfung Personen Betriebe zu den Personendaten Betrieb nicht für Jahr Betrieb für LIAB-Modell LIAB-Modell ausgewählt Insgesamt Insgesamt Insgesamt ausgewählt betr_st == 1 betr_st == 2 betr_st == 3 (1) (2) (3) (4) (5) (6) (7) 1975 135.755 70.564 1976 150.195 78.760 1977 167.538 84.168 1978 182.600 89.237 1979 203.538 96.988 1980 221.944 102.265 1981 238.847 104.089 1982 253.763 104.652 1983 268.354 107.849 1984 287.825 112.977 1985 305.020 114.948 1986 328.508 119.510 1987 348.130 123.031 1988 365.539 126.178 1989 390.005 132.400 1990 423.632 143.382 1991 570.470 183.545 1992 670.108 212.369 1993 684.820 218.868 2.427 134 96 2.291 1994 700.961 225.812 2.290 144 94 2.143 1995 726.514 229.915 2.185 162 111 2.020 1996 747.856 232.101 4.950 571 384 4.370 1997 775.186 235.761 4.634 660 440 3.966 1998 814.220 240.511 5.089 803 538 4.272 1999 876.550 305.638 5.586 1.039 720 4.534 2000 949.833 320.917 7.787 1.444 1.029 6.308 FDZ-Datenreport 06|2021 DE 19
Betriebe im IAB-Betriebspanel mit Verknüpfung Personen Betriebe zu den Personendaten Betrieb nicht für Jahr Betrieb für LIAB-Modell LIAB-Modell ausgewählt Insgesamt Insgesamt Insgesamt ausgewählt betr_st == 1 betr_st == 2 betr_st == 3 (1) (2) (3) (4) (5) (6) (7) 2001 984.830 318.955 8.676 1.699 1.239 6.941 2002 1.011.755 309.715 8.410 1.964 1.514 6.420 2003 1.043.497 314.233 8.533 2.489 2.084 6.005 2004 1.080.969 323.541 8.864 2.778 2.198 6.051 2005 1.081.997 323.653 9.062 3.102 2.435 5.920 2006 1.123.872 333.371 9.072 3.532 2.839 5.510 2007 1.186.619 341.414 9.351 4.043 3.337 5.273 2008 1.253.701 347.515 9.786 4.631 3.929 5.117 2009 1.271.486 357.517 10.204 5.211 4.492 4.915 2010 1.295.411 369.903 10.269 5.426 4.698 4.675 2011 1.335.413 381.934 10.388 5.501 4.759 4.721 2012 1.354.174 385.663 10.908 5.616 4.731 5.112 2013 1.370.698 387.775 11.179 5.806 4.946 5.180 2014 1.385.532 391.694 11.349 6.107 5.164 5.047 2015 1.393.923 392.821 11.826 6.373 5.320 5.258 2016 1.397.016 393.384 12.270 6.745 5.692 5.295 2017 1.393.350 394.166 11.169 6.604 5.523 4.303 2018 1.359.638 398.225 10.392 6.491 5.161 3.624 2019 1.330.832 401.459 9.575 5.198 3.977 4.175 Zu beachten: Der Wert in Spalte (4) ergibt sich nicht aus der Summe der Spalten (5), (6) und (7). 2 Datenquellen Die administrativen Personendaten werden aus den Integrierten Erwerbsbiografien (IEB) des IAB gezogen. Diese vereinen Daten aus verschiedenen Datenquellen, die jeweils Informationen aus unterschiedlichen EDV-Verfahren enthalten können. Zusätzlich werden einige ergänzende Merkmale aus diesen Datenquellen in die administrativen Personendaten aufgenommen, die nicht Teil der IEB sind. Abbildung 3 veranschaulicht die Datenflüsse, die zum LIAB LM 7519 führen und stellt deren Beziehung zu anderen Datenprodukten des FDZ dar. In den Personendaten des LIAB LM 7519 werden nur die Datensätze aus den dargestellten Quellen der Beschäftigtenhistorik (BeH) und Leistungsempfängerhistorik (LeH) aus der IEB übernommen. FDZ-Datenreport 06|2021 DE 20
2.1 Beschäftigtenhistorik (BeH) Die Quelle für Informationen über Beschäftigung ist die Beschäftigtenhistorik (BeH) des IAB. Die Grundlage der Daten ist das mit Wirkung vom 01.01.1973 eingeführte (und seit dem 01.01.1991 auf Ostdeutschland ausgedehnte) integrierte Meldeverfahren zur Kranken-, Renten- und Arbeitslosenversicherung (DEÜV; früher DEVO/DÜVO; vgl. für weitere Details: Bender et al., 1996, S. 4ff.; Wermter/Cramer, 1988). Es verlangt von den Arbeitgebern mindestens einmal jährlich Meldungen für alle sozialversicherungspflichtig Beschäftigten an die zuständigen Sozialversicherungsträger abzugeben. Die BeH erfasst alle Arbeiter und Angestellten sowie alle Auszubildenden, soweit sie nicht von der Sozialversicherungspflicht befreit sind. Dies bedeutet, dass verbeamtete und selbstständige Tätigkeiten sowie Studierende 3 (vgl. Cramer, 1985) grundsätzlich nicht in der BeH erfasst werden. Seit der Änderung des Meldeverfahrens zum 01.01.1999 werden auch geringfügig Beschäftigte und mithelfende Familienangehörige erfasst (enthalten erst ab 01.04.1999). Die Daten werden von den Krankenkassen aufgenommen, von der Bundesagentur für Arbeit gesammelt, aufbereitet und anschließend vom IAB in dessen Historikdatei integriert. Die administrativen Personendaten werden durch Betriebsdaten (Basis-Betriebsdatei und BHP- Erweiterungsmodule) ergänzt. Diese werden dem Betriebs-Historik-Panel (BHP) entnommen, das ebenso auf der BeH basiert. Bei der Verknüpfung von Personen- mit Betriebsdaten aus dem BHP muss berücksichtigt werden, dass die Merkmale in der Basis-Betriebsdatei sowie in den BHP-Erweiterungsmodulen zum 30.6. eines Jahres aggregiert werden. Die Betriebsmerkmale sind deshalb, im Unterschied zu den Personenangaben, keine zeitraumbezogenen Daten, sondern nur am 30.6. jeden Jahres exakt gültig. 4 Die Verknüpfung der Betriebs- und Personendatei erfolgt über die programmspezifischen Kommandos der zur Datenaufbereitung und -analyse genutzten Softwarepakete. In Stata können die Daten beispielsweise unter Verwendung des „merge“-Befehls und der Jahresangabe sowie der Betriebsnummer in Verbindung mit der entsprechenden Pfadangabe verknüpft werden (vgl. Kasten 2). 3 Studierende können dennoch in der BeH erscheinen, wenn sie parallel zum Studium z. B. geringfügig beschäftigt waren. 4 Extrembeispiel: Es liegt eine Beschäftigungsmeldung vom 1.1. bis zum 30.5.2006 vor, der Betrieb geht im Juni 2006 Konkurs. Dann gibt es im BHP zu diesem Betrieb für 2006 keine Informationen. FDZ-Datenreport 06|2021 DE 21
Abbildung 3: Quellen des LIAB Über das FDZ Datenquelle IAB-Daten erhältliche Daten Meldungen zur Betriebs-Historik- Beschäftigten-Historik (BeH) Panel (BHP) Sozialversicherung Leistungsempfängerhistorik (LeH) Leistungshistorik Grundsicherung (LHG) Linked-Employer- Daten aus dem Integrierte Employee-Daten des Geschäftsprozess Erwerbsbiografien IAB (LIAB) der BA (IEB) (LIAB LM ohne MTH, (X)ASU und LHG) Arbeitsuchendenhistoriken (ASU/XASU) Maßnahmeteilnahmehistoriken (MTH/XMTH) Betriebsbefragung IAB-Betriebspanel 2.2 Leistungsempfängerhistorik (LeH) Die Leistungsempfängerhistorik (LeH) erfasst Zeiträume, in denen Personen Lohnersatzleistungen der Bundesagentur für Arbeit beziehen (Rechtskreis SGB III). Die Leistungen beinhalten Arbeitslosengeld, Arbeitslosenhilfe, Unterhaltsgeld und von der Bundesagentur für Arbeit übernommene Beiträge zur privaten Kranken- bzw. Pflegeversicherung während des Leistungsbezugs. Leistungen nach dem Rechtskreis SGB II (z. B. Arbeitslosengeld II) sind nicht enthalten. Da der Leistungsanspruch von der Erfüllung gesetzlicher Voraussetzungen abhängt, werden Arbeitslosigkeitsperioden, in denen die Voraussetzungen nicht vorliegen (z. B. fehlende Bedürftigkeit im Falle der Arbeitslosenhilfe oder Nichterfüllung der Anwartschaftszeit beim Arbeitslosengeld) nicht in der Leistungsempfängerhistorik erfasst. Der linke Datenrand der LeH ist der 01.01.1975. FDZ-Datenreport 06|2021 DE 22
Sie können auch lesen