FDZ-DATENREPORT 06|2021 DE Linked-Employer-Employee-Daten des IAB: LIAB-Längsschnittmodell (LIAB LM) 1975-2019 - Doku.iab .

Die Seite wird erstellt Luke Herbst
 
WEITER LESEN
FDZ-DATENREPORT 06|2021 DE Linked-Employer-Employee-Daten des IAB: LIAB-Längsschnittmodell (LIAB LM) 1975-2019 - Doku.iab .
FDZ-DATENREPORT
Dokumentation zu Arbeitsmarktdaten

06|2021 DE Linked-Employer-Employee-Daten des IAB:
LIAB-Längsschnittmodell (LIAB LM) 1975–2019
Kevin Ruf, Lisa Schmidtlein, Stefan Seth, Heiko Stüber, Matthias Umkehrer

     IAB-Regional, IAB Bayern Nr|JJJJ                                       0
Linked-Employer-Employee-Daten des IAB:
LIAB-Längsschnittmodell (LIAB LM)
1975–2019

Kevin Ruf (IAB), Lisa Schmidtlein (IAB), Stefan Seth (IAB), Heiko Stüber (IAB), Matthias
Umkehrer (IAB)

Die FDZ-Datenreporte beschreiben die Daten des FDZ im Detail. Diese Reihe hat somit eine doppelte
Funktion: zum einen stellen Nutzerinnen und Nutzer fest, ob die angebotenen Daten für das
Forschungsvorhaben geeignet sind, zum anderen dienen sie zur Vorbereitung der Auswertungen.

FDZ-Datenreporte (FDZ data reports) describe FDZ data in detail. As a result, this series of reports
has a dual function: on the one hand, those using the reports can ascertain whether the data offered
is suitable for their research task; on the other, the data reports can be used to prepare evaluations.
Inhaltsverzeichnis
1   Einleitung und Kurzbeschreibung .......................................................................................6
    1.1     Einleitung ............................................................................................................................. 6
    1.2     Datennutzung....................................................................................................................... 8
            1.2.1 Datenzugang ............................................................................................................. 8
            1.2.2 Datenhaltung............................................................................................................. 8
            1.2.3 Dateinamen im LIAB LM 7519 ................................................................................. 12
    1.3     Veränderungen zum LIAB LM 7517 .................................................................................... 12
            1.3.1 Beobachtungszeitraum........................................................................................... 12
            1.3.2 Merkmalskanon ....................................................................................................... 12
            1.3.3 Merkmalsbeschreibungen ...................................................................................... 13
            1.3.4 Bereinigung der Schlüsseldatei .............................................................................. 13
    1.4     Steckbrief ........................................................................................................................... 14
    1.5     Merkmalsliste ..................................................................................................................... 16
    1.6     Mengengerüst .................................................................................................................... 18

2   Datenquellen .................................................................................................................... 20
    2.1     Beschäftigtenhistorik (BeH)............................................................................................... 21
    2.2     Leistungsempfängerhistorik (LeH) .................................................................................... 22

3   Datenaufbereitung und Stichprobenziehung .................................................................... 23
    3.1     Bereinigungen und Aufbereitungen .................................................................................. 23
            3.1.1 Beschäftigtenhistorik (BeH) .................................................................................... 23
            3.1.2 Leistungsempfängerhistorik (LeH) ......................................................................... 24
    3.2     Episodensplitting ............................................................................................................... 24
    3.3     Stichprobenziehung........................................................................................................... 25
    3.4     Fehlende Werte .................................................................................................................. 26

4   Datenqualität und Probleme ............................................................................................ 26
    4.1     Gesamte IEB ....................................................................................................................... 26
            4.1.1 Lücken in den Erwerbsbiografien ........................................................................... 26
            4.1.2 Einführung des SGB II und spätere Trägerwechsel ................................................ 28
    4.2     Beschäftigtenhistorik (BeH)............................................................................................... 29
    4.3     Leistungsempfängerhistorik (LeH) .................................................................................... 31

5   Variablenbeschreibung ..................................................................................................... 32
    5.1     Identifikatoren ................................................................................................................... 32
            5.1.1 Systemfreie Personennummer (persnr) ................................................................. 32
            5.1.2 Systemfreie Betriebsnummer (betnr)..................................................................... 32

FDZ-Datenreport 06|2021 DE                                                                                                                          2
5.1.3 Betriebsnummer nach Betriebspanel (idnum) ...................................................... 33
    5.2    Generierte technische Merkmale ...................................................................................... 33
           5.2.1 Satzzähler pro Konto (spell) ................................................................................... 33
           5.2.2 Quelle des Satzes (quelle) ....................................................................................... 34
           5.2.3 Jahr (jahr) ................................................................................................................ 34
           5.2.4 Status der Betriebsnummer (betr_st) .................................................................... 34
    5.3    Gültigkeitszeitraum ........................................................................................................... 35
           5.3.1 Beginndatum Originalbeobachtung (begorig)....................................................... 35
           5.3.2 Enddatum Originalbeobachtung (endorig)............................................................ 35
           5.3.3 Beginndatum Episode (begepi) .............................................................................. 36
           5.3.4 Enddatum Episode (endepi) ................................................................................... 36
    5.4    Informationen zur Person .................................................................................................. 36
           5.4.1 Geschlecht (frau) ..................................................................................................... 36
           5.4.2 Geburtsjahr (gebjahr) .............................................................................................. 37
           5.4.3 Geburtsmonat (gebmon) ........................................................................................ 37
           5.4.4 Staatsangehörigkeit (nation) .................................................................................. 37
           5.4.5 Staatsangehörigkeit vergröbert (nation_gr) .......................................................... 38
           5.4.6 Familienstand (famst) ............................................................................................. 38
           5.4.7 Kinderzahl (kind) ..................................................................................................... 38
           5.4.8 Ausbildung (ausbildung) ......................................................................................... 39
           5.4.9 Ausbildung (imputiert) (ausbildung_imp).............................................................. 40
           5.4.10 Schulausbildung (schule)........................................................................................ 40
    5.5    Informationen zu Beschäftigung und Leistungsbezug ..................................................... 41
           5.5.1 Tagesentgelt/ täglicher Leistungssatz (tentgelt) ................................................... 41
           5.5.2 Beruf – ausgeübte/letzte Tätigkeit (KldB 1988) (beruf) ......................................... 42
           5.5.3 Berufsgruppe – ausgeübte/letzte Tätigkeit (KldB 2010) (beruf2010_3) ................ 43
           5.5.4 Berufsuntergruppe – ausgeübte/letzte Tätigkeit (KldB 2010) (beruf2010_4) ....... 43
           5.5.5 Anforderungsniveau – ausgeübte/letzte Tätigkeit (KldB 2010) (niveau) .............. 44
           5.5.6 Teilzeit (teilzeit) ....................................................................................................... 45
           5.5.7 Stellung im Beruf und Arbeitszeit (stib).................................................................. 46
           5.5.8 Erwerbsstatus (erwstat) .......................................................................................... 46
           5.5.9 Gleitzone (gleitz) ..................................................................................................... 47
           5.5.10 Leiharbeit (leih) ....................................................................................................... 48
           5.5.11 Befristung (befrist) .................................................................................................. 48
           5.5.12 Abmeldegrund / Abgabegrund / Beendigungsgrund (grund) ............................... 48
           5.5.13 Restanspruch/geplante Dauer (restanspruch) ...................................................... 49
           5.5.14 Beginndatum der Arbeitslosigkeit (alo_beg) ......................................................... 50
           5.5.15 Dauer der Arbeitslosigkeit (alo_dau)...................................................................... 50
    5.6    Ortsangaben....................................................................................................................... 51
           5.6.1 Wohnort – Kreis (wo_kreis) ..................................................................................... 51
           5.6.2 Wohnort – Bundesland (wo_bula) .......................................................................... 52
           5.6.3 Wohnort – Arbeitsagentur (wo_aa) ........................................................................ 52
           5.6.4 Wohnort – Regionaldirektion (wo_rd) .................................................................... 53

FDZ-Datenreport 06|2021 DE                                                                                                                    3
5.7     Betriebsmerkmale ............................................................................................................. 53
            5.7.1 WZ73 3-Steller (w73_3) ........................................................................................... 53
            5.7.2 WZ93 5-Steller (w93_5) ........................................................................................... 54
            5.7.3 WZ93 3-Steller (w93_3) ........................................................................................... 54
            5.7.4 WZ03 5-Steller (w03_5) ........................................................................................... 55
            5.7.5 WZ03 3-Steller (w03_3) ........................................................................................... 55
            5.7.6 WZ08 5-Steller (w08_5) ........................................................................................... 56
            5.7.7 WZ08 3-Steller (w08_3) ........................................................................................... 56
            5.7.8 w73_3 vervollständigt durch Extrapolation/Imputation (w73_3_gen)................. 56
            5.7.9 Art der Vervollständigung w73_3 (group_w73_3) .................................................. 57
            5.7.10 w93_3 vervollständigt durch Extrapolation/Imputation (w93_3_gen)................. 57
            5.7.11 Art der Vervollständigung w93_3 (group_w93_3) .................................................. 58
            5.7.12 w08_3 vervollständigt durch Extrapolation/Imputation (w08_3_gen)................. 58
            5.7.13 Art der Vervollständigung w08_3 (group_w08_3) .................................................. 58
            5.7.14 Jahr des 1. Auftretens der Betriebsnummer (grd_jahr) ......................................... 59
            5.7.15 Erstes Auftreten Betriebsnummer (grd_dat).......................................................... 59
            5.7.16 Jahr des letzten Auftretens der Betriebsnummer (lzt_jahr) .................................. 60
            5.7.17 Letztes Auftreten Betriebsnummer (lzt_dat) ......................................................... 60
            5.7.18 Anzahl Beschäftigte gesamt (az_ges) ..................................................................... 60
            5.7.19 Anzahl in Vollzeit (Normalbeschäftigte + sonstige) (az_vz) ................................... 61
            5.7.20 Anzahl geringfügig Beschäftigte (az_gf) ................................................................. 61
            5.7.21 Mittelwert imp. Bruttotagesentgelt Vollzeitbeschäftigte (te_imp_mw) ............... 61
            5.7.22 Arbeitsort – Kreis (ao_kreis) .................................................................................... 62
            5.7.23 Arbeitsort – Bundesland (ao_bula)......................................................................... 63

6   Literatur ........................................................................................................................... 64

7   Anhang ............................................................................................................................. 66
    7.1     Auszählungen ..................................................................................................................... 66
    7.2     Abkürzungsverzeichnis ...................................................................................................... 66

FDZ-Datenreport 06|2021 DE                                                                                                                     4
Zusammenfassung
Dieser Datenreport beschreibt das LIAB-Längsschnittmodell 1975 – 2019 (LIAB LM 7519).

Abstract
This data report describes the LIAB Longitudinal Model 1975 – 2019 (LIAB LM 7519).

Keywords
German administrative micro data, labour market data, linked employer-employee data, data
manual

Danksagung
Für ihre Mitarbeit und Unterstützung danken wir den Kolleginnen und Kollegen des
Forschungsdatenzentrums (FDZ), des Bereichs Betriebe und Beschäftigung (D1) sowie des
Geschäftsbereichs Daten- und IT-Management (DIM) des Instituts für Arbeitsmarkt- und
Berufsforschung. Der vorliegende Datenreport ist eine Überarbeitung des FDZ-Datenreports
05/2019 (Autoren: Schmidtlein, Seth, Umkehrer). Darüber hinaus wurden einzelne Passagen aus
dem FDZ-Datenreport 01/2021 (Autoren: Frodermann, Schmucker, Seth, vom Berge) und IAB-
internen Datendokumentationen von IAB-DIM übernommen.

Datenverfügbarkeit
Der in diesem Beitrag beschriebene Datensatz ist für die Fachöffentlichkeit zugänglich. Nähere
Informationen dazu auf der Internetseite https://fdz.iab.de/.

FDZ-Datenreport 06|2021 DE                                                                  5
1         Einleitung und Kurzbeschreibung
1.1 Einleitung
Das LIAB Längsschnittmodell (LM) 7519 ist einer der Linked-Employer-Employee-Datensätze des
Instituts für Arbeitsmarkt- und Berufsforschung (IAB), die über das Forschungsdatenzentrum (FDZ)
der Bundesagentur für Arbeit (BA) für wissenschaftliche Auswertungen zur Verfügung stehen. Es
verknüpft Informationen zu Betrieben aus dem IAB-Betriebspanel, einer jährlich stattfindenden
Betriebsbefragung, mit Information zu deren Beschäftigten aus den Prozessdaten der BA.
Das IAB-Betriebspanel ist eine jährliche, repräsentative Arbeitgeberbefragung zu betrieblichen
Determinanten der Beschäftigung. Die Erhebung wird seit 1993 in Westdeutschland und seit 1996
in    Ostdeutschland         durchgeführt.    Sie   stellt   die    zentrale   Quelle      für   Analysen   zur
Arbeitskräftenachfrage auf dem deutschen Arbeitsmarkt dar. Dieser Datenreport konzentriert
sich auf die Beschreibung der Personendaten im LIAB LM 7519. Nähere Informationen zum
IAB-Betriebspanel             finden        sich     auf       den        Internetseiten          des       FDZ
(https://fdz.iab.de/de/FDZ_Establishment_Data/IAB_Establishment_Panel.aspx).
Die    administrativen        Daten    zu    den    Beschäftigten      stammen       aus    den    Integrierten
Erwerbsbiographien (IEB) des IAB. Die IEB enthalten Daten zu allen Personen, die im
Beobachtungszeitraum mindestens einmal einen der folgenden Zustände aufweisen:
•     sozialversicherungspflichtige Beschäftigung in Deutschland (erfasst ab 1975),
•     geringfügige Beschäftigung in Deutschland (erfasst ab 1999),
•     Bezug von Leistungen nach dem Rechtskreis SGB III (erfasst ab 1975) oder SGB II (erfasst ab
      2005),
•     bei der Bundesagentur für Arbeit (BA) bzw. den Grundsicherungsträgern als arbeitsuchend
      gemeldet (erfasst ab 1997),
•     Teilnahme an arbeitsmarktpolitischer Maßnahme (erfasst ab 2000).
Diese aus unterschiedlichen Datenquellen stammenden Informationen werden in den IEB
zusammengeführt und tagesgenau abgebildet.
Während        die      Beschäftigtenhistorik        (BeH)         Ursprung    der      Informationen        zu
sozialversicherungspflichtiger und geringfügiger Beschäftigung ist, wird der Bezug von Leistungen
nach den Rechtskreisen des SGB III und des SGB II in der Leistungsempfängerhistorik (LeH) bzw. in
der Leistungshistorik Grundsicherung (LHG) erfasst. Die Arbeitsuchendenhistoriken (ASU und
XASU) stellen die Datenquelle für die durch die BA bzw. die durch die kommunalen
Grundsicherungsträger erfassten Zeiten der Arbeitsuche dar, während die Teilnahme an
arbeitsmarktpolitischen Maßnahmen in den Maßnahmeteilnahmehistoriken (MTH und XMTH)
erfasst wird. Die Personendaten im LIAB LM 7519 umfassen nur Informationen aus den
Quellen Beschäftigtenhistorik (BeH) und Leistungsempfängerhistorik (LeH). Die übrigen
Quellen sind nicht in den Personendaten des LIAB LM 7519 enthalten.
Das IAB-Betriebspanel bildet den Ausgangspunkt für die Ziehung der Personendaten des LIAB LM
7519. Abbildung 1 bietet einen Überblick über die einzelnen Schritte (nähere Details finden sich in
Kapitel 3). Zuerst werden die Betriebe aus dem IAB-Betriebspanel ausgewählt, die Teil des Panel-

FDZ-Datenreport 06|2021 DE                                                                                   6
Zeitraums 2009 – 2016 sind (sogenannte Panelfälle). Diese Einschränkung ist aufgrund von
Beschränkungen bei der Datensatzgröße notwendig. Anschließend werden sämtliche Personen
ausgewählt, die laut den Prozessdaten mindestens einen Tag zwischen 2008 und 2017 bei
zumindest einem dieser Betriebe beschäftigt waren. Letztlich werden die administrativen
Erwerbsbiographien dieser Personen aus den IEB im Zeitraum 1975 – 2019 dem LIAB LM 7519
zugespielt.
Trotz der genannten Einschränkung der Betriebe bei der Ziehung der Personendaten umfasst das
LIAB LM 7519 die Befragungsdaten zu allen Betriebe, die im IAB-Betriebspanel zwischen 1993 und
2019 befragt wurden (also auch die Befragungsdaten zu den Betrieben, die keinen Panelfall
darstellen). Allerdings können lediglich für die gewählten Panelfälle alle Beschäftigten eines
Betriebes in den Personendaten beobachtet werden. Zudem bilden die Personendaten auch
Beschäftigungszeiten bei Betrieben ab, die nicht befragt wurden. Für diese Betriebe kann
abermals nicht die Gesamtheit aller Beschäftigten in den Personendaten beobachtet werden.
Allerdings können administrative Betriebsinformationen aus dem Betriebs-Historik-Panel (BHP)
allen     im     LIAB        LM   7519     enthaltenen      Betrieben      zugespielt   werden      (siehe
https://fdz.iab.de/de/FDZ_Establishment_Data/Establishment_History_Panel.aspx).
Das LIAB LM 7519 wird im Forschungsdatenzentrum der Bundesagentur für Arbeit im IAB
produziert. Der Datensatz umfasst die Erwerbsverläufe von 1.688.101 Individuen, deren
Erwerbsbiografien in insgesamt 60.220.485 Datenzeilen dokumentiert sind. Der vorliegende
Datenreport beschreibt die einzelnen Merkmale, welche weitgehend auf den Originaldaten, d. h.
nicht vergröberte Daten, basieren. Einige Merkmale sind allerdings als besonders sensibel
eingestuft und werden nur auf gesonderten Antrag (siehe Abschnitt 1.2) weitergegeben.
In Abgrenzung zum Querschnittmodell des LIAB umfasst das Längsschnittmodell die gesamten
zeitraumbezogenen Erwerbsbiographien von Personen einer Unterstichprobe der im IAB-
Betriebspanel       wiederholt     befragten    Betriebe.    Für   diese     Untergruppe   lassen     sich
Erwerbsbiographien somit auch bei Betriebswechseln und Übergängen in Arbeitslosigkeit
verfolgen. Im Querschnittmodell hingegen werden die Erwerbsbiographien jeweils immer nur zum
Stichtag 30. Juni abgebildet. Allerdings werden zu allen im IAB-Betriebspanel befragten Betrieben
die Erwerbsbiographien aller Beschäftigten zugespielt, die im Befragungsjahr zum Stichtag 30.
Juni bei einem dieser Betriebe beschäftigt waren. Eine Übersicht zu den verschiedenen LIAB-
Datensätzen             findet      sich       auf       den        Internetseiten         des       FDZ
(https://fdz.iab.de/de/Integrated_Establishment_and_Individual_Data/LIAB.aspx).
Dieser Datenreport gliedert sich wie folgt: Neben der Einleitung enthält Kapitel 1 unter anderem
Informationen zum Datenzugang sowie eine Kurzbeschreibung der Daten, das Mengengerüst und
eine Merkmalsliste. Eine detaillierte Beschreibung der einzelnen Datenquellen findet sich in
Kapitel 2. Die Datenaufbereitung sowie die Datenqualität werden in den Kapiteln 3 und 4
diskutiert, während die einzelnen Merkmale in Kapitel 5 dargestellt werden.

FDZ-Datenreport 06|2021 DE                                                                              7
Abbildung 1: Aufbau des LIAB LM 7519. Für Panelfälle lassen sich in den Personendaten alle Beschäftigten eines
Betriebes beobachten, für alle anderen Betriebe sind jeweils nur einzelne Beschäftigte beobachtbar. Jedoch
lassen sich für alle im LIAB LM 7519 enthaltenen Betriebe administrative Informationen auf Betriebsebene aus
dem Betriebs-Historik-Panel (BHP) zuspielen.

        1.    Ausgangspunkt: Betriebsbefragung (IAB-Betriebspanel)

                                                      IAB-Betriebspanel

        2.    Auswahl der Betriebe aus dem IAB-Betriebspanel, die Teil des Panel-Zeitraums 2009 – 2016
              sind (Panelfälle)

                                                            Panelfälle

        3.    Auswahl der Personen, die in den Panel-Betrieben zwischen 2008 und 2017 beschäftigt sind

                                               Beschäftigte aus Panel-Betrieben

        4.    Zuspielen der tagesgenauen administrativen Erwerbsbiographien von 1975 bis 2019 zu den in
              Schritt 3 gewählten Personen

                                                    Erwerbsbiographien

             Fiktives Beispiel:
             persnr               begepi       endepi            Betrieb ein Panelfall? (1=Ja)   …
             1                    01.01.1975   31.12.1975        0
             1                    01.01.1976   30.06.1976        0
             …
             1                    01.01.2019   31.12.2019        1

1.2 Datennutzung
1.2.1        Datenzugang
Die LIAB-Daten liegen in schwach anonymisierter Form vor und können somit ausschließlich im
Rahmen von Gastaufenthalten am FDZ und anschließender Datenfernverarbeitung ausgewertet
werden.
Für die Datennutzung ist ein Antrag beim FDZ einzureichen. Über die Genehmigung des
Forschungsprojekts entscheidet das FDZ im Auftrag und ggf. unter Abstimmung mit dem
Bundesministerium für Arbeit und Soziales (BMAS). Nach erfolgter Genehmigung wird ein
Nutzungsvertrag mit der wissenschaftlichen Einrichtung der Forschenden geschlossen. Details zur
Beantragung des Datensatzes und Datenverarbeitungsmöglichkeiten können der FDZ-Website
entnommen werden.

1.2.2        Datenhaltung
Die LIAB-Daten, die sowohl deutsch- als auch englischsprachige Labels enthalten, 1 sind modular
gegliedert und in mehreren Dateien abgelegt (vgl. Abbildung 2). Ein erstes Modul umfasst alle
Wellen des IAB-Betriebspanels, die jeweils als separater Datensatz abgelegt sind. In den Wellen

1
 Mit den Stata-Befehlen label language en oder label language de kann auf englisch- bzw. deutschsprachige
Labels umgestellt werden.

FDZ-Datenreport 06|2021 DE                                                                                  8
finden sich jahresspezifische Informationen zu Beschäftigungsentwicklung, Geschäftspolitik und
Geschäftsentwicklung, betriebliche Investitionen, Innovationen im Betrieb, öffentliche Förderung,
Personalstruktur, Berufsausbildung und Ausbildungsstellen, Personaleinstellungen und
-abgänge, Personalsuche, Löhne und Gehälter, betriebliche Arbeitszeiten, Fort- und Weiterbildung
oder auch allgemeine Angaben zum Betrieb. Das LIAB LM 7519 enthält die gesamten
Befragungsdaten des IAB-Betriebspanels, unabhängig davon, ob ein Betrieb für die Ziehung der
Personendaten ausgewählt wurde oder nicht.
Ein zweites Modul, das im weiteren Verlauf Personendatei genannt wird, enthält Identifikatoren
(systemfreie Personen- und Betriebsnummer), persönliche Merkmale, Informationen zu
Beschäftigung und Leistungsbezug, Merkmale zum Wohnort sowie technische Merkmale.
Ein drittes Modul, die Basis-Betriebsdatei, enthält die Betriebsnummer, das Jahr und Merkmale zu
Arbeitsort und Wirtschaftszweigen sowie weitere Betriebsinformationen zum Stichtag 30. Juni. Für
Ostdeutschland liegen diese administrativen Betriebsdaten erst ab 1992 vor. Die Basis-
Betriebsdatei stammt aus dem Betriebs-Historik-Panel (BHP). Das BHP umfasst alle Betriebe in
Deutschland, die zum 30. Juni eines Jahres mindestens einen sozialversicherungspflichtigen oder
seit 1999 auch geringfügig Beschäftigten aufweisen. Quelle des BHP ist die Beschäftigten-Historik
(BeH) des IAB. Im BHP werden die Personendaten der BeH mit Hilfe der Betriebsnummern auf die
Betriebs-Jahrebene aggregiert. Nähere Informationen zum BHP finden sich auf den Internetseiten
des FDZ (https://fdz.iab.de/de/FDZ_Establishment_Data/Establishment_History_Panel.aspx).
Einige der in der Merkmalsliste (vgl. Tabelle 4), in der Spalte „BHP“, aufgeführten Merkmale sind
bereits in der Basis-Betriebsdatei enthalten. Auf begründeten Antrag können aus dem BHP weitere
Betriebsmerkmale in Variablenblöcken bereitgestellt werden (vgl. Abbildung 2). Zudem können
die Erweiterungsmodule Beschäftigungsströme (Eintritte/Austritte) und Betriebsdynamik
(Gründungen/Schließungen) mit gesonderter Begründung beantragt werden. Einen Überblick
bietet die Liste der BHP-Zusatzmerkmale: http://doku.iab.de/fdz/access/BHP_Variablen.pdf.
Betriebs- und Personendaten sind organisatorisch voneinander getrennt, was die Struktur der
Daten deutlich macht und Speicherplatz spart. Die Verknüpfung der einzelnen Dateien erfolgt über
die programmspezifischen Kommandos der zur Datenaufbereitung und -analyse genutzten
Softwarepakete. So können Verknüpfungen beispielsweise in Stata unter Verwendung des
„merge“-Befehls durchgeführt werden. Die Verknüpfung der Wellen des IAB-Betriebspanels und
der Personendatei erfolgt über die in beiden Modulen enthaltene Betriebsnummer des IAB-
Betriebspanels (idnum; siehe Kasten 1). Basis-Betriebsdatei und Personendatei werden dagegen
über die systemfreie Betriebsnummer (betnr) und das Jahr (jahr) verknüpft (siehe Kasten 2).
Gleiches gilt für die Erweiterungsmodule aus dem BHP.

FDZ-Datenreport 06|2021 DE                                                                     9
Abbildung 2: Datenhaltung der Linked-Employer-Employee-Daten im LIAB LM 7519

  IAB-Betriebspanel in „Wellen“                 Personendatei
        von 1993 bis 2019                            Datei:                     Betriebs-Historik-Panel
       Datei: iabbp_jjjj.dta              liab_lm_7519_v1_pers.dta                       (BHP)
         (jjjj = 1993 – 2019)           (ggf. mit sensiblen Merkmalen)

                    Basis-Betriebsdatei                          Beschäftigungsströme: Eintritte
        Datei: liab_lm_7519_v1_bhp_basis_v2.dta             Datei: liab_lm_7519_v1_bhp_inflow_v2.dta
              (ggf. mit sensiblen Merkmalen)

                                                                  Beschäftigungsströme: Austritte
                                                            Datei: liab_lm_7519_v1_bhp_outflow_v2.dta

                                                                  Betriebsdynamik: Gründungen
                                                             Datei: liab_lm_7519_v1_bhp_entry_v2.dta

                                                                 Betriebsdynamik: Schließungen
                                                              Datei: liab_lm_7519_v1_bhp_exit_v2.dta

                                                              Variablenblöcke in „Jahresscheiben“
                                                                         von 1975 bis 2019
                                                              Datei: liab_lm_7519_v1_bhp_v2_jjjj.dta
                                                                          (jjjj = 1975 – 2019)

                                                               „auf begründeten Antrag hin verfügbar“

Kasten 1:     Beispielcode Stata 14; Verknüpfung der Personendatei mit einer Welle des IAB-
Betriebspanels

use liab_lm_7519_v1_pers.dta
merge m:1 idnum using iabbp_2000.dta

Kasten 2:       Beispielcode Stata 14; Verknüpfung der Personendatei mit der Basis-Betriebsdatei

use liab_lm_7519_v1_pers.dta
merge m:1 betnr jahr using liab_lm_7519_v1_bhp_basis_v2.dta

Wie bereits erwähnt enthalten die LIAB Modelle zwei unterschiedliche Betriebsidentifikatoren, die
„Systemfreie Betriebsnummer“ (betnr) der administrativen Daten (siehe Abschnitt 5.1.2) und die
„Betriebsnummer nach Betriebspanel“ (idnum) (siehe Abschnitt 5.1.3). Die idnum wird benötigt,
um die Wellen des IAB-Betriebspanels an die Personendatei zu spielen (siehe Kasten 1). Hierzu

FDZ-Datenreport 06|2021 DE                                                                                10
wurde bei der Erstellung des LIAB LM bisher der originale betnr-idnum Schlüssel genutzt. In
aktuelleren Jahren gibt es im betnr-idnum Schlüssel jedoch einige nicht eineindeutige
Verknüpfungen. In einigen sehr wenigen Fällen sind in einigen Jahren jeweils zwei betnr einer
idnum zugeordnet. Daher wurde für das LIAB LM 7519 der Schlüssel um diese Fälle bereinigt, indem
alle Beobachtungen für diese Betriebe gelöscht wurden. Somit ist innerhalb eines Jahres eine
betnr nun eineindeutig einer idnum zugewiesen.
Beim Zusammenspielen der Datensätze ist jedoch zu beachten, dass einer „Betriebsnummer nach
Betriebspanel“ (idnum) — über die Jahre — mehrere „Systemfreie Betriebsnummern“ (betnr) der
administrativen Daten zugeordnet sein können. Dies kann beispielsweise dann auftreten, wenn
ein Betrieb, der am IAB-Betriebspanel teilgenommen hat, die Befragung aussetzt und zu einem
späteren Zeitpunkt wieder an der Befragung teilnimmt. In solchen Fällen wird dem Betrieb bei der
erneuten Teilnahme eine neue idnum zugewiesen. Innerhalb eines Jahres ist eine idnum jedoch
immer eineindeutig einer betnr zugeordnet. Daher ist es wichtig, dass beim Zusammenspielen der
Personendatei mit den Wellen des IAB-Betriebspanels immer von der Personendatei ausgegangen
wird, wie im Kasten 1 beispielhaft dargestellt. 2
Bestimmte Merkmale, die eine Deanonymisierung von Personen oder Betrieben erleichtern,
werden nur dann im Original weitergegeben, wenn es für das Analyseziel notwendig ist und dies
im Antrag auf den Datenzugang explizit begründet wird. Diese aus datenschutzrechtlicher Sicht
besonders sensiblen Merkmale sind:

Personendatei:

•      Staatsangehörigkeit (nation)
•      Geburtsmonat (gebmon)
•      Berufsuntergruppe (beruf2010_4)
•      Wohnort – Arbeitsagentur (wo_aa)
•      Wohnort –Kreis (wo_kreis)

Basis-Betriebsdatei:

•      Arbeitsort – Kreis (ao_kreis)
•      Wirtschaftszweig – Wirtschaftsunterklasse (5-Steller) (w93_5)
•      Wirtschaftszweig – Wirtschaftsunterklasse (5-Steller) (w03_5)
•      Wirtschaftszweig – Wirtschaftsunterklasse (5-Steller) (w08_5)
•      Erstes Auftreten Betriebsnummer (grd_dat)
•      Letztes Auftreten Betriebsnummer (lzt_dat)
Sofern sie beantragt und genehmigt wurden, befinden sich die hier aufgeführten sensiblen
Merkmale in den entsprechenden Dateien (siehe Abbildung 2).

2
    Spielt man hingegen die Personendatei an die Wellen des IAB-Betriebspanels, kann es vorkommen, dass eine betnr zwei idnums
zugeordnet wird. Dies kommt zustande, da Betriebsnummern im IAB-Betriebspanel zum Teil auch nach der letzten Befragung in
den Datensätzen enthalten sind, damit die Betriebsgewichte weiterhin verfügbar sind (Fälle mit Wellenkennzeichen „Z“; siehe

z. B. Ellguth et al. 2014).

FDZ-Datenreport 06|2021 DE                                                                                                11
1.2.3     Dateinamen im LIAB LM 7519
Wellen des IAB-Betriebspanels
         iabbp_jjjj.dta, jjjj = 1993 – 2019

Personendatei
         liab_lm_7519_v1_pers.dta

Basis-Betriebsdatei
         liab_lm_7519_v1_bhp_basis_v2.dta

Erweiterungsmodule BHP

Bestandsdaten mit Variablenblöcken
         liab_lm_7519_v1_bhp_v2_jjjj.dta, jjjj = 1975 – 2019

Beschäftigtenströme
         liab_lm_7519_v1_bhp_inflow_v2.dta
         liab_lm_7519_v1_bhp_outflow_v2.dta

Betriebsdynamik
         liab_lm_7519_v1_bhp_entry_v2.dta
         liab_lm_7519_v1_bhp_exit_v2.dta

1.3 Veränderungen zum LIAB LM 7517
1.3.1    Beobachtungszeitraum
Das LIAB LM 7519 unterscheidet sich vom LIAB LM 7517 im abgebildeten Zeitraum für die Personen-
und Betriebsdaten.

1.3.2    Merkmalskanon
Im LIAB LM 7519 wurden gegenüber früheren Versionen die Angaben zum Wohnort Kreis
(wo_kreis), Wohnort Bundesland (wo_bula), Wohnort Arbeitsagentur (ao_aa) und Wohnort
Regionaldirektion (wo_rd) für die Beschäftigtendaten mit Gültigkeit zum Beginn der
Originalepisode und nicht mehr mit Gültigkeit zum 31.12. des jeweiligen Jahres zugespielt (siehe
Abschnitte 5.6.1 bis 5.6.4).
Darüber hinaus haben sich die Werte der Ausprägungen in den Variablen Erwerbsstatus (erwstat)
und Abmeldegrund / Abgabegrund / Beendigungsgrund (grund) aufgrund von internen
technischen Umstellungen geändert (siehe Abschnitte 5.5.8 und 5.5.12). Die Inhalte sind
unverändert. Zusätzlich gibt es neue Ausprägungen in der Variable grund.
Zudem wurden unrealistische Werte im Merkmal „Restanspruch / geplante Dauer“ (restanspruch)
als fehlende Angaben umkodiert (siehe Abschnitt 5.5.13).
Tabelle 1 gibt einen Überblick über die Änderungen im Merkmalskanon über alle Quellen hinweg.

FDZ-Datenreport 06|2021 DE                                                                   12
Tabelle 1: Neue, entfallene und veränderte Merkmale im LIAB LM 7519

              Merkmal                                    Erläuterung

Wohnort (wo_kreis, wo_bula,          Für Beschäftigtendaten ab Version LIAB LM 7519
wo_aa, wo_rd)                        mit Gültigkeit zum Beginn der Originalepisode
                                     zugespielt
Erwerbsstatus (erwstat)              Umkodierung gegenüber der LIAB LM 7517:
                                     1 auf 11, 2 auf 12, 3 auf 13, 5 auf15, 10 auf 2, 11 auf
                                     8, 13 auf 1, 14 auf 6, 15 auf 7, 17 auf 5, 18 auf 9
Abmeldegrund / Abgabegrund /         Umkodierung gegenüber der LIAB LM 7517
Beendigungsgrund (grund)             (Wertebereiche):
                                     10er auf 100er, 2000er auf 1100er (-1), 3000er auf
                                     500er, 5000er auf 200er, 6000er auf 300er
                                     Neue Ausprägungen
Restanspruch / geplante Dauer        Umkodierung unrealistischer Werte auf fehlende
(restanspruch)                       Angabe

1.3.3    Merkmalsbeschreibungen
Im vorliegenden Datenreport wurden die Beschreibungen für folgende Merkmale überarbeitet
bzw. ergänzt:
    •    Familienstand (famst)
    •    Kinderzahl (kind)
    •    Ausbildung (ausbildung)
    •    Ausbildung (imputiert) (ausbildung_imp)
    •    Schulausbildung (schule)
    •    Beruf – ausgeübte/letzte Tätigkeit (KldB 1988) (beruf)
    •    Berufsgruppe – ausgeübte/letzte Tätigkeit (KldB 2010) (beruf2010_3)
    •    Berufsuntergruppe – ausgeübte/letzte Tätigkeit (KldB 2010) (beruf2010_4)
    •    Anforderungsniveau – ausgeübte/letzte Tätigkeit (KldB 2010) (niveau)
    •    Teilzeit (teilzeit)
    •    Stellung im Beruf und Arbeitszeit (stib)
    •    Erwerbsstatus (erwstat)
    •    Gleitzone (gleitz)
    •    Leiharbeit (leih)
    •    Befristung (befrist)
    •    Abmeldegrund / Abgabegrund / Beendigungsgrund (grund)
    •    Restanspruch/geplante Dauer (restanspruch)
    •    Wohnort – Kreis (wo_kreis)
    •    Wohnort – Arbeitsagentur (wo_aa)
    •    Arbeitsort – Kreis (ao_kreis)

1.3.4    Bereinigung der Schlüsseldatei
Um die Wellen des IAB-Betriebspanels an die Personendatei zu spielen wurde bei der Erstellung
des LIAB LM bisher der originale betnr-idnum Schlüssel genutzt. In aktuelleren Jahren gibt es im

FDZ-Datenreport 06|2021 DE                                                                     13
Schlüssel jedoch einige nicht eineindeutige Verknüpfungen. Deshalb wurde für das LIAB LM 7519
der Schlüssel um diese Fälle bereinigt.
Außerdem wurde die Beschreibung des Vorgehens bei der Verknüpfung der Dateien in Kapitel 1.2.2
erweitert.

1.4 Steckbrief

Tabelle 2: Steckbrief

 Themen/                     Beschäftigtenhistorik (BeH):
 Merkmalsgruppen             Jahres-     und     Abmeldungen        zur    Sozialversicherung für
                             sozialversicherungspflichtig und geringfügig Beschäftigte
                             Leistungsempfängerhistorik (LeH):
                             Informationen zu Leistungsbezug nach SGB III für Bezieher von
                             Arbeitslosengeld, Arbeitslosenhilfe und Unterhaltsgeld
                             IAB-Betriebspanel:
                             Informationen aus jährlicher Betriebsbefragung mit wechselnden
                             Schwerpunktthemen
 Untersuchungseinheit        Betriebe, sozialversicherungspflichtige Beschäftigte (ab 1999 auch
                             geringfügig Beschäftigte), Leistungsempfänger
 Fallzahlen                  Verknüpfte Betriebe: 2.427 bis 12.270 pro Jahr, 44.703 insgesamt
                             Personen: 135.755 bis 1.397 016 pro Jahr, 1.688.101 insgesamt
                             Überschneidungsfreie Sätze (nach Episodensplitting): 60.220.485
 Zeitraum                    Der Zeitraum hängt von der Datenquelle ab.
                             BeH:     01.01.1975 – 31.12.2019
                                      (2016: 36-Monats-Datei
                                      2017 und 2018: 18-Monats-Datei,
                                      2019: 6-Monats-Datei)
                             LeH:     01.01.1975 – 31.12.2019
 Zeitbezug                   Betriebe: Stichtag 30. Juni
                             Personen: Tagesgenau
 Regionale Gliederung        Bundesländer, Kreise

 Gebietsstand                Gebietsstandbereinigt zum 31.12.2019
 Erhebungsdesign             Linked-Employer-Employee-Daten; Auswahl bestimmter Betriebe aus
                             Betriebsbefragung und Zuspielen der Erwerbsbiographien ihrer
                             Beschäftigten aus Prozessdaten.
 Beteiligte                  Sozialversicherungsträger, Bundesagentur für Arbeit, Kantar Public
 Institutionen               (ehemals TNS Infratest Sozialforschung GmbH) in Zusammenarbeit mit
                             dem Institut für Sozialökonomische Strukturanalysen GmbH (SÖSTRA)
 Frequenz der                Administrative Daten: laufend
 Datensammlung               Daten des IAB-Betriebspanels: einmal jährlich

FDZ-Datenreport 06|2021 DE                                                                      14
Dateiformat/ -größe         Stata
                             Betriebsdaten (ohne sensible Merkmale):
                                     IAB-Betriebspanel: ca. 1,6 bis 10,5 MB pro Jahr
                                     Basis-Betriebsdatei: ca. 491 MB
                             Personendatei (ohne sensible Merkmale):
                                     ca. 3,7 GB
 Dateiorganisation           Die Personendaten werden in einer Datei abgelegt. Hinzu kommt eine
                             Datei mit den betriebsbezogenen Informationen aus dem BHP, die über
                             betnr und jahr an die Personendaten gespielt werden kann. Auf
                             begründeten Antrag werden weitere Dateien mit zusätzlichen
                             Betriebsinformationen aus dem BHP bereitgestellt.
                             Die Dateien des IAB-Betriebspanels werden unverändert als eine Datei pro
                             Welle übernommen und können über die idnum an die Personendaten
                             gespielt werden.
 Datenzugang                 Gastaufenthalt und anschließende Datenfernverarbeitung
 Anonymisierungsgrad         Schwach anonymisiert

 Sensible Merkmale           Personendatei:
                             Staatsangehörigkeit      (nation),      Geburtsmonat         (gebmon),
                             Berufsuntergruppe (beruf2010_4), Wohnort – Kreis (wo_kreis), Wohnort –
                             Arbeitsagentur (wo_aa)
                             Basis-Betriebsdatei:
                             Arbeitsort – Kreis (ao_kreis), Wirtschaftsunterklasse (w93_5),
                             Wirtschaftsunterklasse (w03_5), Wirtschaftsunterklasse (w08_5), Erstes
                             Auftreten der Betriebsnummer (grd_dat), Letztes Auftreten der
                             Betriebsnummer (lzt_dat)
 Zitierung der Daten         Datensatz:
 und                         Linked-Employer-Employee-Daten des IAB, Längsschnittmodell 1975 –
 Datendokumentation          2019 (LIAB LM 7519), Nürnberg 2021
                             Datenzugriff:
                             „Die Datengrundlage dieses Beitrags bildet das Längsschnittmodell 1975
                             – 2019 der Linked-Employer-Employee-Daten des IAB. Der Datenzugang
                             erfolgte über einen Gastaufenthalt am Forschungsdatenzentrum der
                             Bundesagentur für Arbeit im Institut für Arbeitsmarkt- und
                             Berufsforschung (FDZ) und mittels kontrollierter Datenfernverarbeitung
                             beim FDZ.“
                             DOI: 10.5164/IAB.LIABLM7519.de.en.v1
                             Datendokumentation:
                             Ruf, Kevin; Schmidtlein, Lisa; Seth, Stefan; Stüber, Heiko; Umkehrer,
                             Matthias (2021): Linked-Employer-Employee-Daten des IAB: LIAB
                             Längsschnittmodell (LIAB LM) 1975 – 2019. FDZ-Datenreport, 06/2021
                             (de), Nürnberg.
                             DOI: 10.5164/IAB.FDZD.2106.de.v1
 Datensatzversion            Linked-Employer-Employee-Daten des IAB, Längsschnittmodell 1975 –
                             2019 (LIAB LM 7519) – Version 7519 v1;
                             DOI: 10.5164/IAB.LIABLM7519.de.en.v1

FDZ-Datenreport 06|2021 DE                                                                          15
1.5 Merkmalsliste
Die Merkmalsübersicht in Tabelle 4 listet die Variablennamen und die längeren
Merkmalsbezeichnungen auf. Weiterhin bietet sie eine Übersicht darüber, ob und wie gut
Merkmale in den einzelnen Datenquellen gefüllt sind. Die Variablen in der Merkmalsliste, die in der
Spalte „BHP“, mit hohem (h) oder wechselnden (m) Füllgrad gekennzeichnet sind, sind in der
Basisbetriebsdatei enthalten. Tabelle 3 macht die Bedeutung der Schattierungen deutlich, die in
Tabelle 4 den Füllgrad pro Merkmal und Quelle angeben.
Beispiel: Das Merkmal „Beruf – ausgeübte/letzte Tätigkeit“ (beruf) ist nur für BeH-Sätze gefüllt. Die
Sätze aus der Datenquelle LeH enthalten in dieser Variablen den Missing-Wert „.n“.

Tabelle 3: Füllgrad der Merkmale

h                  Merkmal ist für die Quelle gefüllt.
                   Füllgrad immer > 0,85
m                  Merkmal ist für die Quelle gefüllt.
                   Niedriger bzw. wechselnder Füllgrad,            siehe   Merkmalsbeschreibung   und
                   Häufigkeitsauszählung
l                  Merkmal ist für diese Quelle nicht gefüllt.
                   Füllgrad immer < 0,05

Eine weitere Besonderheit liegt darin, dass einige Merkmale je nach Datenquelle unterschiedliche
Inhalte haben. So enthält der „Erwerbsstatus“ (erwstat) für BeH-Sätze die Personengruppe des
Meldeverfahrens und für LeH-Sätze die Leistungsart. Nicht bei jedem Merkmal sind diese
Unterschiede direkt aus dem Variablennamen ersichtlich.

Tabelle 4: Merkmalsliste mit Füllgrad

 Merkmalsliste                                                   Seite     BeH     LeH      BHP
 Identifikatoren                                                 32
 Systemfreie Personennummer (persnr)                             32        h       h        l
 Systemfreie Betriebsnummer (betnr)                              32        h       l        h
 Betriebsnummer nach Betriebspanel (idnum)                       33        m       l        l
 Generierte technische Merkmale                                  33
 Satzzähler pro Konto (spell)                                    33        h       h        l
 Quelle des Satzes (quelle)                                      34        h       h        l
 Jahr (jahr)                                                     34        h       h        h
 Status der Betriebsnummer (betr_st)                             34        h       l        l
 Gültigkeitszeitraum                                             35
 Beginndatum Originalbeobachtung (begorig)                       35        h       h        l
 Enddatum Originalbeobachtung (endorig)                          35        h       h        l
 Beginndatum Episode (begepi)                                    36        h       h        l
 Enddatum Episode (endepi)                                       36        h       h        l

FDZ-Datenreport 06|2021 DE                                                                         16
Merkmalsliste                                            Seite   BeH   LeH   BHP
 Informationen zur Person                                 36
 Geschlecht (frau)                                        36      h     h     l
 Geburtsjahr (gebjahr)                                    37      h     h     l
 Geburtsmonat (gebmon)                                    37      h     h     l
 Staatsangehörigkeit (nation)                             37      h     h     l
 Staatsangehörigkeit vergröbert (nation_gr)               38      h     h     l
 Familienstand (famst)                                    38      l     h     l
 Kinderzahl (kind)                                        38      l     h     l
 Ausbildung (ausbildung)                                  39      m     l     l
 Ausbildung (imputiert) (ausbildung_imp)                  40      h     l     l
 Schulausbildung (schule)                                 40      m     l     l
 Informationen zu Beschäftigung und Leistungsbezug        41
 Tagesentgelt/ täglicher Leistungssatz (tentgelt)         41      h     h     l
 Beruf – ausgeübte/letzte Tätigkeit (KldB 1988) (beruf)   42      h     l     l
 Berufsgruppe – ausgeübte/letzte Tätigkeit (KldB 2010)
                                                          43      h     m     l
 (beruf2010_3)
 Berufsuntergruppe – ausgeübte/letzte Tätigkeit (KldB
                                                          43      h     m     l
 2010) (beruf2010_4)
 Anforderungsniveau – ausgeübte/letzte Tätigkeit (KldB
                                                          44      h     m     l
 2010) (niveau)
 Teilzeit (teilzeit)                                      45      h     l     l
 Stellung im Beruf und Arbeitszeit (stib)                 46      m     l     l
 Erwerbsstatus (erwstat)                                  46      h     h     l
 Gleitzone (gleitz)                                       47      m     l     l
 Leiharbeit (leih)                                        48      m     l     l
 Befristung (befrist)                                     48      m     l     l
 Abmeldegrund / Abgabegrund / Beendigungsgrund
                                                          48      h     h     l
 (grund)
 Restanspruch/geplante Dauer (restanspruch)               49      l     h     l
 Beginndatum der Arbeitslosigkeit (alo_beg)               50      m     m     l
 Dauer der Arbeitslosigkeit (alo_dau)                     50      h     h     l
 Ortsangaben                                              51
 Wohnort – Kreis (wo_kreis)                               51      h     m     l
 Wohnort – Bundesland (wo_bula)                           52      h     m     l
 Wohnort – Arbeitsagentur (wo_aa)                         52      h     h     l
 Wohnort – Regionaldirektion (wo_rd)                      53      h     h     l
 Betriebsmerkmale                                         53
 WZ73 3-Steller (w73_3)                                   53      l     l     h
 WZ93 5-Steller (w93_5)                                   54      l     l     h
 WZ93 3-Steller (w93_3)                                   54      l     l     h
 WZ03 5-Steller (w03_5)                                   55      l     l     h

FDZ-Datenreport 06|2021 DE                                                          17
Merkmalsliste                                                Seite   BeH     LeH       BHP
    WZ03 3-Steller (w03_3)                                       55      l       l         h
    WZ08 5-Steller (w08_5)                                       56      l       l         h
    WZ08 3-Steller (w08_3)                                       56      l       l         h
    w73_3 vervollständigt durch Extrapolation/Imputation
                                                                 56      l       l         h
    (w73_3_gen)
    Art der Vervollständigung w73_3 (group_w73_3)                57      l       l         h
    w93_3 vervollständigt durch Extrapolation/Imputation
                                                                 57      l       l         h
    (w93_3_gen)
    Art der Vervollständigung w93_3 (group_w93_3)                58      l       l         h
    w08_3 vervollständigt durch Extrapolation/Imputation
                                                                 58      l       l         h
    (w08_3_gen)
    Art der Vervollständigung w08_3 (group_w08_3)                58      l       l         h
    Jahr des 1. Auftretens der Betriebsnummer (grd_jahr)         59      l       l         h
    Erstes Auftreten Betriebsnummer (grd_dat)                    59      l       l         h
    Jahr des letzten Auftretens der Betriebsnummer (lzt_jahr)    60      l       l         h
    Letztes Auftreten Betriebsnummer (lzt_dat)                   60      l       l         h
    Anzahl Beschäftigte gesamt (az_ges)                          60      l       l         h
    Anzahl in Vollzeit (Normalbeschäftigte + sonstige) (az_vz)   61      l       l         h
    Anzahl geringfügig Beschäftigte (az_gf)                      61      l       l         h
    Mittelwert imp. Bruttotagesentgelt Vollzeitbeschäftigte
                                                                 61      l       l         m
    (te_imp_mw)
    Arbeitsort – Kreis (ao_kreis)                                62      l       l         h
    Arbeitsort – Bundesland (ao_bula)                            63      l       l         h

1.6 Mengengerüst
In Tabelle 5 gibt Spalte (2) die Anzahl der Personen pro Jahr im LIAB LM 7519 an. In Spalte (3)
werden die in den Personendaten enthaltenen Betriebe pro Jahr abgebildet.
Im Gegensatz dazu enthalten die Spalten (4) bis (7) die Zahl an verknüpften Betrieben im
Längsschnittmodell. Spalte (4) gibt die Gesamtzahl an Betrieben aus dem IAB-Betriebspanel an,
die mit den Personendaten verknüpft werden können. Dagegen unterscheiden die Spalten (5) bis
(7) die Anzahl der Verknüpfungen anhand des Merkmals „Status der Betriebsnummer“ (betr_st,
siehe Abschnitt 5.2.4).
In Spalte (5) befinden sich alle originär für das Längsschnittmodell ausgewählten Betriebe. Diese
sind als sogenannte Panelfälle für den Zeitraum 2009 – 2016 aus dem IAB-Betriebspanel gezogen
worden (vgl. Abschnitt 0). Die dargestellten Zahlen in Spalte (5) beziehen sich dabei auf
Verknüpfungen von Betrieben, bei denen
•      zum Stichtag der Befragung (30.06. des jeweiligen Jahres) ein gültiges Interview vorliegt und
•      dieser Stichtag vom Beginn- und Enddatum der Episode eingeschlossen wird.
Bei der Anzahl in Spalte (6) handelt es sich dagegen um Verknüpfungen, bei denen
•      zum Stichtag der Befragung (30.06. des jeweiligen Jahres) ein gültiges Interview vorliegt,

FDZ-Datenreport 06|2021 DE                                                                          18
•    dieser Stichtag jedoch nicht vom Beginn- und Enddatum der Episode eingeschlossen wird.
Spalte (7) beinhaltet schließlich die Zahl an Betrieben aus dem IAB-Betriebspanel, für die zwar eine
Verknüpfung mit den Personendaten hergestellt werden kann, die jedoch keine Panelfälle für den
Zeitraum 2009 bis 2016 darstellen.

Tabelle 5: Mengengerüst

                                              Betriebe im IAB-Betriebspanel mit Verknüpfung
             Personen        Betriebe
                                                           zu den Personendaten

                                                                                         Betrieb nicht für
    Jahr                                                Betrieb für LIAB-Modell
                                                                                           LIAB-Modell
                                                              ausgewählt
            Insgesamt        Insgesamt    Insgesamt                                        ausgewählt

                                                       betr_st == 1      betr_st == 2      betr_st == 3

    (1)          (2)            (3)          (4)           (5)               (6)                (7)

     1975        135.755         70.564
     1976        150.195         78.760
     1977        167.538         84.168
     1978        182.600         89.237
     1979        203.538         96.988
     1980        221.944        102.265
     1981        238.847        104.089
     1982        253.763        104.652
     1983        268.354        107.849
     1984        287.825        112.977
     1985        305.020        114.948
     1986        328.508        119.510
     1987        348.130        123.031
     1988        365.539        126.178
     1989        390.005        132.400
     1990        423.632        143.382
     1991        570.470        183.545
     1992        670.108        212.369
     1993        684.820        218.868        2.427              134              96                 2.291
     1994        700.961        225.812        2.290              144              94                 2.143
     1995        726.514        229.915        2.185              162              111                2.020
     1996        747.856        232.101        4.950              571              384                4.370
     1997        775.186        235.761        4.634              660              440                3.966
     1998        814.220        240.511        5.089              803              538                4.272
     1999        876.550        305.638        5.586             1.039             720                4.534
     2000        949.833        320.917        7.787             1.444          1.029                 6.308

FDZ-Datenreport 06|2021 DE                                                                                19
Betriebe im IAB-Betriebspanel mit Verknüpfung
             Personen        Betriebe
                                                           zu den Personendaten

                                                                                        Betrieb nicht für
  Jahr                                                  Betrieb für LIAB-Modell
                                                                                          LIAB-Modell
                                                              ausgewählt
            Insgesamt        Insgesamt    Insgesamt                                       ausgewählt

                                                       betr_st == 1      betr_st == 2     betr_st == 3

    (1)          (2)            (3)          (4)           (5)               (6)               (7)

    2001         984.830        318.955        8.676             1.699          1.239                6.941
    2002       1.011.755        309.715        8.410             1.964          1.514                6.420
    2003       1.043.497        314.233        8.533             2.489          2.084                6.005
    2004       1.080.969        323.541        8.864             2.778          2.198                6.051
    2005       1.081.997        323.653        9.062             3.102          2.435                5.920
    2006       1.123.872        333.371        9.072             3.532          2.839                5.510
    2007       1.186.619        341.414        9.351             4.043          3.337                5.273
    2008       1.253.701        347.515        9.786             4.631          3.929                5.117
    2009       1.271.486        357.517       10.204             5.211          4.492                4.915
    2010       1.295.411        369.903       10.269             5.426          4.698                4.675
    2011       1.335.413        381.934       10.388             5.501          4.759                4.721
    2012       1.354.174        385.663       10.908             5.616          4.731                5.112
    2013       1.370.698        387.775       11.179             5.806          4.946                5.180
    2014       1.385.532        391.694       11.349             6.107          5.164                5.047
    2015       1.393.923        392.821       11.826             6.373          5.320                5.258
    2016       1.397.016        393.384       12.270             6.745          5.692                5.295
    2017       1.393.350        394.166       11.169             6.604          5.523                4.303
    2018       1.359.638        398.225       10.392             6.491          5.161                3.624
    2019       1.330.832        401.459        9.575             5.198          3.977                4.175
Zu beachten: Der Wert in Spalte (4) ergibt sich nicht aus der Summe der Spalten (5), (6) und (7).

2         Datenquellen
Die administrativen Personendaten werden aus den Integrierten Erwerbsbiografien (IEB) des IAB
gezogen. Diese vereinen Daten aus verschiedenen Datenquellen, die jeweils Informationen aus
unterschiedlichen EDV-Verfahren enthalten können. Zusätzlich werden einige ergänzende
Merkmale aus diesen Datenquellen in die administrativen Personendaten aufgenommen, die
nicht Teil der IEB sind. Abbildung 3 veranschaulicht die Datenflüsse, die zum LIAB LM 7519 führen
und stellt deren Beziehung zu anderen Datenprodukten des FDZ dar.
In den Personendaten des LIAB LM 7519 werden nur die Datensätze aus den dargestellten Quellen
der Beschäftigtenhistorik (BeH) und Leistungsempfängerhistorik (LeH) aus der IEB übernommen.

FDZ-Datenreport 06|2021 DE                                                                               20
2.1 Beschäftigtenhistorik (BeH)
Die Quelle für Informationen über Beschäftigung ist die Beschäftigtenhistorik (BeH) des IAB. Die
Grundlage der Daten ist das mit Wirkung vom 01.01.1973 eingeführte (und seit dem 01.01.1991 auf
Ostdeutschland ausgedehnte) integrierte Meldeverfahren zur Kranken-, Renten- und
Arbeitslosenversicherung (DEÜV; früher DEVO/DÜVO; vgl. für weitere Details: Bender et al., 1996, S.
4ff.; Wermter/Cramer, 1988). Es verlangt von den Arbeitgebern mindestens einmal jährlich
Meldungen           für    alle     sozialversicherungspflichtig           Beschäftigten        an     die    zuständigen
Sozialversicherungsträger abzugeben.
Die BeH erfasst alle Arbeiter und Angestellten sowie alle Auszubildenden, soweit sie nicht von der
Sozialversicherungspflicht befreit sind. Dies bedeutet, dass verbeamtete und selbstständige
Tätigkeiten sowie Studierende 3 (vgl. Cramer, 1985) grundsätzlich nicht in der BeH erfasst werden.
Seit der Änderung des Meldeverfahrens zum 01.01.1999 werden auch geringfügig Beschäftigte und
mithelfende Familienangehörige erfasst (enthalten erst ab 01.04.1999). Die Daten werden von den
Krankenkassen aufgenommen, von der Bundesagentur für Arbeit gesammelt, aufbereitet und
anschließend vom IAB in dessen Historikdatei integriert.
Die administrativen Personendaten werden durch Betriebsdaten (Basis-Betriebsdatei und BHP-
Erweiterungsmodule) ergänzt. Diese werden dem Betriebs-Historik-Panel (BHP) entnommen, das
ebenso auf der BeH basiert.
Bei der Verknüpfung von Personen- mit Betriebsdaten aus dem BHP muss berücksichtigt werden,
dass die Merkmale in der Basis-Betriebsdatei sowie in den BHP-Erweiterungsmodulen zum 30.6.
eines Jahres aggregiert werden. Die Betriebsmerkmale sind deshalb, im Unterschied zu den
Personenangaben, keine zeitraumbezogenen Daten, sondern nur am 30.6. jeden Jahres exakt
gültig. 4
Die Verknüpfung der Betriebs- und Personendatei erfolgt über die programmspezifischen
Kommandos der zur Datenaufbereitung und -analyse genutzten Softwarepakete. In Stata können
die Daten beispielsweise unter Verwendung des „merge“-Befehls und der Jahresangabe sowie
der Betriebsnummer in Verbindung mit der entsprechenden Pfadangabe verknüpft werden (vgl.
Kasten 2).

3
    Studierende können dennoch in der BeH erscheinen, wenn sie parallel zum Studium z. B. geringfügig beschäftigt waren.
4
 Extrembeispiel: Es liegt eine Beschäftigungsmeldung vom 1.1. bis zum 30.5.2006 vor, der Betrieb geht im Juni 2006 Konkurs.
Dann gibt es im BHP zu diesem Betrieb für 2006 keine Informationen.

FDZ-Datenreport 06|2021 DE                                                                                                 21
Abbildung 3: Quellen des LIAB

                                                                                                 Über das FDZ
   Datenquelle                                      IAB-Daten
                                                                                               erhältliche Daten

  Meldungen zur                                                                                Betriebs-Historik-
                                           Beschäftigten-Historik (BeH)                          Panel (BHP)
Sozialversicherung

                             Leistungsempfängerhistorik (LeH)

                         Leistungshistorik Grundsicherung (LHG)
                                                                                                Linked-Employer-
  Daten aus dem                                                              Integrierte      Employee-Daten des
 Geschäftsprozess                                                         Erwerbsbiografien         IAB (LIAB)
      der BA                                                                    (IEB)          (LIAB LM ohne MTH,
                                                                                                 (X)ASU und LHG)
                         Arbeitsuchendenhistoriken (ASU/XASU)

                       Maßnahmeteilnahmehistoriken (MTH/XMTH)

Betriebsbefragung                                                                              IAB-Betriebspanel

2.2       Leistungsempfängerhistorik (LeH)
Die Leistungsempfängerhistorik (LeH) erfasst Zeiträume, in denen Personen Lohnersatzleistungen
der Bundesagentur für Arbeit beziehen (Rechtskreis SGB III). Die Leistungen beinhalten
Arbeitslosengeld, Arbeitslosenhilfe, Unterhaltsgeld und von der Bundesagentur für Arbeit
übernommene Beiträge zur privaten Kranken- bzw. Pflegeversicherung während des
Leistungsbezugs. Leistungen nach dem Rechtskreis SGB II (z. B. Arbeitslosengeld II) sind nicht
enthalten. Da der Leistungsanspruch von der Erfüllung gesetzlicher Voraussetzungen abhängt,
werden Arbeitslosigkeitsperioden, in denen die Voraussetzungen nicht vorliegen (z. B. fehlende
Bedürftigkeit im Falle der Arbeitslosenhilfe oder Nichterfüllung der Anwartschaftszeit beim
Arbeitslosengeld) nicht in der Leistungsempfängerhistorik erfasst. Der linke Datenrand der LeH ist
der 01.01.1975.

FDZ-Datenreport 06|2021 DE                                                                                         22
Sie können auch lesen