Modernisierung der Fehlerbeseitigung - EFGS 2021

 
WEITER LESEN
WEITERENTWICKLUNG

Dipl.-Kaufmann Elmar Wein

Modernisierung
der Fehlerbeseitigung
Steigende Anforderungen der Nutzer an die Aktualität und                                    Fehlerbeseitigung darstellen. Nach der Vorstellung grund-
Genauigkeit statistischer Ergebnisse erfordern neue Metho-                                  sätzlicher Überlegungen des PL-Fachkonzepts folgt die
den und Verfahren bei der Statistikerstellung. Dazu zählt                                   Darstellung der Neuerungen bei der Planung und Durchfüh-
insbesondere die Fehlerbeseitigung bzw. Plausibilisierung                                   rung einer Fehlerbeseitigung. Ein Ausblick auf die weiteren
(PL). Sie verbessert die Genauigkeit statistischer Ergeb-                                   Aufbauarbeiten und zukünftige Entwicklungen im Bereich
nisse, andererseits erfordert sie Zeit und verschlechtert                                   der Fehlerbeseitigung schließen den Beitrag ab.
dadurch deren Aktualität. Untersuchungen haben ergeben,
dass die Fehlerbeseitigung bis zu 40% der Ressourcen für
eine Statistik verbrauchen kann.1)                                                          Fehlerbeseitigung im Rahmen
Eine Projektgruppe aus Vertretern der Statistischen Ämter                                   der Statistikerstellung
des Bundes und der Länder2) hat ein umfassendes Fach-
                                                                                            Die statistischen Ämter haben die Erstellung von Statistiken
konzept zur Modernisierung der Fehlerbeseitigung, das
                                                                                            in den letzten Jahren erheblich modernisiert und damit die
„PL-Fachkonzept“, erstellt. Mit ihm sollen die Aktualität
                                                                                            Rahmenbedingungen der Plausibilisierung entscheidend
statistischer Ergebnisse verbessert und die Effizienz der
                                                                                            verändert. Im Folgenden sollen die wichtigsten Aktivitäten
Fehlerbeseitigung gesteigert werden.
                                                                                            zur Erstellung einer Statistik beschrieben, die Fehlerbeseiti-
                                                                                            gung einzelnen Prozessen zugeordnet und relevante Moder-
Das Statistische Bundesamt hat die Vorgaben des PL-Fach-                                    nisierungsaktivitäten vorgestellt werden.
konzepts für die Plausibilisierung von Daten in neue Daten-
verarbeitungsprogramme (DV-Programme) implementiert.                                        Damit Nutzern zuverlässige statistische Ergebnisse zur
Weiterhin wurden mathematisch-statistische Plausibili-                                      Verfügung stehen, müssen zuvor eine Reihe von Prozessen
sierungsmethoden im Jahr 2004 erfolgreich getestet. Das                                     durchgeführt werden. Einen geeigneten Ansatz zur Beschrei-
PL-Fachkonzept wird in diesem Jahr in allen Statistischen                                   bung der Statistikerstellung stellt die Wertschöpfungspro-
Landesämtern eingeführt.                                                                    zesskette dar (siehe Schaubild 1), weil damit die Betrach-
                                                                                            tungen auf notwendige Aktivitäten reduziert werden.3)
Der folgende Aufsatz behandelt zuerst die Erstellung
von Bundesstatistiken einschließlich wesentlicher Ver-                                      Die Statistikerstellung beginnt mit der Anmeldung eines
änderungen, die wichtige Rahmenbedingungen für eine                                         Datenbedarfs. Am Ende dieses Prozesses liegen konkrete

 1) Siehe Federal Committee on Statistical Methodology: “Data Editing in Federal Statistical Agencies”, Statistical Policy Working Paper No. 18, Washington D.C. 1990.
 2) An der Konzeptentwicklung beteiligten sich neben dem Statistischen Bundesamt die Statistischen Ämter der Länder Baden-Württemberg, Bayern, Nordrhein-Westfalen, Sachsen und
    Thüringen.
 3) Siehe Schulte-Zurhausen, M.: „Organisation“, München 1995.

Statistisches Bundesamt • Wirtschaft und Statistik 4/2005                                                                                                                 293
WEITERENTWICKLUNG

                                                                                    Schaubild 1

                                              Erforderliche Prozesse zur Erstellung und Verbesserung einer Statistik

         (1)                       (2)                       (3)                         (4)                       (5)                        (6)                      (7)
      Ermittlung                  Vor-                      Daten-                      Auf-                      Aus-                       Ver-                   Statistik-
         des                    bereitung                 gewinnung                   bereitung                  wertung                   breitung                 Optimie-
        Daten-                                                                                                                                                        rung
       bedarfs                 PL-Planung                  PL-Durch-                  PL-Durch-                                                                    PL-Optimie-
                                                            führung                    führung                                                                        rung

Vorstellungen hinsichtlich der benötigten Daten und ihrer                                       fältige Verbindungen: Die PL-Planung setzt die Festlegung
Qualität vor, die wesentliche Vorgaben für die Fehlerbe-                                        der Erhebungsinhalte voraus. Die PL-Durchführung liefert
seitigung darstellen.4) Durch den Pfeil zum Prozess „Sta-                                       wichtige Informationen für die Interpretation statistischer
tistik-Optimierung” soll, wie auch bei den nachfolgenden                                        Ergebnisse. Die PL-Optimierung initiiert Veränderungen bei
Prozessen, angedeutet werden, dass geeignete Prozess-                                           vorliegenden Fragebogen.
dokumentationen bei Bedarf für eine Optimierung bereit-
zustellen sind.                                                                                 Immer schnellere Entwicklungen und eine sich in verschie-
                                                                                                dene Interessengruppen ausdifferenzierende Gesellschaft
Auf der Grundlage des konkretisierten Datenbedarfs werden                                       führen zu steigenden und heterogenen Anforderungen
die Erhebungsunterlagen entwickelt, das Auswertungspro-                                         der Nutzer an amtliche Statistiken. Bei vielen Statistiken
gramm erstellt und die Fehlerbeseitigung geplant (PL-Pla-                                       werden neben den früher üblichen Standardergebnissen
nung).                                                                                          in Fachserien zunehmend auch vorläufige Ergebnisse ver-
                                                                                                öffentlicht und anonymisierte Mikrodaten bereitgestellt, die
Um möglichst plausible Daten zu erhalten, setzen die sta-
                                                                                                Nutzer mit verfügbarer statistischer Standardsoftware nach
tistischen Ämter neben gedruckten Fragebogen zunehmend
                                                                                                spezifischen Gesichtspunkten analysieren. Diese Entwick-
elektronische Erhebungsinstrumente ein, die Angaben der
                                                                                                lung stellt sehr große Anforderungen an die Plausibilität
Befragten „vor Ort“ prüfen, damit diese sofort korrigiert
                                                                                                statistischer Daten. Durch die Bereitstellung verschiedener
werden können. Im Verlauf der Aufbereitung werden Fehler
                                                                                                Ergebnistypen ist die Statistikerstellung im Bereich der Auf-
korrigiert, die nicht im Zuge der Datengewinnung beseitigt
                                                                                                bereitung komplexer geworden.
werden konnten (PL-Durchführung).

Sich verändernde Nutzerwünsche und die Einführung neuer                                         In den letzten Jahren konzentrierten sich viele Modernisie-
Methoden und DV-Programme erfordern eine kontinuier-                                            rungsaktivitäten der amtlichen Statistik auf den Prozess
liche Weiterentwicklung der Aufbereitung und Veröffentli-                                       der Datengewinnung, um plausiblere Angaben zu erhalten,
chung von Statistiken. Typische Aktivitäten zielen auf eine                                     die schneller veröffentlicht werden können. Neben der
Verbesserung eingesetzter Erhebungsinstrumente und die                                          zunehmenden Bereitstellung von Internetfragebogen5) hat
Weiterentwicklung der Fehlerbeseitigung, was durch die                                          die deutsche amtliche Statistik im März 2005 das ausge-
Pfeile zu den entsprechenden vorangegangenen Prozessen                                          zeichnete System eSTATISTIK.core6) in Betrieb genommen,
angedeutet wird. Bei der PL-Optimierung werden zum Bei-                                         mit dem Unternehmen erstmals die Möglichkeit haben,
spiel die Korrekturen analysiert, um die Fehlerursachen zu                                      mit einer besonderen Softwarekomponente statistische
erkennen und Maßnahmen zur Vermeidung vorzuschlagen.                                            Rohdaten aus dem betrieblichen Rechnungswesen auto-
                                                                                                matisch zu gewinnen und diese über das Internet an eine
Zwischen den Prozessen der Fehlerbeseitigung und den                                            zentrale Statistikannahmestelle zu übermitteln.7) Weiterhin
übrigen Prozessen der Statistikerstellung bestehen viel-                                        standardisiert die deutsche amtliche Statistik seit 2003 ihre

4) Siehe Blanc, M./Radermacher, W./Körner, T.: „Qualität und Nutzer“ in WiSta 10/2001, S. 799 ff.
5) Informationen über vorliegende Internetfragebogen enthält die Seite http://www.destatis.de/buerokratieabbau/datenerhebung.htm.
6) eSTATISTIK.core hat im März 2005 den ersten Preis der internationalen Beratungsgesellschaft BearingPoint und Cisco Systems im Politikfeld „Wirtschaft und Arbeit“ des 5. eGovernment-
   Wettbewerbs gewonnen (siehe auch WiSta 3/2005, S. 173).
7) Siehe hierzu http://www.statistik-portal.de/Statistik-Portal/datenOnline.asp.

294                                                                                                                           Statistisches Bundesamt • Wirtschaft und Statistik 4/2005
WEITERENTWICKLUNG

Papierfragebogen durch die Einführung eines einheitlichen                                               müssen. Dies bedeutet, dass nicht alle Fehler bei der
Designs.                                                                                                Datengewinnung erkannt und beseitigt werden können.
                                                                                                        Im Zuge der Aufbereitung sollen daher mit Hilfe selekti-
Bedingt durch die Modernisierung der Statistikerstellung                                                ver Plausibilisierungsmethoden gravierende Fehler mit
ergeben sich mehr Möglichkeiten zur Gewinnung plausib-                                                  erheblichem Einfluss auf statistische Ergebnisse erkannt
lerer Angaben. Sie stellen wichtige Rahmenbedingungen                                                   und vorrangig manuell korrigiert werden. Marginale
für eine moderne Fehlerbeseitigung dar, induzieren aber                                                 Fehler sollen stärker als bisher durch maschinelle Feh-
gleichzeitig einen größeren Planungsbedarf und Empfehlun-                                               lerbestimmungsmethoden entdeckt und mit Hilfe von
gen zum Einsatz moderner Aufbereitungsmethoden, die mit                                                 Imputationsmethoden DV-gestützt korrigiert werden.9)
dem PL-Fachkonzept erfüllt werden.                                                                      Diese Maßnahmen steigern die Effizienz einer Fehlerbe-
                                                                                                        seitigung erheblich.

Grundsätzliche Überlegungen                                                                         – Standardisierung der PL-Methoden
des PL-Fachkonzepts                                                                                     Den PL-Aktivitäten wurden wieder verwendbare Plausi-
                                                                                                        bilisierungsmethoden zugeordnet. Dazu gehören zum
Wie eingangs erwähnt, stellen die Verbesserung der Aktu-                                                Beispiel Streuungsdiagramme, mit denen Ausreißer
alität und die Steigerung der Effizienz wesentliche Ziele                                               erkannt werden können. Ein Teil der für die Fehlerbe-
des PL-Fachkonzepts dar. Unterschiedliche Abläufe der                                                   seitigung benötigten PL-Methoden wurde inzwischen in
Fehlerbeseitigungen bei den Statistiken haben zu einem                                                  Softwaremodule umgesetzt und ist für eine Vielzahl von
umfassenden Ansatz geführt, der folgende grundsätzliche                                                 Statistiken einsetzbar. Durch die Wiederverwendung
Überlegungen enthält:                                                                                   vorhandener DV-Module rechnet sich die aufwändige
                                                                                                        DV-technische Umsetzung leistungsfähigerer Plausibi-
– Fehlervermeidung durch vermehrte Prüfungen bei                                                        lisierungsmethoden. Dieser Standardisierungsansatz
  der Entstehung von Daten                                                                              entspricht dem „Plattform-Prinzip“ der Automobilindus-
    Angaben sollen schon bei ihrer Entstehung stärker als                                               trie, bei dem verschiedene Pkw-Typen auf identischen
    bisher auf ihre Plausibilität geprüft werden, um aufwän-                                            Bodengruppen erstellt werden. Er wird auch von ande-
    dige Rückfragen zu reduzieren, die Auskunftgebende                                                  ren nationalen statistischen Ämtern präferiert10) und
    belasten und zusätzliche Kosten in den statistischen                                                bietet die notwendige Flexibilität, um die sehr heteroge-
    Ämtern verursachen. Dieses Ziel soll durch die Nutzung                                              nen Anforderungen der einzelnen Bundesstatistiken zu
    geprüfter Angaben aus den Berichtswesen der Unter-                                                  erfüllen.
    nehmen erreicht werden. Eine Alternative stellt die
    zunehmende Bereitstellung von Internetfragebogen mit                                            – Einführung eines Prozessmanagements
    integrierten üblichen Plausibilitätsprüfungen dar, wie sie                                          Der zunehmende Methodenmix im Bereich der Fehlerbe-
    zum Beispiel auch in Homebanking-Anwendungen oder                                                   seitigung erfordert eine bessere Planung und Steuerung.
    Internet-Shops üblich sind. Das PL-Fachkonzept enthält                                              Eine Fehlerbeseitigung besteht aus mehreren Arbeits-
    Empfehlungen zur Integration von Plausibilitätsprüfun-                                              paketen, in denen zum Beispiel Angaben aus Papier-
    gen in den Prozess der Datenentstehung.                                                             fragebogen zuerst in weiterverarbeitungsfähige Daten
                                                                                                        umgewandelt werden müssen, um anschließend mit
– Intensivere Ausrichtung einer Fehlerbeseitigung auf                                                   Hilfe von Plausibilitätsprüfungen unvollständige und feh-
  statistische Ergebnisse                                                                               lerhafte Angaben zu erkennen und zu beseitigen. Diese
    Die Frage „Was wird wann mit welchem Plausibilitätsgrad                                             vielfältigen Aktivitäten sind aufeinander abzustimmen.
    veröffentlicht?“ soll stärker als bisher die Planung und                                            Sie wurden unter Nutzung moderner DV-technischer Mög-
    Durchführung einer Fehlerbeseitigung bestimmen.8) Sie                                               lichkeiten und Plausibilisierungsmethoden in idealtypi-
    trägt den steigenden Nutzeranforderungen und den knap-                                              sche PL-Prozesse restrukturiert (Prozessmanagement).
    peren Ressourcen der statistischen Ämter gleichermaßen                                              Für die Feinplanung von PL-Prozessen stehen zukünftig
    Rechnung. Mit Hilfe leistungsfähigerer PL-Methoden                                                  moderne Methoden der Arbeits-, Zeit- und Personalpla-
    können Anforderungen an die Aktualität und Genauig-                                                 nung zur Verfügung, die auch für die Leitung einer laufen-
    keit statistischer Daten viel besser als bisher umgesetzt                                           den Fehlerbeseitigung genutzt werden sollen.
    werden.
                                                                                                    – Mehrfache Wiederverwendung vorliegender Meta-
– Verstärkter Einsatz leistungsfähigerer Methoden für                                                 daten
  die Fehlerbeseitigung                                                                                 Statistiken sind ohne Beschreibungen der entsprechen-
    Die statistischen Ämter werden in den nächsten Jah-                                                 den Erhebungsmerkmale nicht zu verstehen. Zur Planung
    ren einen Mix an Erhebungsinstrumenten einsetzen                                                    einer Fehlerbeseitigung gehört daher auch die Beschrei-

 8) Siehe Kopsch, G./Chlumsky, J. u. a.: „Von der Input- zur Outputsteuerung“, Statistisches Bundesamt, interne Unterlage, Wiesbaden 1998.
 9) Siehe Latouche, M./Bureau, M./Croal, J.: “Development of a Cost-Effective Edit and Follow Up Process: The Canadian Survey of Employment Experience”, Statistical Data Editing, Methods
    and Techniques, Volume 2, Genf 1997; Hedlin, D.: “Score Functions to Reduce Business Survey Editing at the ONS”, http://www.unece.org/stats/documents/2002/05/sde/14.e.pdf;
    Rubin, D. B.: “Basic Ideas of Multiple Imputation for Nonresponse”, Survey Methodology, Vol. 12, No. 1; Fellegi, I. P./Holt, D.: “A Systematic Approach to Automatic Edit and Imputation”,
    Journal of the American Statistical Association, Vol. 71, Nr. 353, S. 17 ff.
10) Siehe Béguin, C./Hulliger, B. (Bundesamt für Statistik, Schweiz): “Robust Multivariate Outlier Detection and Imputation with Incomplete Survey Data”, EUREDIT Deliverable D4/5.2.1/2 Part
    C, Neuchâtel 2003, S. 14.

Statistisches Bundesamt • Wirtschaft und Statistik 4/2005                                                                                                                               295
WEITERENTWICKLUNG

                                                                                      Schaubild 2

                                                                 Methodensammlung im PL-Intranetangebot

    bung von Erhebungsmerkmalen und Plausibilitätsprü-                                             tung aktueller methodischer Entwicklungen. Weiterhin ist
    fungen (Metadaten). Seit Juli 2004 ist eine Software                                           von jeder neuen PL-spezifischen Software ein Zugriff auf das
    im Einsatz, mit der Erhebungsmerkmale und fachliche                                            PL-Intranetangebot möglich, um weitere Informationen zu
    PL-Prüfungen beschrieben werden können. Vorliegende                                            erhalten. Das Schaubild 2 zeigt die Startseite der Sammlung
    Beschreibungen können direkt für die Erstellung einer                                          mit den wieder verwendbaren PL-Methoden.
    Statistik und für andere Fachstatistiken verwendet wer-
    den. Fachstatistiker und IT-Fachpersonal werden dadurch
    erheblich entlastet, und der Vorbereitungsaufwand für
                                                                                                   Neuerungen bei der Planung
    eine Statistik reduziert sich. Die Software wird im nach-                                      einer Fehlerbeseitigung11)
    folgenden Kapitel ausführlicher beschrieben.
                                                                                                   Die Planung einer Fehlerbeseitigung wird zukünftig mit Hilfe
                                                                                                   von Projektmanagementmethoden12) erfolgen und ist durch
Die grundsätzlichen Überlegungen des PL-Fachkonzepts
                                                                                                   den im Schaubild 3 dargestellten Ablauf gekennzeichnet.
wurden in neue Software und Materialien implementiert, die
typische Aktivitäten der Fachstatistiker unterstützen. Über                                        Die Planung sieht ein zweistufiges Vorgehen vor, das im ers-
die Nutzung der Software wird das PL-Fachkonzept quasi                                             ten Schritt aus einer Umsetzung der Nutzeranforderungen
„automatisch“ umgesetzt. Die Software ist für geübte PC-                                           unter Beachtung interner Rahmenbedingungen in einen PL-
Nutzer weitgehend selbsterklärend, sodass der Schulungs-                                           Ablauf (Grobplanung) besteht, der in einem zweiten Schritt,
aufwand begrenzt werden kann. Neben der Software sind                                              das heißt im Rahmen einer Feinplanung, ausgestaltet wird.
die Überlegungen des PL-Fachkonzepts in einem PL-Intranet-
angebot dokumentiert. Es steht allen statistischen Ämtern                                          Zu Beginn der PL-Planung werden die Nutzeranforderungen
zur Verfügung und ermöglicht eine kostengünstige Verbrei-                                          an statistische Ergebnisse erfasst. Das PL-Fachkonzept

11) Im Einzelnen bearbeiteten folgende Mitarbeiterinnen und Mitarbeiter des Statistischen Bundesamtes die in diesem Kapitel dargestellten Neuerungen: Der elektronische Leitfaden wurde
    von Volker Stutzer und Tatjana Theis erstellt, Corina Teichmann leitet die Entwicklung des PL-Editors, und die PL-Prozessmanager sowie das PL-Intranetangebot (siehe das Kapitel „Grund-
    sätzliche Überlegungen des PL-Fachkonzepts“) wurden von Tatjana Theis entwickelt.
12) Siehe Klose, B.: „Projektabwicklung“, Wien 1996; Winkelhofer, G. A.: „Methoden für Management und Projekte“, Berlin 1997; Boy, J./Dudek, C./Kuschel, S.: „Projektmanagement“, Offen-
    bach 1994.

296                                                                                                                              Statistisches Bundesamt • Wirtschaft und Statistik 4/2005
WEITERENTWICKLUNG

                                      Schaubild 3                                     Neben den Nutzeranforderungen sind bei der Planung einer
                                                                                      Fehlerbeseitigung organisatorische und DV-technische Rah-
               Ablauf der Planung einer Fehlerbeseitigung
                                                                                      menbedingungen sowie spezifische Besonderheiten einer
                                                                                      Statistik zu berücksichtigen. Dazu zählen das vorhandene
    D                 Abschließende Prüfungen
          � �� �� �

                                                                                      Personal sowie verfügbare Hard- und Software. Spezifische

                                                                   ��
    O                 Beschreibung von Risiken                                        Besonderheiten einer Statistik, wie zum Beispiel die Über-
    K
    U                                                                                 prüfbarkeit der Erhebungsinhalte, Teilnahmehäufigkeiten
                      Kosten und Investitionen
    M                                                                                 der Auskunftgebenden und zu prüfende Sonderkonstella-

                                                            � ��
    E                 Personal- und Sachmittel                       Fein-            tionen, beeinflussen erheblich den Umfang einer Fehler-
    N                                                              planung            beseitigung.
    T                 Arbeits-, Zeit und Meilensteine
    A
    T                 Spezifizierung von Plausibilitätsprüfungen                      Für die Erfassung der Nutzeranforderungen und Rahmenbe-

                                                                   �
    I                                                                                 dingungen einer Fehlerbeseitigung steht den Fachstatisti-
    O                                 Grobplanung                                     kern zukünftig ein elektronischer Leitfaden zur Verfügung.
    N         Sammlung und Bewertung relevanter Informationen                         Mit Hilfe von Fragen sollen alle wesentlichen Aspekte
                                                                                      zusammengetragen, ihre Einflüsse auf eine Fehlerbesei-
                                                                                      tigung bewertet und Schlussfolgerungen im Hinblick auf
                                                                                      eine zu planende Fehlerbeseitigung gezogen werden. Das
unterstellt, dass die statistischen Ämter auch zukünftig ent-                         Schaubild 4 zeigt einen Ausschnitt aus dem Leitfaden.
sprechend der bestehenden Praxis statistische Ergebnisse
als „Eckzahlen“ (Tendenzen), „Vorläufige Ergebnisse“,                                 Mit Hilfe des Leitfadens können Fachstatistiker ihre Pla-
„Standardergebnisse“ und „Anonymisierte Mikrodaten“                                   nungsannahmen und Einschätzungen systematisiert darle-
verbreiten. Die Ergebnistypen unterscheiden sich hinsicht-                            gen, untereinander austauschen und dadurch objektivieren.
lich der Aktualität und Genauigkeit: Tendenzen stellen
zum Beispiel hochaktuelle statistische Ergebnisse (mit                                Es wird erwartet, dass Fachstatistiker und die für die Auf-
Genauigkeitseinbußen) dar, die lediglich erste Entwicklun-                            bereitung zuständigen IT-Fachkräfte nach der Sammlung
gen aufzeigen sollen. Im Vergleich dazu handelt es sich                               und Bewertung von relevanten Informationen Vorstellungen
bei den „Anonymisierten Mikrodaten“ um hoch plausible                                 über den Ablauf einer Fehlerbeseitigung entwickeln. Unter-
Einzeldaten mit einem schlechteren Aktualitätsgrad. Das                               stützend stehen idealtypische Abläufe einer Fehlerbeseiti-
PL-Fachkonzept sieht vor, dass die Nutzer ihre Anforde-                               gung (PL-Abläufe) zur Verfügung, die beste Praktiken dar-
rungen an Statistiken über die statistischen Ergebnistypen                            stellen und an spezielle Anforderungen der Fachstatistiken
formulieren.                                                                          angepasst werden können.

                                                                             Schaubild 4

                              Erfassung des Datenbedarfs mit Hilfe des Leitfadens für die Informationssammlung und -bewertung

Statistisches Bundesamt • Wirtschaft und Statistik 4/2005                                                                                    297
WEITERENTWICKLUNG

Mit der Auswahl eines PL-Ablaufs im Zuge der PL-Grob-                unter werden alle vorliegenden Beschreibungen einer
planung liegt der Rahmen für die Feinplanung vor. Einen              bearbeiteten Erhebung in einer Baumstruktur übersichtlich
wesentlichen Bestandteil stellt die Beschreibung der Erhe-           angeordnet. In der Mitte der Oberfläche befindet sich der
bungsmerkmale und Formulierung von Plausibilitätsprü-                Editierbereich, in dem zum Beispiel die Merkmale und PL-
fungen dar. Inzwischen verfügen alle statistischen Ämter             Prüfungen einer Erhebung formuliert werden. Die kontext-
mit dem PL-Editor über eine neue, moderne Software, die              orientierte Onlinehilfe rechts enthält Empfehlungen zum
diese Schritte unterstützt und die Beschreibungen in einer           Formulieren und Anmerkungen zum Ausfüllen einzelner
zentralen Datenbank ablegt, sodass sie auch für andere               Felder im Editierbereich. Der untere Teil der Oberfläche
Statistiken verfügbar sind. Ein wesentliches Merkmal des             informiert über syntaktische Prüfungen der vorliegenden
PL-Editors ist, dass die Fachstatistiker Merkmale und zuge-          Merkmalsbeschreibungen.
hörige Plausibilitätsprüfungen entsprechend dem Prinzip
der Objektorientierung in Themenbereichen zusammenfas-               Neben der üblichen Syntaxprüfung verfügt der PL-Editor
sen können. Ein Themenbereich entspricht dem Abschnitt               über eine leistungsfähige Analysefunktion, um Inkonsisten-
eines Fragebogens, der zusammenhängende Merkmale                     zen in vorliegenden Formulierungen zu erkennen, wie zum
– beispielsweise zur Wohnsituation – enthält. Zusätzlich             Beispiel syntaktisch korrekte Formulierungen, die aber für
enthält er alle PL-Prüfungen, um fehlerhafte Angaben bei             eine Fehlerbeseitigung nicht weiter verwendet werden.
den jeweiligen Merkmalen zu erkennen. Die modulare
Zusammenstellung der Erhebungsinhalte und ihre Kombi-                Die mit dem PL-Editor formulierten Plausibilitätsprüfungen
nation mit den entsprechenden PL-Prüfungen erleichtert               werden in ausführbare Codes umgesetzt und können direkt
erheblich deren Wiederverwendung.                                    in Internetfragebogen und in amtsinterne Software für die
                                                                     Fehlerbeseitigung eingebunden werden. Dadurch reduziert
Die Benutzeroberfläche des PL-Editors enthält links oben             sich der Vorbereitungsaufwand für Statistiken. Neben der
eine Sicht auf die Datenbank mit den Beschreibungen                  oben genannten Wiederverwendung der Beschreibungen
anderer Erhebungen, die Fachstatistiker in ihre eigenen              bei ähnlichen Statistiken werden diese auch für die Tabel-
Erhebungen einbinden können (siehe Schaubild 5). Dar-                lierung verwendet. Weiterhin generiert der PL-Editor aus den

                                                          Schaubild 5

                                               Benutzeroberfläche des PL-Editors

       Datenbank
           mit
       Erhebungen

                                                              Formulierung von
                                                               Merkmalen und
                                                                PL-Prüfungen

                                                                                                            HTML Onlinehilfe
                                                                                                             mit nutzbaren
                                                                                                           Code-Modulen und
                                                                                                             methodischen
                                                                                                             Empfehlungen
      Spezifizierte
       Metadaten
         einer
       Erhebung                                                         Syntaxprüfungen

298                                                                                       Statistisches Bundesamt • Wirtschaft und Statistik 4/2005
WEITERENTWICKLUNG

                                                                                  Schaubild 6

                                                            Weiterverwendung der Metadaten des PL-Editors

                                                                                                                         Internetfragebogen

                                                                                                                          eSTATISTIK.core

                                                                               Erhebungsbeschreibung

                                                                                    Merkmale
                                                                                                                                                             Dialog
                             PL-Editor                                                                                    Fehlerbeseitigung
                                                                                      PL-Prüfungen

                                                                                                        ...

                                                                                                                          Aufbereitung

                                                                                                                          Dokumentationen

Metadaten verschiedene Dokumentationen, die mit gängi-                                       (Zeitbedarfsschätzungen), Personal einer Fehlerbeseitigung
ger Standardsoftware angepasst werden können. Zukünf-                                        zugeordnet (Personaleinsatzplanung) und eine Terminie-
tige Versionen des PL-Editors sollen über einen Dokumen-                                     rung (Zeitplanung) vorgenommen werden. Die genannten
tationseditor und eine Umgebung für den Test spezifizierter                                  Planungsschritte werden unter dem Begriff „PL-Prozess-
Plausibilitätsprüfungen verfügen.                                                            planung“ zusammengefasst und bestimmen wesentlich
                                                                                             die Feinplanung eines gewählten PL-Ablaufs. Die Personal-
Durch die vielfache Nutzung der vorliegenden Metadaten                                       einsatz- und Zeitplanung greift auf übliche Methoden der
können erhebliche Synergieeffekte erzielt werden: Ändern                                     Netzplantechnik und Personalbedarfsermittlung zurück,
sich Merkmalsbeschreibungen, werden automatisch aktu-                                        die an die spezifischen Anforderungen einer Fehlerbeseiti-
alisierte DV-Module für Internetfragebogen und für amts-                                     gung angepasst wurden.13) Die innovativen Überlegungen
interne Software für die Fehlerbeseitigung bereitgestellt.                                   wurden in Form der „PL-Prozessmanager“ realisiert (siehe
Darüber hinaus werden auch die Metadaten für die Tabellie-                                   Schaubild 7 auf S. 300).
rung und vorhandene Dokumentationen aktualisiert. Der PL-
Editor ist eine modular aufgebaute Software, die erweitert                                   Die Planungen basieren auf Annahmen über die Anzahl
werden kann, um verschiedene IT-Plattformen für die Fehler-                                  an fehlerhaften Datensätzen, den durchschnittlichen Zeit-
beseitigung zu unterstützen. Momentan liegt ein Generator                                    bedarf für Korrekturen, das verfügbare Personal und zu
vor, der einen ausführbaren JAVA-Code erstellt.                                              geschätzten Startterminen. Neben den geplanten Daten
                                                                                             können die Fachstatistiker auch Ist-Daten in die PL-Prozess-
Der PL-Editor erfährt inzwischen einen regen Zuspruch in                                     manager eingeben und über Soll-Ist-Vergleiche frühzeitig im
allen statistischen Ämtern. Es ist geplant, ihn in den kom-                                  Rahmen einer Fehlerbeseitigung feststellen, wie sich unter-
menden Jahren als Standardwerkzeug bei allen Statistiken                                     schiedliche Entwicklungen bei den Ist-Daten auf die Bereit-
einzusetzen, sodass letztlich alle Merkmalsbeschreibungen                                    stellungstermine auswirken. Dies erleichtert wesentlich die
und PL-Prüfungen in einer Datenbank vorliegen werden,                                        Leitung einer Fehlerbeseitigung.
auf die alle statistischen Ämter Zugriff haben werden. Der
PL-Editor wird mit seiner angeschlossenen Datenbank zu
einem wichtigen „Zulieferer“ für ein Metadatensystem der
amtlichen Statistik.
                                                                                             Leistungsfähigere PL-Methoden für
                                                                                             die Fehlerbeseitigung im Überblick
Mit den beschriebenen PL-Prüfungen ist die wesentliche
Voraussetzung für die weitere Feinplanung erfüllt. Es kön-                                   Eine gute PL-Planung stellt eine wesentliche Voraussetzung
nen nun der Zeitbedarf für eine Fehlerbeseitigung geschätzt                                  für den reibungslosen Ablauf einer Fehlerbeseitigung dar.

13) Siehe Wittlage, H.: „Personalbedarfsermittlung“, München 1995; Röthig, P.: „Handbuch für die Personalbedarfsermittlung in der Bundesverwaltung“, Bundesministerium des Innern
    (Hrsg.), Bonn 1995; Aggteleky, B./Bajna, N.: „Projektplanung: ein Handbuch für Führungskräfte“, Wien 1992.

Statistisches Bundesamt • Wirtschaft und Statistik 4/2005                                                                                                                   299
WEITERENTWICKLUNG

                                                                                        Schaubild 7

                                                            Personaleinsatzplanung mit dem PL-Prozessmanager

Die Verbesserung der Aktualität statistischer Ergebnisse                                             täten unter den Schichten einer Erhebungsgesamtheit und
und die Steigerung der Effizienz einer Fehlerbeseitigung                                             selektive PL-Methoden legen fest, welche Angaben von
erfordern aber zusätzliche Änderungen bei der PL-Durchfüh-                                           Auskunftgebenden innerhalb einer Schicht vorrangig zu kor-
rung. Neben der Nutzung vorgeprüfter Angaben bildet der                                              rigieren sind.15) Beide Methoden verbessern entweder die
Einsatz leistungsfähigerer Plausibilisierungsmethoden den                                            Aktualität oder die Plausibilität hoch aktueller Ergebnisse.
Schwerpunkt der Änderungen.
                                                                                                     Das Statistische Bundesamt hat im Jahr 2004 eine Kombi-
Bis zu 80% aller Korrekturen haben im Einzelfall keinen                                              nation aus einer selektiven PL- und einer Makro-Editierme-
signifikanten Einfluss auf die statistischen Ergebnisse.14)                                          thode bei der Kostenstrukturerhebung im Verarbeitenden
Dies bedeutet, dass zum Beispiel für hochaktuelle Ergeb-                                             Gewerbe erfolgreich getestet.16) Das Schaubild 8 zeigt
nisse, mit denen lediglich erste allgemeine Entwicklungen                                            anhand erster Testergebnisse die zielgerichtete Beseitigung
aufgezeigt werden sollen, nur die gravierenden Fehler mit                                            der Plausibilitätsabweichungen bei allen Merkmalen durch
erheblichem Einfluss beseitigt werden müssen. Mit Hilfe                                              die Nutzung einer selektiven manuellen PL-Methode. Eine
selektiver PL- und Makro-Editiermethoden können diese                                                Kennzahl von 100% bei der PL-Abweichung bedeutet im
Fehler zukünftig besser erkannt werden. Diese vergleichen                                            Schaubild 8, dass keinerlei Korrekturen vorliegen.
zum Beispiel geschätzte plausible Daten mit vorliegenden
Rohdaten und interpretieren Differenzen als Hinweise auf                                             Anhand des Schaubildes 8 wird deutlich, dass bereits bei
gravierende Fehler. Makro-Editiermethoden setzen Priori-                                             50% der geprüften und im Einzelfall korrigierten Datensätze

14) Siehe Lindell, K. (Statistisches Amt Schweden, Statistics Sweden): “Impact of Editing on the Salary Statistics for Employees in County Council” in “Statistical Data Editing”, Vol. 2, UNECE
    (Hrsg.), Genf 1997.
15) Siehe Hidiroglou, M. A./Berthelot, J.-M.: “Statistical Editing and Imputation for Periodic Business Survey”, Survey Methodology, Vol. 12, No. 1; Granquist, L.: “Macro-Editing – The Aggre-
    gate Method”, Statistical Data Editing, Methods and Techniques, Volume No. 1, Methods and Techniques, New York 1994, S. 41 ff.
16) Das Statistische Bundesamt führte die methodischen Vorarbeiten im Jahr 2003 durch; siehe hierzu: „Projektbericht zur Entwicklung einer selektiven PL-Methode für die KSE Verarbeitendes
    Gewerbe“, interne Unterlage, Wiesbaden 2003.

300                                                                                                                                 Statistisches Bundesamt • Wirtschaft und Statistik 4/2005
WEITERENTWICKLUNG

                                     Schaubild 8                                                   Familienstand (hier: verheiratet) oder beide Merkmale falsch
                                                                                                   sind. Würde man zum Beispiel das Alter erhöhen, kann dies
               Reduzierung der PL-Abweichungen aufgrund der                                        dazu führen, dass die betreffende Plausibilitätsprüfung
             Prioritätensetzung durch eine selektive PL-Methode
  PL-Ab-                                                                      PL-Ab-
                                                                                                   passiert, aber eine andere zur Prüfung des Schulabschlus-
  weichung                                                                 weichung                ses ausgelöst wird. Anhand dieses einfachen Beispiels
  %                                                                               %
  100                                                                            100               wird die Komplexität einer maschinellen Fehlererkennung
                                                                                                   mit Hilfe fachlicher PL-Prüfungen deutlich. Das Statisti-
    80                                                                            80
                                                                                                   sche Bundesamt greift daher auf international anerkannte
                                                                                                   Methoden zurück, die fachliche Plausibilitätsprüfungen und
    60                                                                            60
                                                                                                   vorliegende Erfahrungen über die Vertrauenswürdigkeit von
                                                                                                   Angaben gleichermaßen berücksichtigen, eine minimale
                                                                                                   Anzahl an fehlerhaften Angaben bestimmen und fehlerhafte
    40                                                                            40
                                                                                                   Merkmale stets auf die gleiche Art und Weise erkennen.18)
                                                                                                   Angaben, die maschinell als fehlerhaft erkannt wurden,
    20                                                                            20
                                                                                                   werden anschließend auf der Grundlage mathematisch-
                                                                                                   statistischer Modelle durch Schätzungen von plausiblen
     0                                                                             0
         0           20           40          60               80           100%                   Werten ersetzt. Für diesen Schritt ist inzwischen eine Fülle
                              Bearbeitete Datensätze                                               von Software verfügbar, die Informationen über bestehende
                                                                                                   plausible Angaben nutzt und fehlerhafte Angaben nach
                                                                                                   konsistenten Regeln so ersetzt, dass bestehende Merk-
fast 80% der Plausibilitätsabweichung beseitigt wurden.                                            malsverteilungen in ihrem Verlauf nicht verzerrt werden
Andererseits wurden bei den letzten 20% der geprüften                                              („schonende Korrekturen“).19)
Datensätze nur noch knapp 10% der ursprünglichen Plausi-
bilitätsabweichung beseitigt.
                                                                                                   Ausblick
Nach wie vor müssen alle erkennbaren Fehler beseitigt                                              Die Einführung des PL-Fachkonzepts in allen statistischen
werden, da die Nutzer zunehmend mit Hilfe bereitgestell-                                           Ämtern im Verlauf des Jahres 2005 ist ein erster Schritt, um
ter anonymisierter Mikrodaten ihre eigenen spezifischen                                            das Konzept in den kommenden Jahren bei allen Bundes-
Analysen durchführen, die hohe Anforderungen an die                                                statistiken umzusetzen. Einen wesentlichen Beitrag werden
Plausibilität bereitgestellter Daten stellen. Angesichts stei-                                     hierzu die vorgestellten DV-Programme leisten müssen, die
gender Aktualitätsanforderungen und zunehmend knapper                                              in den nächsten Monaten weiter zu testen sind.
Ressourcen der statistischen Ämter ist eine langwierige
manuelle Fehlerbeseitigung marginaler Fehler nicht mehr                                            Die mit dem PL-Fachkonzept verfolgte Standardisierung
vertretbar. Das Statistische Bundesamt entwickelt daher                                            funktioniert nur durch die Bereitstellung wieder verwend-
zurzeit eine Software, mit deren Hilfe fehlerhafte Angaben                                         barer Software, wobei methodische Weiterentwicklung und
zuverlässig erkannt werden können. Dieser Sachverhalt                                              Programmierung maschineller Plausibilisierungsmethoden
hört sich zunächst trivial an – er ist es aber nicht. Eine noch                                    aufwändig sind. Der eingeschlagene Weg der Standardisie-
relativ leicht zu realisierende Möglichkeit zur Erkennung                                          rung über wieder verwendbare DV-Module hat inzwischen
von fehlerhaften Daten ist das Finden von so genannten                                             zu Synergieeffekten bei der DV-technischen Umsetzung
Ausreißern, das heißt von Werten, die sich erheblich von                                           geführt. Vorliegende Erfahrungen bei der Erstellung von
den übrigen unterscheiden. Es erfordert eine geeignete                                             etwa 50 DV-Modulen für selektive PL- und Makro-Editier-
Metrik zur Messung der Verschiedenartigkeit eines Datums.                                          methoden zeigen auch, dass diese Aufbauarbeiten wegen
Einen klassischen Weg stellt der Vergleich eines Rohdatums                                         ihres Aufwands – trotz der Verwendung einer statistischen
zu den übrigen mit Hilfe der Mahalanobis-Distanz dar, die                                          Standardsoftware – eine nachhaltige Unterstützung erfor-
sowohl die Lage als auch Streuung eines Merkmals berück-                                           dern und erst mittelfristig zu vorzeigbaren Erfolgen führen
sichtigt.17) Ein Nachteil dieses Vorgehens ist die Tatsache,                                       werden.
dass nicht jeder Ausreißer unbedingt ein fehlerhafter Wert
sein muss. Ein zweiter Ansatz ist daher die maschinelle                                            Neben den methodischen und DV-technischen Entwick-
Bestimmung von fehlerhaften Angaben mit Hilfe fachlicher                                           lungsarbeiten stellen Ex-post-Analysen der Korrekturen im
Plausibilitätsprüfungen. Sie decken Kombinationen von                                              Rahmen der PL-Optimierung eine wesentliche Maßnahme
fehlerhaften Angaben auf, die es zum Beispiel aufgrund                                             zur kontinuierlichen Verbesserung genutzter Erhebungs-
bestehender Rechtsgrundlagen nicht geben darf, wie zum                                             instrumente und bestehender Fehlererkennungs- und
Beispiel ein 10 Jahre altes Mädchen, das schon verheiratet                                         -beseitigungsmethoden dar („Lernende Organisation“ im
ist. Es stellt sich nun die Frage, ob das Alter (10 Jahre), der                                    Bereich der Fehlerbeseitigung).20) Nach der Einführung des

17) Siehe Béguin, C./Hulliger, B., a. a. O. (Fußnote 10), S. 11 ff.
18) Siehe De Waal, T./Quere, R.: “A Fast and Simple Algorithm for Automatic Data Editing of Mixed Data”, Journal of Official Statistics, Vol. 19, Nr. 4, 2003, S. 383 ff.
19) Siehe Raghunathan, T. E./Lepkowski, J. M./Van Hoewyk, J.: “A multivariate technique for multiply imputing missing values using a sequence of regression modells” in Survey Methodology,
    Vol. 29, Nr. 1, 2001, S. 85 ff.; Bankier, M./Lachance, M./Poirier, P.: “2001 Canadian Census Minimum Change Donor Imputation Methodology”, UNECE Work Session on Statistical Data
    Editing, WP 17, http://www.unece.org/stats/documents/2000.10.sde.htm.
20) Siehe Paulk, M. C.: “The capability maturity model: guidelines for improving the software process”, Boston 1995; Fortini, M./Scanu, M./Signore, M.: “Use of Indicators from data editing
    for monitoring the quality of the survey process: the Italian information system for survey documentation (SIDI)”, Statistical Journal of the United Nations ECE, 17 (2000).

Statistisches Bundesamt • Wirtschaft und Statistik 4/2005                                                                                                                             301
WEITERENTWICKLUNG

PL-Fachkonzepts und dem Abschluss der Aufbauarbeiten
werden die genannten Tätigkeiten zu den Hauptaufgaben
im Bereich der Fehlerbeseitigung zählen.

Anhaltende Forderungen nach einer Entlastung der Aus-
kunftgebenden und nach einem effizienteren Ressourcen-
einsatz werden zu einer steigenden Nutzung verfügbarer
Daten über wirtschaftliche und gesellschaftliche Zusam-
menhänge durch die amtliche Statistik führen und die Erhe-
bung statistikspezifischer Merkmale in den kommenden
Jahren mehr und mehr verdrängen. Statt der Beseitigung
von Fehlern in erhobenen Daten wird das Schließen von
Lücken in sekundärstatistisch genutzten Datenbeständen
durch geeignete Imputations- und Schätzverfahren ver-
mehrt den Schwerpunkt der zukünftigen Plausibilisierung
bilden.

302                                                          Statistisches Bundesamt • Wirtschaft und Statistik 4/2005
Auszug aus Wirtschaft und Statistik

© Statistisches Bundesamt, Wiesbaden 2005
Für nichtgewerbliche Zwecke sind Vervielfältigung und unentgeltliche Verbreitung, auch auszugsweise, mit Quellenangabe gestattet. Die
Verbreitung, auch auszugsweise, über elektronische Systeme/Datenträger bedarf der vorherigen Zustimmung. Alle übrigen Rechte bleiben
vorbehalten.

Herausgeber:           Statistisches Bundesamt, Wiesbaden

Schriftleitung:        Johann Hahlen
                       Präsident des Statistischen Bundesamtes
                       Verantwortlich für den Inhalt:
                       Brigitte Reimann,
                       65180 Wiesbaden
                       • Telefon: +49 (0) 6 11/75 20 86
                       • E-Mail: wirtschaft-und-statistik@destatis.de

Vertriebspartner:      SFG Servicecenter Fachverlage
                       Part of the Elsevier Group
                       Postfach 43 43
                       72774 Reutlingen
                       Telefon: +49 (0) 70 71/93 53 50
                       Telefax: +49 (0) 70 71/93 53 35
                       E-Mail: destatis@s-f-g.com

Erscheinungsfolge: monatlich

 i     Allgemeine Informationen über das Statistische Bundesamt und sein Datenangebot erhalten Sie:
       • im Internet: www.destatis.de
      oder bei unserem Informationsservice
      65180 Wiesbaden

       • Telefon: +49 (0) 6 11/75 24 05
       • Telefax: +49 (0) 6 11/75 33 30
       • E-Mail: info@destatis.de
Sie können auch lesen