Modernisierung der Fehlerbeseitigung - EFGS 2021
←
→
Transkription von Seiteninhalten
Wenn Ihr Browser die Seite nicht korrekt rendert, bitte, lesen Sie den Inhalt der Seite unten
WEITERENTWICKLUNG Dipl.-Kaufmann Elmar Wein Modernisierung der Fehlerbeseitigung Steigende Anforderungen der Nutzer an die Aktualität und Fehlerbeseitigung darstellen. Nach der Vorstellung grund- Genauigkeit statistischer Ergebnisse erfordern neue Metho- sätzlicher Überlegungen des PL-Fachkonzepts folgt die den und Verfahren bei der Statistikerstellung. Dazu zählt Darstellung der Neuerungen bei der Planung und Durchfüh- insbesondere die Fehlerbeseitigung bzw. Plausibilisierung rung einer Fehlerbeseitigung. Ein Ausblick auf die weiteren (PL). Sie verbessert die Genauigkeit statistischer Ergeb- Aufbauarbeiten und zukünftige Entwicklungen im Bereich nisse, andererseits erfordert sie Zeit und verschlechtert der Fehlerbeseitigung schließen den Beitrag ab. dadurch deren Aktualität. Untersuchungen haben ergeben, dass die Fehlerbeseitigung bis zu 40% der Ressourcen für eine Statistik verbrauchen kann.1) Fehlerbeseitigung im Rahmen Eine Projektgruppe aus Vertretern der Statistischen Ämter der Statistikerstellung des Bundes und der Länder2) hat ein umfassendes Fach- Die statistischen Ämter haben die Erstellung von Statistiken konzept zur Modernisierung der Fehlerbeseitigung, das in den letzten Jahren erheblich modernisiert und damit die „PL-Fachkonzept“, erstellt. Mit ihm sollen die Aktualität Rahmenbedingungen der Plausibilisierung entscheidend statistischer Ergebnisse verbessert und die Effizienz der verändert. Im Folgenden sollen die wichtigsten Aktivitäten Fehlerbeseitigung gesteigert werden. zur Erstellung einer Statistik beschrieben, die Fehlerbeseiti- gung einzelnen Prozessen zugeordnet und relevante Moder- Das Statistische Bundesamt hat die Vorgaben des PL-Fach- nisierungsaktivitäten vorgestellt werden. konzepts für die Plausibilisierung von Daten in neue Daten- verarbeitungsprogramme (DV-Programme) implementiert. Damit Nutzern zuverlässige statistische Ergebnisse zur Weiterhin wurden mathematisch-statistische Plausibili- Verfügung stehen, müssen zuvor eine Reihe von Prozessen sierungsmethoden im Jahr 2004 erfolgreich getestet. Das durchgeführt werden. Einen geeigneten Ansatz zur Beschrei- PL-Fachkonzept wird in diesem Jahr in allen Statistischen bung der Statistikerstellung stellt die Wertschöpfungspro- Landesämtern eingeführt. zesskette dar (siehe Schaubild 1), weil damit die Betrach- tungen auf notwendige Aktivitäten reduziert werden.3) Der folgende Aufsatz behandelt zuerst die Erstellung von Bundesstatistiken einschließlich wesentlicher Ver- Die Statistikerstellung beginnt mit der Anmeldung eines änderungen, die wichtige Rahmenbedingungen für eine Datenbedarfs. Am Ende dieses Prozesses liegen konkrete 1) Siehe Federal Committee on Statistical Methodology: “Data Editing in Federal Statistical Agencies”, Statistical Policy Working Paper No. 18, Washington D.C. 1990. 2) An der Konzeptentwicklung beteiligten sich neben dem Statistischen Bundesamt die Statistischen Ämter der Länder Baden-Württemberg, Bayern, Nordrhein-Westfalen, Sachsen und Thüringen. 3) Siehe Schulte-Zurhausen, M.: „Organisation“, München 1995. Statistisches Bundesamt • Wirtschaft und Statistik 4/2005 293
WEITERENTWICKLUNG Schaubild 1 Erforderliche Prozesse zur Erstellung und Verbesserung einer Statistik (1) (2) (3) (4) (5) (6) (7) Ermittlung Vor- Daten- Auf- Aus- Ver- Statistik- des bereitung gewinnung bereitung wertung breitung Optimie- Daten- rung bedarfs PL-Planung PL-Durch- PL-Durch- PL-Optimie- führung führung rung Vorstellungen hinsichtlich der benötigten Daten und ihrer fältige Verbindungen: Die PL-Planung setzt die Festlegung Qualität vor, die wesentliche Vorgaben für die Fehlerbe- der Erhebungsinhalte voraus. Die PL-Durchführung liefert seitigung darstellen.4) Durch den Pfeil zum Prozess „Sta- wichtige Informationen für die Interpretation statistischer tistik-Optimierung” soll, wie auch bei den nachfolgenden Ergebnisse. Die PL-Optimierung initiiert Veränderungen bei Prozessen, angedeutet werden, dass geeignete Prozess- vorliegenden Fragebogen. dokumentationen bei Bedarf für eine Optimierung bereit- zustellen sind. Immer schnellere Entwicklungen und eine sich in verschie- dene Interessengruppen ausdifferenzierende Gesellschaft Auf der Grundlage des konkretisierten Datenbedarfs werden führen zu steigenden und heterogenen Anforderungen die Erhebungsunterlagen entwickelt, das Auswertungspro- der Nutzer an amtliche Statistiken. Bei vielen Statistiken gramm erstellt und die Fehlerbeseitigung geplant (PL-Pla- werden neben den früher üblichen Standardergebnissen nung). in Fachserien zunehmend auch vorläufige Ergebnisse ver- öffentlicht und anonymisierte Mikrodaten bereitgestellt, die Um möglichst plausible Daten zu erhalten, setzen die sta- Nutzer mit verfügbarer statistischer Standardsoftware nach tistischen Ämter neben gedruckten Fragebogen zunehmend spezifischen Gesichtspunkten analysieren. Diese Entwick- elektronische Erhebungsinstrumente ein, die Angaben der lung stellt sehr große Anforderungen an die Plausibilität Befragten „vor Ort“ prüfen, damit diese sofort korrigiert statistischer Daten. Durch die Bereitstellung verschiedener werden können. Im Verlauf der Aufbereitung werden Fehler Ergebnistypen ist die Statistikerstellung im Bereich der Auf- korrigiert, die nicht im Zuge der Datengewinnung beseitigt bereitung komplexer geworden. werden konnten (PL-Durchführung). Sich verändernde Nutzerwünsche und die Einführung neuer In den letzten Jahren konzentrierten sich viele Modernisie- Methoden und DV-Programme erfordern eine kontinuier- rungsaktivitäten der amtlichen Statistik auf den Prozess liche Weiterentwicklung der Aufbereitung und Veröffentli- der Datengewinnung, um plausiblere Angaben zu erhalten, chung von Statistiken. Typische Aktivitäten zielen auf eine die schneller veröffentlicht werden können. Neben der Verbesserung eingesetzter Erhebungsinstrumente und die zunehmenden Bereitstellung von Internetfragebogen5) hat Weiterentwicklung der Fehlerbeseitigung, was durch die die deutsche amtliche Statistik im März 2005 das ausge- Pfeile zu den entsprechenden vorangegangenen Prozessen zeichnete System eSTATISTIK.core6) in Betrieb genommen, angedeutet wird. Bei der PL-Optimierung werden zum Bei- mit dem Unternehmen erstmals die Möglichkeit haben, spiel die Korrekturen analysiert, um die Fehlerursachen zu mit einer besonderen Softwarekomponente statistische erkennen und Maßnahmen zur Vermeidung vorzuschlagen. Rohdaten aus dem betrieblichen Rechnungswesen auto- matisch zu gewinnen und diese über das Internet an eine Zwischen den Prozessen der Fehlerbeseitigung und den zentrale Statistikannahmestelle zu übermitteln.7) Weiterhin übrigen Prozessen der Statistikerstellung bestehen viel- standardisiert die deutsche amtliche Statistik seit 2003 ihre 4) Siehe Blanc, M./Radermacher, W./Körner, T.: „Qualität und Nutzer“ in WiSta 10/2001, S. 799 ff. 5) Informationen über vorliegende Internetfragebogen enthält die Seite http://www.destatis.de/buerokratieabbau/datenerhebung.htm. 6) eSTATISTIK.core hat im März 2005 den ersten Preis der internationalen Beratungsgesellschaft BearingPoint und Cisco Systems im Politikfeld „Wirtschaft und Arbeit“ des 5. eGovernment- Wettbewerbs gewonnen (siehe auch WiSta 3/2005, S. 173). 7) Siehe hierzu http://www.statistik-portal.de/Statistik-Portal/datenOnline.asp. 294 Statistisches Bundesamt • Wirtschaft und Statistik 4/2005
WEITERENTWICKLUNG Papierfragebogen durch die Einführung eines einheitlichen müssen. Dies bedeutet, dass nicht alle Fehler bei der Designs. Datengewinnung erkannt und beseitigt werden können. Im Zuge der Aufbereitung sollen daher mit Hilfe selekti- Bedingt durch die Modernisierung der Statistikerstellung ver Plausibilisierungsmethoden gravierende Fehler mit ergeben sich mehr Möglichkeiten zur Gewinnung plausib- erheblichem Einfluss auf statistische Ergebnisse erkannt lerer Angaben. Sie stellen wichtige Rahmenbedingungen und vorrangig manuell korrigiert werden. Marginale für eine moderne Fehlerbeseitigung dar, induzieren aber Fehler sollen stärker als bisher durch maschinelle Feh- gleichzeitig einen größeren Planungsbedarf und Empfehlun- lerbestimmungsmethoden entdeckt und mit Hilfe von gen zum Einsatz moderner Aufbereitungsmethoden, die mit Imputationsmethoden DV-gestützt korrigiert werden.9) dem PL-Fachkonzept erfüllt werden. Diese Maßnahmen steigern die Effizienz einer Fehlerbe- seitigung erheblich. Grundsätzliche Überlegungen – Standardisierung der PL-Methoden des PL-Fachkonzepts Den PL-Aktivitäten wurden wieder verwendbare Plausi- bilisierungsmethoden zugeordnet. Dazu gehören zum Wie eingangs erwähnt, stellen die Verbesserung der Aktu- Beispiel Streuungsdiagramme, mit denen Ausreißer alität und die Steigerung der Effizienz wesentliche Ziele erkannt werden können. Ein Teil der für die Fehlerbe- des PL-Fachkonzepts dar. Unterschiedliche Abläufe der seitigung benötigten PL-Methoden wurde inzwischen in Fehlerbeseitigungen bei den Statistiken haben zu einem Softwaremodule umgesetzt und ist für eine Vielzahl von umfassenden Ansatz geführt, der folgende grundsätzliche Statistiken einsetzbar. Durch die Wiederverwendung Überlegungen enthält: vorhandener DV-Module rechnet sich die aufwändige DV-technische Umsetzung leistungsfähigerer Plausibi- – Fehlervermeidung durch vermehrte Prüfungen bei lisierungsmethoden. Dieser Standardisierungsansatz der Entstehung von Daten entspricht dem „Plattform-Prinzip“ der Automobilindus- Angaben sollen schon bei ihrer Entstehung stärker als trie, bei dem verschiedene Pkw-Typen auf identischen bisher auf ihre Plausibilität geprüft werden, um aufwän- Bodengruppen erstellt werden. Er wird auch von ande- dige Rückfragen zu reduzieren, die Auskunftgebende ren nationalen statistischen Ämtern präferiert10) und belasten und zusätzliche Kosten in den statistischen bietet die notwendige Flexibilität, um die sehr heteroge- Ämtern verursachen. Dieses Ziel soll durch die Nutzung nen Anforderungen der einzelnen Bundesstatistiken zu geprüfter Angaben aus den Berichtswesen der Unter- erfüllen. nehmen erreicht werden. Eine Alternative stellt die zunehmende Bereitstellung von Internetfragebogen mit – Einführung eines Prozessmanagements integrierten üblichen Plausibilitätsprüfungen dar, wie sie Der zunehmende Methodenmix im Bereich der Fehlerbe- zum Beispiel auch in Homebanking-Anwendungen oder seitigung erfordert eine bessere Planung und Steuerung. Internet-Shops üblich sind. Das PL-Fachkonzept enthält Eine Fehlerbeseitigung besteht aus mehreren Arbeits- Empfehlungen zur Integration von Plausibilitätsprüfun- paketen, in denen zum Beispiel Angaben aus Papier- gen in den Prozess der Datenentstehung. fragebogen zuerst in weiterverarbeitungsfähige Daten umgewandelt werden müssen, um anschließend mit – Intensivere Ausrichtung einer Fehlerbeseitigung auf Hilfe von Plausibilitätsprüfungen unvollständige und feh- statistische Ergebnisse lerhafte Angaben zu erkennen und zu beseitigen. Diese Die Frage „Was wird wann mit welchem Plausibilitätsgrad vielfältigen Aktivitäten sind aufeinander abzustimmen. veröffentlicht?“ soll stärker als bisher die Planung und Sie wurden unter Nutzung moderner DV-technischer Mög- Durchführung einer Fehlerbeseitigung bestimmen.8) Sie lichkeiten und Plausibilisierungsmethoden in idealtypi- trägt den steigenden Nutzeranforderungen und den knap- sche PL-Prozesse restrukturiert (Prozessmanagement). peren Ressourcen der statistischen Ämter gleichermaßen Für die Feinplanung von PL-Prozessen stehen zukünftig Rechnung. Mit Hilfe leistungsfähigerer PL-Methoden moderne Methoden der Arbeits-, Zeit- und Personalpla- können Anforderungen an die Aktualität und Genauig- nung zur Verfügung, die auch für die Leitung einer laufen- keit statistischer Daten viel besser als bisher umgesetzt den Fehlerbeseitigung genutzt werden sollen. werden. – Mehrfache Wiederverwendung vorliegender Meta- – Verstärkter Einsatz leistungsfähigerer Methoden für daten die Fehlerbeseitigung Statistiken sind ohne Beschreibungen der entsprechen- Die statistischen Ämter werden in den nächsten Jah- den Erhebungsmerkmale nicht zu verstehen. Zur Planung ren einen Mix an Erhebungsinstrumenten einsetzen einer Fehlerbeseitigung gehört daher auch die Beschrei- 8) Siehe Kopsch, G./Chlumsky, J. u. a.: „Von der Input- zur Outputsteuerung“, Statistisches Bundesamt, interne Unterlage, Wiesbaden 1998. 9) Siehe Latouche, M./Bureau, M./Croal, J.: “Development of a Cost-Effective Edit and Follow Up Process: The Canadian Survey of Employment Experience”, Statistical Data Editing, Methods and Techniques, Volume 2, Genf 1997; Hedlin, D.: “Score Functions to Reduce Business Survey Editing at the ONS”, http://www.unece.org/stats/documents/2002/05/sde/14.e.pdf; Rubin, D. B.: “Basic Ideas of Multiple Imputation for Nonresponse”, Survey Methodology, Vol. 12, No. 1; Fellegi, I. P./Holt, D.: “A Systematic Approach to Automatic Edit and Imputation”, Journal of the American Statistical Association, Vol. 71, Nr. 353, S. 17 ff. 10) Siehe Béguin, C./Hulliger, B. (Bundesamt für Statistik, Schweiz): “Robust Multivariate Outlier Detection and Imputation with Incomplete Survey Data”, EUREDIT Deliverable D4/5.2.1/2 Part C, Neuchâtel 2003, S. 14. Statistisches Bundesamt • Wirtschaft und Statistik 4/2005 295
WEITERENTWICKLUNG Schaubild 2 Methodensammlung im PL-Intranetangebot bung von Erhebungsmerkmalen und Plausibilitätsprü- tung aktueller methodischer Entwicklungen. Weiterhin ist fungen (Metadaten). Seit Juli 2004 ist eine Software von jeder neuen PL-spezifischen Software ein Zugriff auf das im Einsatz, mit der Erhebungsmerkmale und fachliche PL-Intranetangebot möglich, um weitere Informationen zu PL-Prüfungen beschrieben werden können. Vorliegende erhalten. Das Schaubild 2 zeigt die Startseite der Sammlung Beschreibungen können direkt für die Erstellung einer mit den wieder verwendbaren PL-Methoden. Statistik und für andere Fachstatistiken verwendet wer- den. Fachstatistiker und IT-Fachpersonal werden dadurch erheblich entlastet, und der Vorbereitungsaufwand für Neuerungen bei der Planung eine Statistik reduziert sich. Die Software wird im nach- einer Fehlerbeseitigung11) folgenden Kapitel ausführlicher beschrieben. Die Planung einer Fehlerbeseitigung wird zukünftig mit Hilfe von Projektmanagementmethoden12) erfolgen und ist durch Die grundsätzlichen Überlegungen des PL-Fachkonzepts den im Schaubild 3 dargestellten Ablauf gekennzeichnet. wurden in neue Software und Materialien implementiert, die typische Aktivitäten der Fachstatistiker unterstützen. Über Die Planung sieht ein zweistufiges Vorgehen vor, das im ers- die Nutzung der Software wird das PL-Fachkonzept quasi ten Schritt aus einer Umsetzung der Nutzeranforderungen „automatisch“ umgesetzt. Die Software ist für geübte PC- unter Beachtung interner Rahmenbedingungen in einen PL- Nutzer weitgehend selbsterklärend, sodass der Schulungs- Ablauf (Grobplanung) besteht, der in einem zweiten Schritt, aufwand begrenzt werden kann. Neben der Software sind das heißt im Rahmen einer Feinplanung, ausgestaltet wird. die Überlegungen des PL-Fachkonzepts in einem PL-Intranet- angebot dokumentiert. Es steht allen statistischen Ämtern Zu Beginn der PL-Planung werden die Nutzeranforderungen zur Verfügung und ermöglicht eine kostengünstige Verbrei- an statistische Ergebnisse erfasst. Das PL-Fachkonzept 11) Im Einzelnen bearbeiteten folgende Mitarbeiterinnen und Mitarbeiter des Statistischen Bundesamtes die in diesem Kapitel dargestellten Neuerungen: Der elektronische Leitfaden wurde von Volker Stutzer und Tatjana Theis erstellt, Corina Teichmann leitet die Entwicklung des PL-Editors, und die PL-Prozessmanager sowie das PL-Intranetangebot (siehe das Kapitel „Grund- sätzliche Überlegungen des PL-Fachkonzepts“) wurden von Tatjana Theis entwickelt. 12) Siehe Klose, B.: „Projektabwicklung“, Wien 1996; Winkelhofer, G. A.: „Methoden für Management und Projekte“, Berlin 1997; Boy, J./Dudek, C./Kuschel, S.: „Projektmanagement“, Offen- bach 1994. 296 Statistisches Bundesamt • Wirtschaft und Statistik 4/2005
WEITERENTWICKLUNG Schaubild 3 Neben den Nutzeranforderungen sind bei der Planung einer Fehlerbeseitigung organisatorische und DV-technische Rah- Ablauf der Planung einer Fehlerbeseitigung menbedingungen sowie spezifische Besonderheiten einer Statistik zu berücksichtigen. Dazu zählen das vorhandene D Abschließende Prüfungen � �� �� � Personal sowie verfügbare Hard- und Software. Spezifische �� O Beschreibung von Risiken Besonderheiten einer Statistik, wie zum Beispiel die Über- K U prüfbarkeit der Erhebungsinhalte, Teilnahmehäufigkeiten Kosten und Investitionen M der Auskunftgebenden und zu prüfende Sonderkonstella- � �� E Personal- und Sachmittel Fein- tionen, beeinflussen erheblich den Umfang einer Fehler- N planung beseitigung. T Arbeits-, Zeit und Meilensteine A T Spezifizierung von Plausibilitätsprüfungen Für die Erfassung der Nutzeranforderungen und Rahmenbe- � I dingungen einer Fehlerbeseitigung steht den Fachstatisti- O Grobplanung kern zukünftig ein elektronischer Leitfaden zur Verfügung. N Sammlung und Bewertung relevanter Informationen Mit Hilfe von Fragen sollen alle wesentlichen Aspekte zusammengetragen, ihre Einflüsse auf eine Fehlerbesei- tigung bewertet und Schlussfolgerungen im Hinblick auf eine zu planende Fehlerbeseitigung gezogen werden. Das unterstellt, dass die statistischen Ämter auch zukünftig ent- Schaubild 4 zeigt einen Ausschnitt aus dem Leitfaden. sprechend der bestehenden Praxis statistische Ergebnisse als „Eckzahlen“ (Tendenzen), „Vorläufige Ergebnisse“, Mit Hilfe des Leitfadens können Fachstatistiker ihre Pla- „Standardergebnisse“ und „Anonymisierte Mikrodaten“ nungsannahmen und Einschätzungen systematisiert darle- verbreiten. Die Ergebnistypen unterscheiden sich hinsicht- gen, untereinander austauschen und dadurch objektivieren. lich der Aktualität und Genauigkeit: Tendenzen stellen zum Beispiel hochaktuelle statistische Ergebnisse (mit Es wird erwartet, dass Fachstatistiker und die für die Auf- Genauigkeitseinbußen) dar, die lediglich erste Entwicklun- bereitung zuständigen IT-Fachkräfte nach der Sammlung gen aufzeigen sollen. Im Vergleich dazu handelt es sich und Bewertung von relevanten Informationen Vorstellungen bei den „Anonymisierten Mikrodaten“ um hoch plausible über den Ablauf einer Fehlerbeseitigung entwickeln. Unter- Einzeldaten mit einem schlechteren Aktualitätsgrad. Das stützend stehen idealtypische Abläufe einer Fehlerbeseiti- PL-Fachkonzept sieht vor, dass die Nutzer ihre Anforde- gung (PL-Abläufe) zur Verfügung, die beste Praktiken dar- rungen an Statistiken über die statistischen Ergebnistypen stellen und an spezielle Anforderungen der Fachstatistiken formulieren. angepasst werden können. Schaubild 4 Erfassung des Datenbedarfs mit Hilfe des Leitfadens für die Informationssammlung und -bewertung Statistisches Bundesamt • Wirtschaft und Statistik 4/2005 297
WEITERENTWICKLUNG Mit der Auswahl eines PL-Ablaufs im Zuge der PL-Grob- unter werden alle vorliegenden Beschreibungen einer planung liegt der Rahmen für die Feinplanung vor. Einen bearbeiteten Erhebung in einer Baumstruktur übersichtlich wesentlichen Bestandteil stellt die Beschreibung der Erhe- angeordnet. In der Mitte der Oberfläche befindet sich der bungsmerkmale und Formulierung von Plausibilitätsprü- Editierbereich, in dem zum Beispiel die Merkmale und PL- fungen dar. Inzwischen verfügen alle statistischen Ämter Prüfungen einer Erhebung formuliert werden. Die kontext- mit dem PL-Editor über eine neue, moderne Software, die orientierte Onlinehilfe rechts enthält Empfehlungen zum diese Schritte unterstützt und die Beschreibungen in einer Formulieren und Anmerkungen zum Ausfüllen einzelner zentralen Datenbank ablegt, sodass sie auch für andere Felder im Editierbereich. Der untere Teil der Oberfläche Statistiken verfügbar sind. Ein wesentliches Merkmal des informiert über syntaktische Prüfungen der vorliegenden PL-Editors ist, dass die Fachstatistiker Merkmale und zuge- Merkmalsbeschreibungen. hörige Plausibilitätsprüfungen entsprechend dem Prinzip der Objektorientierung in Themenbereichen zusammenfas- Neben der üblichen Syntaxprüfung verfügt der PL-Editor sen können. Ein Themenbereich entspricht dem Abschnitt über eine leistungsfähige Analysefunktion, um Inkonsisten- eines Fragebogens, der zusammenhängende Merkmale zen in vorliegenden Formulierungen zu erkennen, wie zum – beispielsweise zur Wohnsituation – enthält. Zusätzlich Beispiel syntaktisch korrekte Formulierungen, die aber für enthält er alle PL-Prüfungen, um fehlerhafte Angaben bei eine Fehlerbeseitigung nicht weiter verwendet werden. den jeweiligen Merkmalen zu erkennen. Die modulare Zusammenstellung der Erhebungsinhalte und ihre Kombi- Die mit dem PL-Editor formulierten Plausibilitätsprüfungen nation mit den entsprechenden PL-Prüfungen erleichtert werden in ausführbare Codes umgesetzt und können direkt erheblich deren Wiederverwendung. in Internetfragebogen und in amtsinterne Software für die Fehlerbeseitigung eingebunden werden. Dadurch reduziert Die Benutzeroberfläche des PL-Editors enthält links oben sich der Vorbereitungsaufwand für Statistiken. Neben der eine Sicht auf die Datenbank mit den Beschreibungen oben genannten Wiederverwendung der Beschreibungen anderer Erhebungen, die Fachstatistiker in ihre eigenen bei ähnlichen Statistiken werden diese auch für die Tabel- Erhebungen einbinden können (siehe Schaubild 5). Dar- lierung verwendet. Weiterhin generiert der PL-Editor aus den Schaubild 5 Benutzeroberfläche des PL-Editors Datenbank mit Erhebungen Formulierung von Merkmalen und PL-Prüfungen HTML Onlinehilfe mit nutzbaren Code-Modulen und methodischen Empfehlungen Spezifizierte Metadaten einer Erhebung Syntaxprüfungen 298 Statistisches Bundesamt • Wirtschaft und Statistik 4/2005
WEITERENTWICKLUNG Schaubild 6 Weiterverwendung der Metadaten des PL-Editors Internetfragebogen eSTATISTIK.core Erhebungsbeschreibung Merkmale Dialog PL-Editor Fehlerbeseitigung PL-Prüfungen ... Aufbereitung Dokumentationen Metadaten verschiedene Dokumentationen, die mit gängi- (Zeitbedarfsschätzungen), Personal einer Fehlerbeseitigung ger Standardsoftware angepasst werden können. Zukünf- zugeordnet (Personaleinsatzplanung) und eine Terminie- tige Versionen des PL-Editors sollen über einen Dokumen- rung (Zeitplanung) vorgenommen werden. Die genannten tationseditor und eine Umgebung für den Test spezifizierter Planungsschritte werden unter dem Begriff „PL-Prozess- Plausibilitätsprüfungen verfügen. planung“ zusammengefasst und bestimmen wesentlich die Feinplanung eines gewählten PL-Ablaufs. Die Personal- Durch die vielfache Nutzung der vorliegenden Metadaten einsatz- und Zeitplanung greift auf übliche Methoden der können erhebliche Synergieeffekte erzielt werden: Ändern Netzplantechnik und Personalbedarfsermittlung zurück, sich Merkmalsbeschreibungen, werden automatisch aktu- die an die spezifischen Anforderungen einer Fehlerbeseiti- alisierte DV-Module für Internetfragebogen und für amts- gung angepasst wurden.13) Die innovativen Überlegungen interne Software für die Fehlerbeseitigung bereitgestellt. wurden in Form der „PL-Prozessmanager“ realisiert (siehe Darüber hinaus werden auch die Metadaten für die Tabellie- Schaubild 7 auf S. 300). rung und vorhandene Dokumentationen aktualisiert. Der PL- Editor ist eine modular aufgebaute Software, die erweitert Die Planungen basieren auf Annahmen über die Anzahl werden kann, um verschiedene IT-Plattformen für die Fehler- an fehlerhaften Datensätzen, den durchschnittlichen Zeit- beseitigung zu unterstützen. Momentan liegt ein Generator bedarf für Korrekturen, das verfügbare Personal und zu vor, der einen ausführbaren JAVA-Code erstellt. geschätzten Startterminen. Neben den geplanten Daten können die Fachstatistiker auch Ist-Daten in die PL-Prozess- Der PL-Editor erfährt inzwischen einen regen Zuspruch in manager eingeben und über Soll-Ist-Vergleiche frühzeitig im allen statistischen Ämtern. Es ist geplant, ihn in den kom- Rahmen einer Fehlerbeseitigung feststellen, wie sich unter- menden Jahren als Standardwerkzeug bei allen Statistiken schiedliche Entwicklungen bei den Ist-Daten auf die Bereit- einzusetzen, sodass letztlich alle Merkmalsbeschreibungen stellungstermine auswirken. Dies erleichtert wesentlich die und PL-Prüfungen in einer Datenbank vorliegen werden, Leitung einer Fehlerbeseitigung. auf die alle statistischen Ämter Zugriff haben werden. Der PL-Editor wird mit seiner angeschlossenen Datenbank zu einem wichtigen „Zulieferer“ für ein Metadatensystem der amtlichen Statistik. Leistungsfähigere PL-Methoden für die Fehlerbeseitigung im Überblick Mit den beschriebenen PL-Prüfungen ist die wesentliche Voraussetzung für die weitere Feinplanung erfüllt. Es kön- Eine gute PL-Planung stellt eine wesentliche Voraussetzung nen nun der Zeitbedarf für eine Fehlerbeseitigung geschätzt für den reibungslosen Ablauf einer Fehlerbeseitigung dar. 13) Siehe Wittlage, H.: „Personalbedarfsermittlung“, München 1995; Röthig, P.: „Handbuch für die Personalbedarfsermittlung in der Bundesverwaltung“, Bundesministerium des Innern (Hrsg.), Bonn 1995; Aggteleky, B./Bajna, N.: „Projektplanung: ein Handbuch für Führungskräfte“, Wien 1992. Statistisches Bundesamt • Wirtschaft und Statistik 4/2005 299
WEITERENTWICKLUNG Schaubild 7 Personaleinsatzplanung mit dem PL-Prozessmanager Die Verbesserung der Aktualität statistischer Ergebnisse täten unter den Schichten einer Erhebungsgesamtheit und und die Steigerung der Effizienz einer Fehlerbeseitigung selektive PL-Methoden legen fest, welche Angaben von erfordern aber zusätzliche Änderungen bei der PL-Durchfüh- Auskunftgebenden innerhalb einer Schicht vorrangig zu kor- rung. Neben der Nutzung vorgeprüfter Angaben bildet der rigieren sind.15) Beide Methoden verbessern entweder die Einsatz leistungsfähigerer Plausibilisierungsmethoden den Aktualität oder die Plausibilität hoch aktueller Ergebnisse. Schwerpunkt der Änderungen. Das Statistische Bundesamt hat im Jahr 2004 eine Kombi- Bis zu 80% aller Korrekturen haben im Einzelfall keinen nation aus einer selektiven PL- und einer Makro-Editierme- signifikanten Einfluss auf die statistischen Ergebnisse.14) thode bei der Kostenstrukturerhebung im Verarbeitenden Dies bedeutet, dass zum Beispiel für hochaktuelle Ergeb- Gewerbe erfolgreich getestet.16) Das Schaubild 8 zeigt nisse, mit denen lediglich erste allgemeine Entwicklungen anhand erster Testergebnisse die zielgerichtete Beseitigung aufgezeigt werden sollen, nur die gravierenden Fehler mit der Plausibilitätsabweichungen bei allen Merkmalen durch erheblichem Einfluss beseitigt werden müssen. Mit Hilfe die Nutzung einer selektiven manuellen PL-Methode. Eine selektiver PL- und Makro-Editiermethoden können diese Kennzahl von 100% bei der PL-Abweichung bedeutet im Fehler zukünftig besser erkannt werden. Diese vergleichen Schaubild 8, dass keinerlei Korrekturen vorliegen. zum Beispiel geschätzte plausible Daten mit vorliegenden Rohdaten und interpretieren Differenzen als Hinweise auf Anhand des Schaubildes 8 wird deutlich, dass bereits bei gravierende Fehler. Makro-Editiermethoden setzen Priori- 50% der geprüften und im Einzelfall korrigierten Datensätze 14) Siehe Lindell, K. (Statistisches Amt Schweden, Statistics Sweden): “Impact of Editing on the Salary Statistics for Employees in County Council” in “Statistical Data Editing”, Vol. 2, UNECE (Hrsg.), Genf 1997. 15) Siehe Hidiroglou, M. A./Berthelot, J.-M.: “Statistical Editing and Imputation for Periodic Business Survey”, Survey Methodology, Vol. 12, No. 1; Granquist, L.: “Macro-Editing – The Aggre- gate Method”, Statistical Data Editing, Methods and Techniques, Volume No. 1, Methods and Techniques, New York 1994, S. 41 ff. 16) Das Statistische Bundesamt führte die methodischen Vorarbeiten im Jahr 2003 durch; siehe hierzu: „Projektbericht zur Entwicklung einer selektiven PL-Methode für die KSE Verarbeitendes Gewerbe“, interne Unterlage, Wiesbaden 2003. 300 Statistisches Bundesamt • Wirtschaft und Statistik 4/2005
WEITERENTWICKLUNG Schaubild 8 Familienstand (hier: verheiratet) oder beide Merkmale falsch sind. Würde man zum Beispiel das Alter erhöhen, kann dies Reduzierung der PL-Abweichungen aufgrund der dazu führen, dass die betreffende Plausibilitätsprüfung Prioritätensetzung durch eine selektive PL-Methode PL-Ab- PL-Ab- passiert, aber eine andere zur Prüfung des Schulabschlus- weichung weichung ses ausgelöst wird. Anhand dieses einfachen Beispiels % % 100 100 wird die Komplexität einer maschinellen Fehlererkennung mit Hilfe fachlicher PL-Prüfungen deutlich. Das Statisti- 80 80 sche Bundesamt greift daher auf international anerkannte Methoden zurück, die fachliche Plausibilitätsprüfungen und 60 60 vorliegende Erfahrungen über die Vertrauenswürdigkeit von Angaben gleichermaßen berücksichtigen, eine minimale Anzahl an fehlerhaften Angaben bestimmen und fehlerhafte 40 40 Merkmale stets auf die gleiche Art und Weise erkennen.18) Angaben, die maschinell als fehlerhaft erkannt wurden, 20 20 werden anschließend auf der Grundlage mathematisch- statistischer Modelle durch Schätzungen von plausiblen 0 0 0 20 40 60 80 100% Werten ersetzt. Für diesen Schritt ist inzwischen eine Fülle Bearbeitete Datensätze von Software verfügbar, die Informationen über bestehende plausible Angaben nutzt und fehlerhafte Angaben nach konsistenten Regeln so ersetzt, dass bestehende Merk- fast 80% der Plausibilitätsabweichung beseitigt wurden. malsverteilungen in ihrem Verlauf nicht verzerrt werden Andererseits wurden bei den letzten 20% der geprüften („schonende Korrekturen“).19) Datensätze nur noch knapp 10% der ursprünglichen Plausi- bilitätsabweichung beseitigt. Ausblick Nach wie vor müssen alle erkennbaren Fehler beseitigt Die Einführung des PL-Fachkonzepts in allen statistischen werden, da die Nutzer zunehmend mit Hilfe bereitgestell- Ämtern im Verlauf des Jahres 2005 ist ein erster Schritt, um ter anonymisierter Mikrodaten ihre eigenen spezifischen das Konzept in den kommenden Jahren bei allen Bundes- Analysen durchführen, die hohe Anforderungen an die statistiken umzusetzen. Einen wesentlichen Beitrag werden Plausibilität bereitgestellter Daten stellen. Angesichts stei- hierzu die vorgestellten DV-Programme leisten müssen, die gender Aktualitätsanforderungen und zunehmend knapper in den nächsten Monaten weiter zu testen sind. Ressourcen der statistischen Ämter ist eine langwierige manuelle Fehlerbeseitigung marginaler Fehler nicht mehr Die mit dem PL-Fachkonzept verfolgte Standardisierung vertretbar. Das Statistische Bundesamt entwickelt daher funktioniert nur durch die Bereitstellung wieder verwend- zurzeit eine Software, mit deren Hilfe fehlerhafte Angaben barer Software, wobei methodische Weiterentwicklung und zuverlässig erkannt werden können. Dieser Sachverhalt Programmierung maschineller Plausibilisierungsmethoden hört sich zunächst trivial an – er ist es aber nicht. Eine noch aufwändig sind. Der eingeschlagene Weg der Standardisie- relativ leicht zu realisierende Möglichkeit zur Erkennung rung über wieder verwendbare DV-Module hat inzwischen von fehlerhaften Daten ist das Finden von so genannten zu Synergieeffekten bei der DV-technischen Umsetzung Ausreißern, das heißt von Werten, die sich erheblich von geführt. Vorliegende Erfahrungen bei der Erstellung von den übrigen unterscheiden. Es erfordert eine geeignete etwa 50 DV-Modulen für selektive PL- und Makro-Editier- Metrik zur Messung der Verschiedenartigkeit eines Datums. methoden zeigen auch, dass diese Aufbauarbeiten wegen Einen klassischen Weg stellt der Vergleich eines Rohdatums ihres Aufwands – trotz der Verwendung einer statistischen zu den übrigen mit Hilfe der Mahalanobis-Distanz dar, die Standardsoftware – eine nachhaltige Unterstützung erfor- sowohl die Lage als auch Streuung eines Merkmals berück- dern und erst mittelfristig zu vorzeigbaren Erfolgen führen sichtigt.17) Ein Nachteil dieses Vorgehens ist die Tatsache, werden. dass nicht jeder Ausreißer unbedingt ein fehlerhafter Wert sein muss. Ein zweiter Ansatz ist daher die maschinelle Neben den methodischen und DV-technischen Entwick- Bestimmung von fehlerhaften Angaben mit Hilfe fachlicher lungsarbeiten stellen Ex-post-Analysen der Korrekturen im Plausibilitätsprüfungen. Sie decken Kombinationen von Rahmen der PL-Optimierung eine wesentliche Maßnahme fehlerhaften Angaben auf, die es zum Beispiel aufgrund zur kontinuierlichen Verbesserung genutzter Erhebungs- bestehender Rechtsgrundlagen nicht geben darf, wie zum instrumente und bestehender Fehlererkennungs- und Beispiel ein 10 Jahre altes Mädchen, das schon verheiratet -beseitigungsmethoden dar („Lernende Organisation“ im ist. Es stellt sich nun die Frage, ob das Alter (10 Jahre), der Bereich der Fehlerbeseitigung).20) Nach der Einführung des 17) Siehe Béguin, C./Hulliger, B., a. a. O. (Fußnote 10), S. 11 ff. 18) Siehe De Waal, T./Quere, R.: “A Fast and Simple Algorithm for Automatic Data Editing of Mixed Data”, Journal of Official Statistics, Vol. 19, Nr. 4, 2003, S. 383 ff. 19) Siehe Raghunathan, T. E./Lepkowski, J. M./Van Hoewyk, J.: “A multivariate technique for multiply imputing missing values using a sequence of regression modells” in Survey Methodology, Vol. 29, Nr. 1, 2001, S. 85 ff.; Bankier, M./Lachance, M./Poirier, P.: “2001 Canadian Census Minimum Change Donor Imputation Methodology”, UNECE Work Session on Statistical Data Editing, WP 17, http://www.unece.org/stats/documents/2000.10.sde.htm. 20) Siehe Paulk, M. C.: “The capability maturity model: guidelines for improving the software process”, Boston 1995; Fortini, M./Scanu, M./Signore, M.: “Use of Indicators from data editing for monitoring the quality of the survey process: the Italian information system for survey documentation (SIDI)”, Statistical Journal of the United Nations ECE, 17 (2000). Statistisches Bundesamt • Wirtschaft und Statistik 4/2005 301
WEITERENTWICKLUNG PL-Fachkonzepts und dem Abschluss der Aufbauarbeiten werden die genannten Tätigkeiten zu den Hauptaufgaben im Bereich der Fehlerbeseitigung zählen. Anhaltende Forderungen nach einer Entlastung der Aus- kunftgebenden und nach einem effizienteren Ressourcen- einsatz werden zu einer steigenden Nutzung verfügbarer Daten über wirtschaftliche und gesellschaftliche Zusam- menhänge durch die amtliche Statistik führen und die Erhe- bung statistikspezifischer Merkmale in den kommenden Jahren mehr und mehr verdrängen. Statt der Beseitigung von Fehlern in erhobenen Daten wird das Schließen von Lücken in sekundärstatistisch genutzten Datenbeständen durch geeignete Imputations- und Schätzverfahren ver- mehrt den Schwerpunkt der zukünftigen Plausibilisierung bilden. 302 Statistisches Bundesamt • Wirtschaft und Statistik 4/2005
Auszug aus Wirtschaft und Statistik © Statistisches Bundesamt, Wiesbaden 2005 Für nichtgewerbliche Zwecke sind Vervielfältigung und unentgeltliche Verbreitung, auch auszugsweise, mit Quellenangabe gestattet. Die Verbreitung, auch auszugsweise, über elektronische Systeme/Datenträger bedarf der vorherigen Zustimmung. Alle übrigen Rechte bleiben vorbehalten. Herausgeber: Statistisches Bundesamt, Wiesbaden Schriftleitung: Johann Hahlen Präsident des Statistischen Bundesamtes Verantwortlich für den Inhalt: Brigitte Reimann, 65180 Wiesbaden • Telefon: +49 (0) 6 11/75 20 86 • E-Mail: wirtschaft-und-statistik@destatis.de Vertriebspartner: SFG Servicecenter Fachverlage Part of the Elsevier Group Postfach 43 43 72774 Reutlingen Telefon: +49 (0) 70 71/93 53 50 Telefax: +49 (0) 70 71/93 53 35 E-Mail: destatis@s-f-g.com Erscheinungsfolge: monatlich i Allgemeine Informationen über das Statistische Bundesamt und sein Datenangebot erhalten Sie: • im Internet: www.destatis.de oder bei unserem Informationsservice 65180 Wiesbaden • Telefon: +49 (0) 6 11/75 24 05 • Telefax: +49 (0) 6 11/75 33 30 • E-Mail: info@destatis.de
Sie können auch lesen