Aus einem Artikel von DR. NEIL POLHEMUS, CTO von STATPOINT

 
WEITER LESEN
Aus einem Artikel von DR. NEIL POLHEMUS, CTO von STATPOINT
Wahl einer Statistiksoftware für Six Sigma
                (Aus einem Artikel von DR. NEIL POLHEMUS, CTO von STATPOINT
                TECHNOLOGIES, INC., im Quality Magazine)

Jeder, der sich mit den grundlegenden Konzepten von Six Sigma vertraut gemacht
hat, kennt die Bedeutung, die statistische Methoden für die Quantifizierung von
Verbesserungen der Prozessqualität spielen. Bereits dem Namen Six Sigma wohnt
inne, dass die Qualität in Beziehung zur Variabilität steht, der griechische Buchstabe
"Sigma" stellt die übliche Bezeichnung für die Standardabweichung einer
Wahrscheinlichkeitsverteilung dar. Ob die interessierende Variable die Festigkeit
eines Produktes oder die Wartezeit an einem Geldautomaten ist, die Quantifizierung
der Variabilität ist von grundlegender Bedeutung für die Einschätzung der
Systemqualität. Diese Aufgabe wird gewöhnlich mittels statistischer Softwarepakete
erledigt, von denen es eine ganze Menge gibt.
Dieser Artikel behandelt einige wichtige Kriterien, die bei der Auswahl eines
Statistikpaketes für die Anwendung in Six-Sigma-Programmen berücksichtigt werden
sollten. Die Wahl des richtigen Paketes hat viel mit dem eventuellen Erfolg oder
Misserfolg der Six-Sigma-Initiative zu tun. Bei einer falschen Wahl wird der Anwender
die Software nach Beendigung des Trainings beiseite legen und zum "Business as
usual" zurückkehren.

Kriterium Nr. 1: Statistischer Hintergrund des potentiellen Nutzers
Die Statistikpakete variieren sehr stark in bezug auf die Voraussetzungen an den
mathematischen und statistischen Hintergrund der Anwender. Bei einigen
Programmen werden es die Nutzer ohne den Besuch verschiedener Kurse zu
elementaren und tiefergehenden statistischen Methoden schwer haben:
a) das richtige Verfahren für ihre speziellen Daten auszuwählen
b) die statistischen Ergebnisse zu interpretieren.
Andere Programme bieten Werkzeuge an, die den Anwender zur Auswahl von
geeigneten Methoden führen, häufig mittels Assistenten. Statistische "Online-Berater"
interpretieren dann die Ergebnisse in einer für jeden verständlichen Sprache. Stellen
Sie sich bei der Auswahl eines Statistikprogrammes die folgenden Fragen:
   ƒ   Welchen statistischen Hintergrund haben die typischen Nutzer?
   ƒ   Wenden sie häufiger statistische Verfahren an oder ist das Analysieren von
       Daten nur eine Aufgabe von vielen, die sie zu erledigen haben?
   ƒ   Stehen genügend Statistiker und Black Belts zur Verfügung, um die Anwender
       bei der Auswahl geeigneter Methoden und der Ergebnisinterpretation zu
       unterstützen? Oder möchte man diese Unterstützung als Bestandteil der
       Software haben?

Kriterium Nr. 2: Art der gewöhnlich zu analysierenden Daten
Jedes Statistikpaket ist auf einen speziellen Schwerpunkt gerichtet. Einige orientieren
sich auf Ingenieurtätigkeit und Anwendungen in Fertigungsprozessen. Andere sind
stark auf Wissenschaft und Forschung ausgerichtet. Noch andere haben
Anwendungen im Dienstleistungsbereich als Ziel. Weil die Art der Daten in diesen
verschiedenen Bereichen stark unterschiedlich ist, konzentrieren sich die
Softwarepakete auf solche Verfahren, die ihre Zielgruppe typischerweise für ihre
Daten verwendet.
Ingenieure zum Beispiel haben es in der Regel mit folgenden zwei Datenarten zu tun:
Messdaten wie Zugfestigkeiten oder Zähldaten wie Anzahl von bestimmten Fehlern.
Anwender im Dienstleistungsbereich arbeiten oft mit Umfrage-Ergebnissen. In
Wissenschaft und Entwicklung wird viel Wert auf geplante Experimente gelegt.
Anwender aus Bereichen des Finanzwesens und der Wirtschaft benutzen häufig
Zeitreihenanalysen und Prognoseverfahren.
Sie müssen auch die Fähigkeit der Software berücksichtigen, wie mit
ungewöhnlichen Dateneigenschaften umgegangen wird, die man in die
Betrachtung einbeziehen will. Während die meisten Pakete Verfahren für
unabhängig- und normalverteilte Daten bereitstellen, variieren sie in ihren
Möglichkeiten, Daten zu analysieren, die diese Standardvoraussetzungen nicht
mitbringen. Fragen Sie, ob es Prozeduren gibt, die Regressionsmodelle auch für
Zähldaten anpassen. Gibt es Prozeduren, die mit zensierten Daten umgehen können,
welche von Messsystemen mit einer niedrigeren Nachweisgrenze stammen können?
Sind Regelkarten für Daten mit einer hohen Erhebungshäufigkeit verfügbar, wo die
Voraussetzung der Unabhängigkeit zwischen nacheinander gezogenen Stichproben
nicht notwendig gilt? Sie sollten auch sicher sein, dass Prozeduren für das Analysieren
von sehr kleinen oder sehr großen Stichproben vorhanden sind, wenn sie solche
betrachten müssen.

                         ARIMA-Karte für Konzentration

           19
                                                                     OEG = 17,63
                                                                     Mittel = 17,01
           18                                                        UEG = 15,63

           17
       X

           16

           15
                0   20     40        60         80       100   120
                                 Beobachtung

ARIMA-Regelkarte: Gedacht für die Überwachung von Daten mit einer hohen
Erhebungshäufigkeit. Solche Datenverletzen oftmals die Voraussetzung der Unabhängigkeit,
welche für die standardmäßige Shewart-Regelkarte erforderlich ist.

Bei der Auswahl eines Statistikprogrammes sollten Sie bedenken:
   ƒ   Welche Art von Daten müssen die Anwender in der Regel betrachten?
   ƒ   Ist das gewählte Softwarepaket auf die Art Anwendungen ausgerichtet, die
       wir am meisten brauchen?
   ƒ   Welche Werkzeuge besitzt das Programm zur Analyse von Daten, die nicht
       den üblichen Voraussetzungen wie Unabhängigkeit und Normalverteilung
       genügen?
   ƒ   Kann das Programm mit sehr kleinen oder sehr großen Datenmengen
       umgehen?
Kriterium Nr. 3: Interaktive explorative Datenanalyse oder sich wiederholende
Datenverarbeitung
Der berühmte Statistiker JOHN TUKEY schrieb ein Buch mit dem Titel "Exploratory Data
Analysis". Darin stellt er eine Vielzahl von ihm entwickelter Techniken dar, die bei der
Untersuchung der Daten hilfreich sind.
Mit Beginn der PC-Ära wurden Statistikpakete entwickelt mit dem gleichartigen Ziel,
einen an der Tastatur sitzenden Analysten in die Lage zu versetzen, mehrere
verschiedene Wege zur Untersuchung der Daten auszuprobieren, in dem Bestreben,
die enthaltenen Informationen herauszuziehen. Das war ein großer Unterschied zu
traditionellen Programmen, die davon ausgingen, dass der Anwender eine Reihe
von Analysen entwickeln würde, die später wiederholt an mehreren verschiedenen
Datenmengen ausgeführt würden. Während Programme für die explorative
Datenanalyse darauf gerichtet sind, mittels Dialogboxen und –fenstern zu arbeiten,
welche direkt mit den Daten in anderen Fenstern verbunden sind und sofort
aktualisiert werden, wenn sich diese Daten ändern, sind die traditionelleren Pakete
auf eine Sprache angewiesen, in der Programme entwickelt werden können, die
gespeichert und später ausgeführt werden.
Mit der Einführung von Web-Services können Analysen dynamisch mit Datenquellen
verbunden werden. Prognosen für Zeitreihen, Fähigkeitsindizes, Paretoanalysen und
ähnliches können auf eine Webseite gestellt werden und zur Aktualisierung veranlasst
werden, sobald neue Daten verfügbar sind.
Wenn Sie ein Statistikpaket bewerten müssen, sollten Sie sich fragen:
   ƒ   Wie einfach ist es, bei der Suche nach Informationen in den Daten
       verschiedene Ansätze mit unterschiedlichen Optionen auszuprobieren? Ist die
       Software so gestaltet, dass ich Antworten erhalten kann, während ich damit
       arbeite, oder muss ich ein Programm schreiben, welches zur Ausführung
       irgendwo abzugeben ist?
   ƒ   Falls ich immer wieder standardisierte Auswertungen an verschiedenen
       Datenmengen ausführen muss, wie einfach ist es, solch einen festen Umfang
       von Prozeduren zu erzeugen und auszuführen?
   ƒ   Kann die Analyse so gestaltet werden, dass sie sich automatisch aktualisiert,
       sobald sich die Daten ändern?

                             Konturen der geschätzten Wirkungsfläche
                                            fuel=50,0
                                                                                    burn rate
                                                                                       35,0
                                                                                       45,0
                                                                                       55,0
                                                                                       65,0
                       binder=20,0                             oxidizer=20,0           75,0
                                                                                       85,0
                                                                                       95,0
                                                                                       105,0
                                                                                       115,0

       oxidizer=40,0                        fuel=30,0                          binder=40,0
Konturen der geschätzten Wirkungsfläche für die Verbrennungsrate von Raketentreibstoff als
Funktion von Brennstoff, Oxidations- und Bindemittel. Aus einem Mischungs-Versuchsplan, der
bei MYERS/MONTGOMERY in "Response Surface Methodology: Process and Product Optimization
Using Designed Experiments" 2nd Edition, Wiley, 2002, beschrieben wurde.
Kriterium Nr. 4: Zugänglichkeit von statistischen Ergebnissen
Sobald eine statistische Auswertung fertiggestellt ist, werden die Ergebnisse
veröffentlicht. Wenn nicht für jeden Mitarbeiter eine Softwarelizenz erworben werden
soll, heißt das, die Ergebnisse in anderen Formaten wie PDF- oder Powerpoint-
Dateien oder Web-Seiten auszugeben, auf die weitere Mitarbeiter über jeden
Webbrowser zugreifen können. Falls Sie häufig mit Kollegen in anderen Ländern
zusammenarbeiten, sollten Sie nach einem Paket Ausschau halten, welches das
einfache Übersetzen der Ergebnisse in andere Sprachen ermöglicht.
Bei der Auswahl eines Statistikpaketes sollten Sie sich also fragen:
   ƒ   Wie einfach ist es, einen Ergebnisbericht oder eine Präsentation zu erzeugen?
   ƒ   Kann das Ergebnis auf eine Webseite gestellt werden, auf die man mit Hilfe
       eines Webbrowsers zugreifen kann, oder muss jeder Kollege eine Lizenz der
       Software besitzen?
   ƒ   Können Anwender auf Ergebnisse mittels eines mobilen Gerätes von überall
       her zugreifen?
   ƒ   Wie einfach ist es, die gleichen Analysen in anderen Sprachen zu erstellen, um
       sie mit Kollegen on anderen Ländern auszutauschen?

                                                           Regressionskurve einer Stabilität,
                                                           betrachtet auf einem Apple
                                                           iPhone mittels eines
                                                           Webbrowsers. Erzeugt mit Hilfe
                                                           eines Web-Services.

Zusammenfassung
Es existiert eine große Anzahl von Programmen, welche für statistische Berechnungen
im Rahmen von Six Sigma verwendet werden können. Aber nicht alle Programme
unterstützen den Anwender, welcher sich nicht jeden Tag mit Statistik beschäftigt.
Die Art der Begleitung und Beratung, die zum Paket gehört und die mehr für Praktiker
anstelle von Statistikern gedacht ist, und die einfache Handhabung, wie deren
Ergebnisse veröffentlicht werden können, machen die Unterschiede aus zwischen
einem erfolgreichen Six-Sigma-Programm und einem, das den Erwartungen nicht
entspricht.
Bevor Sie ein Statistikpaket auswählen, sollten Sie die oben aufgeführten vier Kriterien
berücksichtigen. Das Ganze wird ein wenig Zeit beanspruchen, aber der Aufwand
wird sich lohnen.

Der Autor
DR. NEIL W. POLHEMUS ist Chief Technology Officer bei Statpoint Technologies, Inc. Er
leitet die Entwicklung der Statistikpakete STATGRAPHICS Centurion und
STATGRAPHICS Online. Er hält häufig Vorträge zur Anwendung statistischer Methoden
in der Qualitätsverbesserung.
Sie können auch lesen