Aus einem Artikel von DR. NEIL POLHEMUS, CTO von STATPOINT
←
→
Transkription von Seiteninhalten
Wenn Ihr Browser die Seite nicht korrekt rendert, bitte, lesen Sie den Inhalt der Seite unten
Wahl einer Statistiksoftware für Six Sigma (Aus einem Artikel von DR. NEIL POLHEMUS, CTO von STATPOINT TECHNOLOGIES, INC., im Quality Magazine) Jeder, der sich mit den grundlegenden Konzepten von Six Sigma vertraut gemacht hat, kennt die Bedeutung, die statistische Methoden für die Quantifizierung von Verbesserungen der Prozessqualität spielen. Bereits dem Namen Six Sigma wohnt inne, dass die Qualität in Beziehung zur Variabilität steht, der griechische Buchstabe "Sigma" stellt die übliche Bezeichnung für die Standardabweichung einer Wahrscheinlichkeitsverteilung dar. Ob die interessierende Variable die Festigkeit eines Produktes oder die Wartezeit an einem Geldautomaten ist, die Quantifizierung der Variabilität ist von grundlegender Bedeutung für die Einschätzung der Systemqualität. Diese Aufgabe wird gewöhnlich mittels statistischer Softwarepakete erledigt, von denen es eine ganze Menge gibt. Dieser Artikel behandelt einige wichtige Kriterien, die bei der Auswahl eines Statistikpaketes für die Anwendung in Six-Sigma-Programmen berücksichtigt werden sollten. Die Wahl des richtigen Paketes hat viel mit dem eventuellen Erfolg oder Misserfolg der Six-Sigma-Initiative zu tun. Bei einer falschen Wahl wird der Anwender die Software nach Beendigung des Trainings beiseite legen und zum "Business as usual" zurückkehren. Kriterium Nr. 1: Statistischer Hintergrund des potentiellen Nutzers Die Statistikpakete variieren sehr stark in bezug auf die Voraussetzungen an den mathematischen und statistischen Hintergrund der Anwender. Bei einigen Programmen werden es die Nutzer ohne den Besuch verschiedener Kurse zu elementaren und tiefergehenden statistischen Methoden schwer haben: a) das richtige Verfahren für ihre speziellen Daten auszuwählen b) die statistischen Ergebnisse zu interpretieren. Andere Programme bieten Werkzeuge an, die den Anwender zur Auswahl von geeigneten Methoden führen, häufig mittels Assistenten. Statistische "Online-Berater" interpretieren dann die Ergebnisse in einer für jeden verständlichen Sprache. Stellen Sie sich bei der Auswahl eines Statistikprogrammes die folgenden Fragen: Welchen statistischen Hintergrund haben die typischen Nutzer? Wenden sie häufiger statistische Verfahren an oder ist das Analysieren von Daten nur eine Aufgabe von vielen, die sie zu erledigen haben? Stehen genügend Statistiker und Black Belts zur Verfügung, um die Anwender bei der Auswahl geeigneter Methoden und der Ergebnisinterpretation zu unterstützen? Oder möchte man diese Unterstützung als Bestandteil der Software haben? Kriterium Nr. 2: Art der gewöhnlich zu analysierenden Daten Jedes Statistikpaket ist auf einen speziellen Schwerpunkt gerichtet. Einige orientieren sich auf Ingenieurtätigkeit und Anwendungen in Fertigungsprozessen. Andere sind stark auf Wissenschaft und Forschung ausgerichtet. Noch andere haben Anwendungen im Dienstleistungsbereich als Ziel. Weil die Art der Daten in diesen verschiedenen Bereichen stark unterschiedlich ist, konzentrieren sich die
Softwarepakete auf solche Verfahren, die ihre Zielgruppe typischerweise für ihre Daten verwendet. Ingenieure zum Beispiel haben es in der Regel mit folgenden zwei Datenarten zu tun: Messdaten wie Zugfestigkeiten oder Zähldaten wie Anzahl von bestimmten Fehlern. Anwender im Dienstleistungsbereich arbeiten oft mit Umfrage-Ergebnissen. In Wissenschaft und Entwicklung wird viel Wert auf geplante Experimente gelegt. Anwender aus Bereichen des Finanzwesens und der Wirtschaft benutzen häufig Zeitreihenanalysen und Prognoseverfahren. Sie müssen auch die Fähigkeit der Software berücksichtigen, wie mit ungewöhnlichen Dateneigenschaften umgegangen wird, die man in die Betrachtung einbeziehen will. Während die meisten Pakete Verfahren für unabhängig- und normalverteilte Daten bereitstellen, variieren sie in ihren Möglichkeiten, Daten zu analysieren, die diese Standardvoraussetzungen nicht mitbringen. Fragen Sie, ob es Prozeduren gibt, die Regressionsmodelle auch für Zähldaten anpassen. Gibt es Prozeduren, die mit zensierten Daten umgehen können, welche von Messsystemen mit einer niedrigeren Nachweisgrenze stammen können? Sind Regelkarten für Daten mit einer hohen Erhebungshäufigkeit verfügbar, wo die Voraussetzung der Unabhängigkeit zwischen nacheinander gezogenen Stichproben nicht notwendig gilt? Sie sollten auch sicher sein, dass Prozeduren für das Analysieren von sehr kleinen oder sehr großen Stichproben vorhanden sind, wenn sie solche betrachten müssen. ARIMA-Karte für Konzentration 19 OEG = 17,63 Mittel = 17,01 18 UEG = 15,63 17 X 16 15 0 20 40 60 80 100 120 Beobachtung ARIMA-Regelkarte: Gedacht für die Überwachung von Daten mit einer hohen Erhebungshäufigkeit. Solche Datenverletzen oftmals die Voraussetzung der Unabhängigkeit, welche für die standardmäßige Shewart-Regelkarte erforderlich ist. Bei der Auswahl eines Statistikprogrammes sollten Sie bedenken: Welche Art von Daten müssen die Anwender in der Regel betrachten? Ist das gewählte Softwarepaket auf die Art Anwendungen ausgerichtet, die wir am meisten brauchen? Welche Werkzeuge besitzt das Programm zur Analyse von Daten, die nicht den üblichen Voraussetzungen wie Unabhängigkeit und Normalverteilung genügen? Kann das Programm mit sehr kleinen oder sehr großen Datenmengen umgehen?
Kriterium Nr. 3: Interaktive explorative Datenanalyse oder sich wiederholende Datenverarbeitung Der berühmte Statistiker JOHN TUKEY schrieb ein Buch mit dem Titel "Exploratory Data Analysis". Darin stellt er eine Vielzahl von ihm entwickelter Techniken dar, die bei der Untersuchung der Daten hilfreich sind. Mit Beginn der PC-Ära wurden Statistikpakete entwickelt mit dem gleichartigen Ziel, einen an der Tastatur sitzenden Analysten in die Lage zu versetzen, mehrere verschiedene Wege zur Untersuchung der Daten auszuprobieren, in dem Bestreben, die enthaltenen Informationen herauszuziehen. Das war ein großer Unterschied zu traditionellen Programmen, die davon ausgingen, dass der Anwender eine Reihe von Analysen entwickeln würde, die später wiederholt an mehreren verschiedenen Datenmengen ausgeführt würden. Während Programme für die explorative Datenanalyse darauf gerichtet sind, mittels Dialogboxen und –fenstern zu arbeiten, welche direkt mit den Daten in anderen Fenstern verbunden sind und sofort aktualisiert werden, wenn sich diese Daten ändern, sind die traditionelleren Pakete auf eine Sprache angewiesen, in der Programme entwickelt werden können, die gespeichert und später ausgeführt werden. Mit der Einführung von Web-Services können Analysen dynamisch mit Datenquellen verbunden werden. Prognosen für Zeitreihen, Fähigkeitsindizes, Paretoanalysen und ähnliches können auf eine Webseite gestellt werden und zur Aktualisierung veranlasst werden, sobald neue Daten verfügbar sind. Wenn Sie ein Statistikpaket bewerten müssen, sollten Sie sich fragen: Wie einfach ist es, bei der Suche nach Informationen in den Daten verschiedene Ansätze mit unterschiedlichen Optionen auszuprobieren? Ist die Software so gestaltet, dass ich Antworten erhalten kann, während ich damit arbeite, oder muss ich ein Programm schreiben, welches zur Ausführung irgendwo abzugeben ist? Falls ich immer wieder standardisierte Auswertungen an verschiedenen Datenmengen ausführen muss, wie einfach ist es, solch einen festen Umfang von Prozeduren zu erzeugen und auszuführen? Kann die Analyse so gestaltet werden, dass sie sich automatisch aktualisiert, sobald sich die Daten ändern? Konturen der geschätzten Wirkungsfläche fuel=50,0 burn rate 35,0 45,0 55,0 65,0 binder=20,0 oxidizer=20,0 75,0 85,0 95,0 105,0 115,0 oxidizer=40,0 fuel=30,0 binder=40,0
Konturen der geschätzten Wirkungsfläche für die Verbrennungsrate von Raketentreibstoff als Funktion von Brennstoff, Oxidations- und Bindemittel. Aus einem Mischungs-Versuchsplan, der bei MYERS/MONTGOMERY in "Response Surface Methodology: Process and Product Optimization Using Designed Experiments" 2nd Edition, Wiley, 2002, beschrieben wurde. Kriterium Nr. 4: Zugänglichkeit von statistischen Ergebnissen Sobald eine statistische Auswertung fertiggestellt ist, werden die Ergebnisse veröffentlicht. Wenn nicht für jeden Mitarbeiter eine Softwarelizenz erworben werden soll, heißt das, die Ergebnisse in anderen Formaten wie PDF- oder Powerpoint- Dateien oder Web-Seiten auszugeben, auf die weitere Mitarbeiter über jeden Webbrowser zugreifen können. Falls Sie häufig mit Kollegen in anderen Ländern zusammenarbeiten, sollten Sie nach einem Paket Ausschau halten, welches das einfache Übersetzen der Ergebnisse in andere Sprachen ermöglicht. Bei der Auswahl eines Statistikpaketes sollten Sie sich also fragen: Wie einfach ist es, einen Ergebnisbericht oder eine Präsentation zu erzeugen? Kann das Ergebnis auf eine Webseite gestellt werden, auf die man mit Hilfe eines Webbrowsers zugreifen kann, oder muss jeder Kollege eine Lizenz der Software besitzen? Können Anwender auf Ergebnisse mittels eines mobilen Gerätes von überall her zugreifen? Wie einfach ist es, die gleichen Analysen in anderen Sprachen zu erstellen, um sie mit Kollegen on anderen Ländern auszutauschen? Regressionskurve einer Stabilität, betrachtet auf einem Apple iPhone mittels eines Webbrowsers. Erzeugt mit Hilfe eines Web-Services. Zusammenfassung Es existiert eine große Anzahl von Programmen, welche für statistische Berechnungen im Rahmen von Six Sigma verwendet werden können. Aber nicht alle Programme unterstützen den Anwender, welcher sich nicht jeden Tag mit Statistik beschäftigt. Die Art der Begleitung und Beratung, die zum Paket gehört und die mehr für Praktiker anstelle von Statistikern gedacht ist, und die einfache Handhabung, wie deren Ergebnisse veröffentlicht werden können, machen die Unterschiede aus zwischen einem erfolgreichen Six-Sigma-Programm und einem, das den Erwartungen nicht entspricht.
Bevor Sie ein Statistikpaket auswählen, sollten Sie die oben aufgeführten vier Kriterien berücksichtigen. Das Ganze wird ein wenig Zeit beanspruchen, aber der Aufwand wird sich lohnen. Der Autor DR. NEIL W. POLHEMUS ist Chief Technology Officer bei Statpoint Technologies, Inc. Er leitet die Entwicklung der Statistikpakete STATGRAPHICS Centurion und STATGRAPHICS Online. Er hält häufig Vorträge zur Anwendung statistischer Methoden in der Qualitätsverbesserung.
Sie können auch lesen