Kurze Einführung in SPSS 11.5 - 2001 überarbeitet Oktober 2003 - Matthias Gabriel

Die Seite wird erstellt Joel Rothe
 
WEITER LESEN
 Matthias Gabriel

      Kurze Einführung in SPSS 11.5

          2001
überarbeitet Oktober 2003

           1
 Matthias Gabriel

Legende: Im folgenden Text entsprechen die Wörter zwischen Anführungszeichen den
Befehlen bzw. Menüoptionen im SPSS
z.B: „Berechnen“, „Zählen“, „Umkodieren“...

1 Datenaufbereitung

1.1 Die SPSS-Matrix

Der SPSS Editor ist in eine Datenansicht und eine Variablenansicht geteilt (links unten am
Bildschirm). Zwischen den beiden Ansichten kann beliebig gewechselt werden.
    1) Die Datenansicht zeigt die vom Benutzer eingegeben Daten an, wobei die Personen
       (Fälle) senkrecht angereiht sind und die Variablen waagrecht.
       Jede Person i hat also eine ganze Zeile Zi in der ihre Ausprägungen in allen Variablen
       k sichtbar werden.
       Jede Variable j hat eine Spalte Sj in der die Ausprägungen aller Personen n in dieser
       Variable sichtbar werden.
    2) Die Variablenansicht gibt Auskunft über die Definitionen und Merkmale der
       einzelnen Variablen Vj, wobei in dieser Ansicht die Variablen senkrecht aufgereiht
       sind (jede Zeile = eine Variable) und jedes Merkmal, jede Einstellung dieser Variable
       eine Spalte darstellt.
       Folgende Einstellungen (jede Spalte ist eine Einstellung) werden angeboten:
           a) Name: hier wird der Variablenname eingegeben (max. 8 Zeichen, der Name
               muss mit einem Buchstaben beginnen), der in der Datenansicht dann über der
               Spalte erscheint und somit die „Überschrift“ der Variable darstellt.
           b) Typ: Numerisch (für Zahlen), Währung (für Geld), Datum, String (für
               Zeichen, Buchstabenketten, alphanumerische Kombination)...
           c) Spaltenformat (benutzerdefiniert je nach Variable)
           d) Dezimalstellen
           e) Variablenlabel: Der hier eingeschriebene Name der Variable wird beim
               Output automatisch verwendet; z.B. bei Tabellen, Diagrammen, Tests...(der
               Name aus Punkt a) wird also nicht(!) beim Output verwendet)
           f) Wertelabels: Hier kann man Werte einer Variablen definieren (meist bei
               nominalskalierten bzw qualitiativen Variablen). z.B: Wert „0“ für „männlich“,
               Wert „1“ für „weiblich“ (bei Geschlecht), oder „16-20“ für „jung“ und „21-25“
               für „mittel“... (bei Altersklassen).
               Erscheint ebenfalls im Output (wie das Variablenlabel).
           g) Fehlende Wert: Definition des „missing-Wertes“: Falls Personen in
               verschiedenen Zellen, Variablen keine Werte haben, wird diese Zelle nicht
               einfach ausgelassen! Der missing-Wert wird eingegeben. (z.B: „-1“ oder „99“ ,
               damit er nicht mit anderen Werten leicht vertauscht werden kann). Diese
               Eingabe ist ebenfalls wichtig für die Auswertung.
           h) Spalten: für Spaltenbreite (benutzerdefiniert je nach Variable)
           i) Ausrichtung: wo die Werte in der Zelle angeordnet sein sollen (rechts, links...)
           j) Messniveau: Nominal (z.B: Geschlecht, Bildung, Hobby...) Ordinal (=
               Rangskala z.B: Noten, Dienstgrad...) Metrisch (= Verhältnisskala z.B: Größe,
               Gewicht, Längen und u.a. auch Rohwerte...)

                                              4
 Matthias Gabriel

1.2 Variablen definieren

Definition: Die oben genannten Einstellungen (a bis j) für eine Variable modifizieren. Dies
geschieht in der Regel gleich zu Beginn der Dateneingabe.

Beispiel: Variable „Geschlecht“ defineren
   a) Name: „Gender“
   b) Typ: „numerisch“
   c) Spaltenformat: 8
   d) Dezimalstellen: 0
   e) Variablenlabel: Geschlecht
   f) Wertelabels: Wert „0“ hat Wertelabel „männlich“ und Wert „1“ hat Wertelabel
       „weiblich“ („hinzufügen“ nicht vergessen!)
   g) fehlende Wert „-1“
   h) Spalten: 8
   i) Ausrichtung: rechts
   j) Messniveau: „nominal“

1.3 Variablen verschieben, einfügen

Verschieben: Variable markieren (beim Variablennamen), mit linker Maustaste nochmals
anklicken, Taste halten und dann weiterschieben. Erst wenn richtige Stelle erreicht ist,
Mausknopf loslassen. (eine andere Möglichkeit besteht mit kopieren und einfügen)

Einfügen: In der Datenansicht Variable rechts neben der neu einzufügenden Variable
markieren (beim Variablennamen), dann rechter Mausklick und „Variable einfügen“.

1.4 Fälle (Personen) einfügen

In der Datenansicht die Zeile unter der neu einzufügenden Zeile markieren (bei Fallnummer),
dann rechter Mausklick und „Fälle einfügen“.

1.5 Fälle, Variablen löschen

Zeile bzw. Spalte markieren (wie unter 1.3 bzw. 1.4) und „entfernen“ drücken.

1.6 Daten sortieren (sort)

Definition: Sortiert alle Fälle nach einer bestimmten Variable auf- oder absteigend.

Beispiel: Alle Personen nach Alter aufsteigend sortieren (also vom Jüngsten zum Ältesten)
„Daten“ → „Fälle sortieren“ → In „sortieren nach“ die gewünschte Variable eingeben nach
der sortiert werden soll (hier Alter) → „aufsteigend“ → „ok“

                                              5
 Matthias Gabriel

1.7 Dateien aufteilen (split)

Definition: Um den Datensatz (imaginär) in Untergruppen zu teilen, z.B: Frauen und Männer
trennen, nach Altersklassen aufteilen...

Anwendung: z.B. bei der Normalverteilungsprüfung, bei Diagrammen, Tabellen und anderen
deskriptiven Auswertungen

Beispiel: Die Daten bezüglich Geschlecht aufteilen
„Daten“ → „Datei aufteilen“ → „Ausgabe nach Gruppen aufteilen“ anklicken und die
gewünschte split-Variable eingeben (hier Geschlecht) → „ok“

Die Daten werden jetzt für alle Berechnungen immer als gesplittet angesehen,
dementsprechend gibt es auch im Output immer getrennte Ergebnisse.
Nicht vergessen die Aufteilung wieder aufzuheben, falls sie nicht mehr gebraucht wird.

1.8    Fälle auswählen bzw. filtern (select)

Definition: Um nur bestimmte Fälle in die Berechnungen einzubeziehen

1) Fälle nach bestimmten Kriterien auswählen

Beispiel: Es werden nur jene Fälle für die Auswertung benötigt, die älter als 35 Jahre sind.
„Daten“ → „Fälle auswählen“ → „Falls Bedingung zutrifft“ anklicken → „Falls“ →
Bedingungsvariable hinzufügen (hier Alter) und Bedingung festlegen (hier „>35“
dazuschreiben) →“weiter“ → „ok“

2) Zufallsstichprobe

Definition: um aus den Daten eine repräsentative Stichprobe auszuwählen (meist nur für
große Datensätze)
„Daten“ → „Fälle auswählen“ → „Zufallsstichprobe“ anklicken

3) Aufgrund einer Filtervariablen filtern

Beispiel: Daten nach Geschlecht filtern
„Daten“ → „Fälle auswählen“ → „Filtervariable verwenden“ anklicken → gewünschte
Filtervariable hinzufügen (hier Geschlecht) → „nicht ausgewählte Fälle“: „löschen“ oder
(besser) „filtern“ auswählen

Die Daten werden jetzt für alle Berechnungen immer als gefiltert angesehen, daher nicht
vergessen die Filterung wieder aufzuheben, falls sie nicht mehr gebraucht wird.

1.9    Variablen kategorisieren

Definition: Kategorisiert eine gewünschte Variable in k (selbst wählbare) Klassen. Die Wahl
der Klassengrößen erfolgt automatisch!

                                             6
 Matthias Gabriel

Anmerkung: Falls die Klassengrößen selbst definiert werden wollen (besser): siehe unter
1.11 Variablen umkodieren

Beispiel: Das Alter soll in 4 Klassen eingeteilt werden

„Transformieren“ → „Variablen kategorisieren“ → In „Kategorien erstellen für“ gewünschte
Variable hinzufügen (hier Alter) → die „Anzahl der Kategorien“ festlegen (hier 4) → „ok“
Ergebnis: Eine neue Variable (hier nalter) mit 4 Kategorien wird erzeugt.

1.10   Zählen...

Definition: Zählt zeilenweise bestimmte Werte nach benutzerdefiniert aufgestellten Formeln.
Das Ergebnis wird in einer neuen Variablen angegeben.
Dieser Befehl kann sehr hilfreich sein, etwa bei der Frage: „Wie oft hat eine Person bei
bestimmten Items/Variablen bestimmte Werte gewählt?“ oder „Wie oft hat eine Person bei
den 20 Items die Antwortmöglichkeit A gewählt?“

Anwendungsbeispiele:
  • Darstellung des Antwortverhaltens der einzelnen Personen
  • Häufigkeiten von Werten in Zeilen (also pro Person) zählen

Beispiel: Ein Persönlichkeitsfragebogen mit 10 Fragen, 5 kategorielles Antwortmuster. Wie
oft hat eine Versuchsperson Antwort 1, 2, 3, 4, bzw. 5 angekreuzt?
„Transformieren“ → „Zählen...“ → In „Zielvariable“ den Namen der neuen Variable
eingeben (z.B: „Antw_1“ für Antwortmöglichkeit 1) → In „Label“ den Variablennamen
eingeben (zB: „Häufigkeit Antwort 1“) (siehe auch 1.1) → In „Variablen“ jene Variablen
eingeben, die für den Zählvorgang berücksichtigt werden sollen (hier: Item1 bis Item 10) →
„Werte definieren“ → unter „Wert“ den gewünschten zu zählenden Wert eingeben (hier: „1“)
→ „hinzufügen“ → „weiter“ → „ok“
Ergebnis: Eine neue Variable (hier: „Antw_1“) wird erzeugt in der die Häufigkeiten der
Antwortalternative „1“ in den 10 Items für jede Person dargestellt wird.

→ analog erfolgt die Darstellung der anderen 4 Antwortmöglichkeiten in 4 neuen Variablen.

Im Alert-Fenster „Werte definieren“ besteht auch die Möglichkeit nicht nur konkrete einzelne
Werte, sondern auch Wertbereiche und missing Werte, die zu zählen sind, anzugeben.

1.11   Variablen umkodieren (recode)

Ein sehr wichtiger Befehl.

Anwendungsbeispiele:
  • Das Alter in einer neuen Variable in Altersklassen einteilen,
  • Die Kodierung einzelner Items umdrehen (bei Rating- Likertskalen), also z.B: die
     Werte 1,2,3,4,5 in 5,4,3,2,1 umdrehen.

                                               7
 Matthias Gabriel

   •   Bestehende Kodierungen umändern: zB: 4 Schulformkategorien (AHS, HTL, HBLA,
       HAK) in 2 umkodieren (AHS und „Andere“), sodass unter „Andere“ HTL, HBLA
       und HAK enthalten sind.

Die Umkodierung wird in derselben Variablen durchgeführt, oder (besser) es wird eine neue
Variable mit der neuen Kodierung erzeugt.

Beispiel 1: Das Alter (stetige Variable) in die Altersklassen (qualitativ dreikategorielle
Variable) „15-30“, „31-39“ und „40+“ umkodieren. Dafür soll eine neue Variable erzeugt
werden.
„Transformieren“ → „Umkodieren“ →                 „in andere Variablen“          → gewünschte
umzukodierende Variable hinzufügen (hier Alter) → in „Ausgabevariable“ „Name“ den
Namen der neuen Variablen eingeben (z.B: alter2) und „ändern“(!) drücken → „Label“
einschreiben (z.B: „Alter dreikategoriell“) (siehe auch 1.1) → „alte und neue Werte“ → „alter
Wert“ „Bereich“ anklicken (weil ein Altersbereich angegeben werden muss) → die ersten
Klassengrenzen eingeben (hier: 15 und 30) → unter „neuer Wert“ neuen „Wert“ angeben
(hier: „1“ für 1.Altersklasse) → „hinzufügen“ → analog den zweiten Bereich (31 bis 39)
eingeben und 2 für 2. Altersklasse als neuen Wert → für die letzte (offene!!) Klasse (40+)
„Bereich“ „kleinster Wert bis“ anklicken und „40“ eingeben → als „neuen Wert“ „3“ (für 3.
Klasse) „hinzufügen“ → „weiter“ → „ok“
Ergebnis: am Ende der Datenmatrix in der Datenansicht wird nun die neue Variable
(„alter2“) hinzugefügt, welche die Variable Alter in 3 Klassen einteilt. („1“ für 15-13, „2“ für
31-39 und „3“ für 40 und älter)

Die neue Variable muss noch definiert werden (siehe 1.1)

Beispiel 2: Die Werte des 5 kategoriellen Items 1 sollen umkodiert werden, in einer anderen
Variable; also 5 zu 1, 4 zu 2, 3 zu 3, 2 zu 4 und 1 zu 5.
„Transformieren“ → „Umkodieren“ →                  „in andere Variablen“   → gewünschte
umzukodierende Variable hinzufügen (hier Item1) → in „Ausgabevariable“ „Name“ den
Namen der neuen Variablen eingeben (z.B: Item1_a) und „ändern“(!) drücken → „Label“
einschreiben (z.B: „Item1 umkodiert“) → „alte und neue Werte“ → „alter Wert“ „1“ eingeben
→ „neuer Wert“ „5“ eingeben → “hinzufügen“ → analog für die anderen 4 Werte (2 zu 4; 3
zu 3; 4 zu 2 und 5 zu 1) → „weiter“ → ok“
Ergebnis: am Ende der Datenmatrix wird nun die neue Variable („Item1_a“) mit den
umkodierten Werten hinzugefügt.

Die neue Variable muss noch definiert werden (siehe 1.1)

Automatisch umkodieren
Das obige Beispiel 2 kann auch einfacher gelöst werden mit „automatisch umkodieren“

Fortsetzung Beispiel 2:
„Transformieren“ → „automatisch umkodieren“ → gewünschte umzukodierende Variable
hinzufügen (hier Item1) → in „Neuer Name“ den Namen der neuen Variablen eingeben (z.B:
„Item1_a“) und „Neuer Name“(!) drücken → „Umkodieren beginnen bei „größtem Wert“
wählen → „ok“
Ergebnis: Am Ende der Datenmatrix wird nun die neue Variable („Item1_a“) hinzugefügt

Die neue Variable muss noch definiert werden (siehe 1.1)

                                               8
 Matthias Gabriel

1.12   Der Befehl „Berechnen“ (compute)

Der „Berechnen“-Befehl ist ebenfalls eine sehr hilfreiche Anwendung.

Definition: (zumeist zeilenweise) Berechnung von bestimmten statistischen Kennwerten,
Formeln, deren Ergebnis in einer neuen Variable aufscheint.

Anwendungsbeispiele:
  • Welchen Rohscore haben die Personen in den k Items (Variablen) (also eine
     zeilenweise Summierung der Werte der k Items für jede Person, in einer neuen
     Variablen ausgegeben)
  • Welchen Mittelwert, welche Varianz, Standardabweichung... hat jeder Fall in den k
     Variablen
  • Viele weitere Berechnungen (z.B: Body-Maß-Index, relative Lösungshäufigkeiten,
     Summen, Wurzel, Potenzen, Logarithmen, Median, Modalwert...)

Beispiel 1: Welche relative Lösungshäufigkeit weist jede Peson in den 10 Items auf?
„Transformieren“ → „Berechnen“ → In „Zielvariable“ gewünschten Namen der neuen
Variable einschreiben (z.B. relHfgkt) → im Feld „numerischer Ausdruck“ werden alle
gewünschten Berechnungen eingetragen. Dafür muss man einfach die benötigten Variablen
aus der Variablenliste einfügen und mit den erwünschten Rechenoperatoren verknüpfen.
Dieses Beispiel verlangt die Anzahl der gelösten Items (Variable „rohscore“) dividiert durch
die Anzahl aller n Items für jede Zeile:
Man schreibt bzw. fügt ins Berechnungsfeld also folgendes ein:
“rohscore / 10”
→ „ok“
Ergebnis: Eine neue Variable „relHfgkt“ wird nun erzeugt, die für jede Person die relative
Lösungswahrscheinlichkeit angibt.

Berechnen mittels Funktionen
Verschiedene vorprogrammierte Berechnungen (wie Mittelwert, Median, Varianz,
Standardabweichung...) sind den vorprogrammierten Funktionen zu entnehmen. Diese
vereinfachen den Rechenprozess oft wesentlich.

Beispiel 2: Mittelwertsberechnung mittels vorprogrammierter Funktion

Die Funktionen sind im Feld „Funktionen“ ersichtlich und mit englischen Wörtern abgekürzt.
Für eine Direkthilfe braucht man nur die gewünschte Funktion markieren und die rechte
Maustaste klicken.

Für unser Beispiel wäre es die Funktion unter „M“ wie „Mean“ (Mittelwert) also
„Mean(numausdr, numausdr,...)“
Die gewünschten 10 Items müssen noch eingefügt und mit einem Beistrich getrennt(!)
werden. Dies sieht so aus:
“MEAN(item1,item2,item3,item4,item5,item6,item7,item8item9,item10)”
→ „ok“
Dies wäre die Berechnung des Mittelwertes mittels Funktion.
Ergebnis: Eine neue Variable wird nun erzeugt, die für jeden Fall den Mittelwert der Werte
der 10 Items angibt.

                                             9
 Matthias Gabriel

2 Deskriptive Statistik

2.1 Tabellen

2.1.1 einfache Tabellen

Definition: zur einfachen, übersichtlichen Darstellung bzw. Zusammenfassung der Werte
(Häufigkeiten) von Variablen nach ihren Ausprägungen (z.B.: Ja/Nein; Geschlecht; Alter...)
Befehl: „Analysieren“ → „Tabellen“ → „einfache Tabellen“ → gewünschte Variable(n) in
„Zeilen“ oder/und „Spalten“ geben → „ok“
Beispiel:
Zeilen: Semester in denen sich die Vps befinden (1-9)
Spalten: Unterteilung Geschlecht (dichotom)

                       Geschlecht
                       männlich     weiblich
aktuelles Semester 1   42           237
                   2   12           33
                   3   6            55
                   4   4            7
                   5   1            11
                   6   2            2
                   7                1
                   9                1

Variationen:
   • separate Tabellen (z.B.: je eine Tabelle für Männer/Frauen): → gewünschte Variable
       (z.B.: Geschlecht) in „separate Tabellen“ geben um 2 separate Tabellen für 1) Männer
       2) Frauen zu erhalten
   • gestapelte/verschachtelte Tabellen
   • Zeilen/Spaltenprozente, Prozentangaben...: → „Statistik“
   • die Anordnung der Zeilen/Spaltenprozente, Prozentangaben...innerhalb der Tabelle
       können geändert werden:
       → „Layout“ → „Beschriftung für Statistik“ wie gewünscht ändern
   • Werte sortieren: → „Statistik“
   • Gesamtwerte (Gesamtergebnis für die Tabelle / Zeilen/Spaltensummen): → „Gesamt“
   • Darstellung leerer Zellen (z.B.: mit Null): → „Format“

2.1.2 Häufigkeitstabellen

Definition: Häufigkeitstabellen sind den einfachen Tabellen sehr ähnlich. Sie eignen sich aber
zusätzlich besonders zur Darstellung von Häufigkeiten mehrerer Variablen, welche gleiche
Antwortmöglichkeiten/kategorien haben (z.B.: Ja/Nein/weiß nicht; Multiple Choice...)
Beispiel:
Spalten: Zufriedenheit und Lebenssituation (2 Variablen(!))
Zeilen: Antwortkategorien (bei beiden Variablen gleich(!))
Befehl: „Analysieren“ → „Tabellen“ → „Häufigkeitstabellen“

                                               10
 Matthias Gabriel

                     Allgemeine Zufriedenheit   Ist das Leben aufregend oder langweilig?
                     Anzahl                     Anzahl
Sehr zufrieden       467                        434
Ziemlich zufrieden 872                          505
Nicht sehr zufrieden 165                        41

Variation:
   • Für jede Variable eine eigene Spalte: → alle gewünschten Variablen in „Häufigkeit
       für“ geben
   • Verschachtelte Tabellen (mehrdimensional): → zusätzliche Variable(n) in „In jeder
       Tabelle“ geben
   • Separate verschachtelte Tabellen: → zusätzliche Variable(n) in „separate Tabellen“
       geben
   • Prozente, Gesamtwerte: → „Statistik“

2.1.3 allgemeine Tabellen

Definition: Mit allgemeinen Tabellen können Mehrfachantworten ausgewertet werden
(mehrdimensionale Darstellungen, also viele Variablen in einer Tabelle). Weiters können
auch verschiedene Stufen der Verschachtelung innerhalb der Tabellen festgelegt werden.
Befehl: „Analysieren“ → „Tabellen“ → „allgemeine Tabellen“

Beispiel 1: (eine verschachtelte mehrdimensionale Tabelle)
In den Zeilen: Beschreibung der Lebenssituation und (verschachteltes) Geschlecht
In der Spalte: die Region (Lebensraum)

                                                      Region
                                                      Nordost         Südost     West
Ist das Leben aufregend oder Aufregend Männlich       92              56         65
langweilig?                             Weiblich      94              51         76
                             Routine    Männlich      88              58         54
                                        Weiblich      140             90         75
                             Langweilig Männlich      7               3          2
                                        Weiblich      12              9          8

Beispiel 2: (eine unverschachtelte mehrdimensionale Tabelle)
In den Zeilen: Beschreibung der Lebenssituation und (unverschachteltes) Geschlecht
In der Spalte: die Region

                                                    Region
                                                    Nordost                          Südost   West
Ist das Leben aufregend oder langweilig? Aufregend 186                               107      141
                                         Routine    228                              148      129
                                         Langweilig 19                               12       10
Geschlecht                               Männlich 281                                177      178
                                         Weiblich 398                                238      245

                                                      11
 Matthias Gabriel

Variationen:
   • Verschachteln von einzelnen Variablen (z.B.: Geschlecht): → Variable markieren und
       „Verschachtelt“ wählen
   • Zellenstatistiken für einzelne Variablen (z.B.: nur Geschlecht hat Zeilenprozente alle
       anderen haben Absolutwerte): → Variable markieren und „Statistik bearbeiten“
       wählen
   • Gesamtwerte einblenden: → Variable markieren und „Gesamtergebnis einfügen“
       wählen.
   • Mittelwert, Varianz.... berechnen: → Variable markieren und „wird ausgewertet“
       wählen: → dann „Statistik“ wählen und die gewünschten Statistiken (Mittelwert...)
       „hinzufügen“ (eventuell Mittelwert... markieren und „Format“ ändern für
       Dezimalzahlen)

                                            12
 Matthias Gabriel

2.2 statistische Kennwerte (deskriptive Statistiken)

2.2.1 Mittelwert, Varianz, Median, Standardabweichung...+ Diagramme

1. Möglichkeit: (mit Diagrammen)

Befehl: „Analysieren“ → „deskriptive Statistiken“ → „Häufigkeiten“ → gewünschte Variable
eingeben (z.B. Alter) → „Statistik“ → gewünschte Statistiken eingeben (z.B.7 Mittelwert,
Varianz...)
→ „Diagramme“ → gewünschtes Diagramm eingeben

Beispiel:
Anzahl der Geschwister
N                    Gültig      1505
                     Fehlend     12
Mittelwert                       3,93
Median                           3,00
Standardabweichung               3,05
Varianz                          9,28

2. Möglichkeit: (leichter und übersichtlicher Vergleich von Mittelwerten, Varianzen...
bezüglich Kategorien) ohne Diagramme

Beispiel: Welchen Mittelwert, welche Varianz... hat die Variable Alter separat dargestellt
nach der Variable Geschlecht?

Befehl: „Analysieren“ → „Mittelwerte vergleichen“ → “Mittelwerte...“ → in „unabgängige
Variable“ kommt die Breakvariable (hier: Geschlecht) → in „abhängige Variable“ kommt
jene Variable, deren Statistiken (Mittelwert...) ausgerechnet werden soll (hier Alter) →
„Optionen“ → gewünschte statistische Kennwerte hinzufügen → „weiter“ → „ok“

Bericht
alter
Geschlecht   Mittelwert   Standardabweichung   Varianz   Median
männlich     24,15        6,14                 37,757    22,00
weiblich     21,65        3,97                 15,743    20,00
Insgesamt    22,04        4,46                 19,928    21,00

3. Möglichkeit: (über Tabellen)

Befehl: „Analysieren“ → „Tabellen“ → „einfache Tabellen“ → die gewünschte Variable(n)
in das Feld „Auswerten“ geben → „Statistik“ → die gewünschten statistischen Kennwerte
(zB: Mittelwert, Median, Varianz..) „hinzufügen“ (eventuell das „Format“ „ändern“, um
Dezimalzahlen anzuzeigen).

Beispiel:

                   Mittelwert Median Standardabweichung Varianz
Anzahl Geschwister 3,932      3,000 3,047               9,282

                                                  13
 Matthias Gabriel

4. Möglichkeit: (eher für Intervallskalierte Daten, ohne Median, Modalwert...)

Befehl: „Analysieren“ → „deskriptive Statistiken“ → „deskriptive Statistiken...“ →
Variable(n) eingeben → „Optionen“ → gewünschte Statistiken auswählen

Beispiel:

                            N    Mittelwert Standardabweichung Varianz
Anzahl Geschwister          1505 3,93       3,05               9,282
Gültige Werte (Listenweise) 1505

2.3 Diagramme

Definitionen:
    • Balkendiagramm: gibt pro Balken die Werte einer Ausprägung (z.B.: Mann/Frau)
        einer Variable (z.B.: Geschlecht) an.
    • Kreisdiagramm: ein „Kuchen“ dessen „Kuchenstücke“ die verschiedenen
        Ausprägungen darstellen (z.B.: Anzahl der Studiensemester). Desto mehr Personen in
        eine Kategorie fallen (z.B.: erstes Semester) desto größer ist dieses Kuchenstück.
    • Histogramm: (Vergleich: Häufigkeitsklassen) Verwendung: bei stetigen(!) Variablen,
        wenn die Variable in Klassen gegliedert ist oder in Klassen abgebildet werden soll
        (z.B.: Körpergröße, Klassen: 151-160cm, 161-170cm,...)
    • Streudiagramm: (XY-Diagramm) Jeder Punkt im Diagramm hat einen X und einen Y
        Koordinate. Dadurch ergibt sich eine Punktwolke. Verwendung: z.B.: Regression,
        Korrelation, Modellkontrolle Rasch Modell
    • Liniendiagramm: gibt eine Gerade/Kurve/Funktion an. Verwendung z.B.: bei
        Einkommen, Alter, Körpergröße, Konzentrationskoeffizienten...

Befehl: → „Grafiken“ → gewünschten Diagrammtyp (Balken, Kreis...) auswählen

Beispiel 1: Balkendiagramm
Wie viele Kinder haben männliche bzw. weibliche befragte Personen im Durchschnitt?
Lösung: Darstellung mittels Balkendiagramm mit a) Kategorienvariable: Geschlecht b)
auszuwertende Variable: durchschnittliche Anzahl der Kinder (Mittelwert)
Befehl: → „Grafiken“ → „Balken...“ → „einfach“ und „Auswertung über Kategorien einer
Variable“ (weil hier nur Kategorien der einen Variable Geschlecht gefragt sind. Für die
Abbildung mehrerer Variablen in einem Diagramm → „Auswertung über verschiedene
Variablen“ wählen) → „definieren“ → in „Kategorienachse“ Geschlecht hinzufügen → bei
„Bedeutung der Balken“ „andere Auswertefunktion“ wählen (weil der Mittelwert der Anzahl
der Kinder gefragt ist und nicht die Häufigkeit bzw. Anzahl der Fälle) → gewünschte
auszuwertende Variable hinzufügen (hier Anzahl der Kinder) → „Auswertefunktion“ →
„Mittelwert“ wählen → „weiter“ → „ok“

                                             14
 Matthias Gabriel

Ergebnis:

                              2,2

                              2,1

                              2,0

                              1,9
  Mittelwert Anzahl Kinder

                              1,8

                              1,7

                              1,6

                              1,5
                                                             Männlich                                  Weiblich

                                     Geschlecht

Die durchschnittliche Anzahl der Kinder überwiegt bei den Frauen (ca. 2,1) im Vergleich zu
den Männern (ca 1,6).

Variationen:
   • Häufigkeiten oder Prozente der Ausprägungen einer Variablen angeben (z.B.: Wie
       viele Männer/Frauen) → „Anzahl der Fälle“ oder „%der Fälle“ wählen statt „andere
       Auswertefunktion“
   • Fehlende Werte anzeigen (als eigenen Balken) → „Optionen“
   • Diagrammtitel → „Titel“
   • Varianz, Median, Standardabweichung... → „andere Auswertefunktion“ (wie bei
       Mittelwert)

Anmerkung: Die Darstellung von Kreis-, Linien-, Flächendiagramm erfolgt fast äquivalent.

Beispiel 2: Histogramm
Nur sinnvoll bei (quantitativen) Variablen, die eine Klassenbildung benötigen, um
zusammengefasst zu werden (z.B: Alter, Körpergröße, Gewicht, (Punkte in einem Test)...)
Nicht bei qualitativen Variablen!
Frage: Wie sieht die Verteilung der Variable „Alter“ aus?
Eine Abbildung des Alters mit jedem Alter (Jahr) als eigene Kategorie bei einer Stichprobe
von z.B:15 bis 70 jährigen wäre nicht sinnvoll und überhaupt nicht überschaubar.
Lösung: Altersklassen bilden und Histogramm erstellen
 Befehl: → „Grafiken“ → „Histogramm“ → in „Variable“ die gewünschte Variable
einfügen (hier: Alter) → „ok“
 300

 200

 100

                                                                                                                  Std.abw. = 4,45
                                                                                                                  Mittel = 22,0

          0                                                                                                       N = 419,00
                             20,0           25,0          30,0          35,0          40,0          45,0
                                     22,5          27,5          32,5          37,5          42,5          47,5

                             alter

Die Verteilung des Alters in diesem Beispiel ist nicht normalverteilt, die Klasse 19-21jährige
beinhaltet den Großteil der Stichprobe.

Variationen:
   • „Normalverteilungskurve (dazu) anzeigen“

Anmerkung: Die Klassen werden in der Regel automatisch gebildet.

                                                                                                                                    15
Sie können auch lesen