6.2.2.2.1 Methode der CHAID-Analyse
Die CHAID-Analyse teilt eine Menge von Objekten in homogene Gruppen anhand eines Kriteriums ein. Dieses Kriterium wird durch eine abhängige Variable vorgegeben. Mit Hilfe des Chi-Quadrat-Tests wählt CHAID aus einem vorhandenen Datensatz jeweils die Variable auf dem Signifikanzniveau von mindestens 5 % aus (p < 0,05), die den statistisch stärksten Zusammenhang aufweist und erklärt damit die abhängige Variable. Das Programm geht bei der Segmentierung folgendermaßen vor:
1. Gruppenbildung innerhalb der erklärenden Variablen,
2. Auswahl der Variablen zur Unterteilung des CHAID-Baums,
3. Unterteilung des Baums auf der nächsten Ebene,
4. Ende der CHAID-Analyse (entweder zu geringe Mindestgröße des Segments oder die vorgegebene Anzahl der Ebenen im CHAID-Baum wurde erreicht).
Die Vorgänge 2. und 3. wiederholen sich solange bis ein Abbruchkriterium zum Ende der CHAID-Analyse führt.
Der Chi-Quadrat-Test ermittelt dabei die Wahrscheinlichkeit mit der sich ein beobachteter Zusammenhang auch zufällig ergeben kann, wenn dieser in der Grundgesamtheit nicht besteht. Um so weniger Freiheitsgrade der Chi-Quadrat-Test ausweist, desto geringer ist die Wahrscheinlichkeit, daß sich ein hoher Chi-Quadrat-Wert zufällig ergibt und desto höher ist die Wahrscheinlichkeit eines nicht zufälligen Zusammenhangs. Deshalb läßt der Chi-Quadrat-Test bei kleineren Kreuztabellen eindeutigere Aussagen zu. Die CHAID-Analyse nutzt den Zusammenhang der kleinen Kreuztabellen und der damit höheren statistischen Aussagekraft sehr stark aus. Auch der Nutzer der CHAID-Analyse kann sich diesen Zusammenhang durch das Zusammenfassen von Daten zu Kategorien zunutze machen.
|