Bei der Analyse einer Datenreihe kann es vorkommen, dass man auf Werte stößt, die einem nicht in die Normalverteilung der Daten zu passen scheinen. Diese Punkte nennt man Ausreißer und wie üblich sollte man sich nicht immer auf seine Intuition verlassen, um erkennen zu können, ob ein Wert ein Ausreißer ist oder nicht, es gibt Tests, mit denen man sie aufdecken kann und Statistiksoftware wie Ellistat um Ihnen bei den Berechnungen zu helfen.
Aus statistischer Sicht ist ein Ausreißer ein Wert, der nicht zur Normalverteilung der Daten gehört. Er kann entstehen durch
- Mess- oder Kopierfehler (Komma vergessen)
- Von einer besonderen Ursache wie einem Stück, das vor dem Messen nicht gewaschen wurde.
Alle statistischen Berechnungen, die die Eigenschaften der Normalverteilung nutzen (statistische Tests, Fähigkeitsberechnung, Berechnung von % außerhalb der Toleranz), sind sehr anfällig für Ausreißer. Daher sollten Sie deren Ursprung verstehen und sie eliminieren, bevor Sie diese Berechnungen anwenden. Eventuell können auch nichtparametrische statistische Tests verwendet werden, die weit weniger anfällig für Ausreißer sind.
Es werden hauptsächlich zwei Tests verwendet:
- Test von Dixon : sehr interessant, wenn die Anzahl der Daten gering ist (<30)
- Grubbs Test : Kann in jedem Fall verwendet werden.
Test von Dixon
- b = Der Gesamtumfang der Maßnahmen (hier 14.1)
- a = Der Abstand zwischen der Münze, von der vermutet wird, dass sie ein Ausreißer ist, und ihrem nächsten Nachbarn (hier 8.6)
Das Verhältnis wird in % berechnet.
Anschließend vergleicht man diesen Bericht mit der Tabelle von Dixon :
Anzahl der Münzen | 3 | 5 | 10 | 16 | 20 | 30 |
Maximales Verhältnis | 0.94 | 0.72 | 0.46 | 0.38 | 0.34 | 0.30 |
Wenn der Wert unter dem maximalen Verhältnis liegt, das die Tabelle vorschlägt, dann ist der Wert nicht abwegig. Hier ist das Verhältnis von 62% für 5 Münzen kleiner als 72%. Der Punkt ist also kein Ausreißer.
Grubb's Test
Um den Grubb-Test zu verwenden, berechnet man in einem ersten Schritt :
- X: Der Durchschnitt aller Messungen
- S: Die Standardabweichung aller Messungen
- G: Abstand zwischen dem Wert, von dem vermutet wird, dass er ein Ausreißer ist, und dem Mittelwert G.
G=frac{Wert - X}{S}
G_{limite}=\frac{N-1}{\sqrt{N}}.\sqrt{\frac{t^2_{\frac{a}{N},N-2}{}}{N-2 +t^2{}_{\frac{a}{n}}{,} N-2}}
Wenn G>G Grenze wird der Wert als Ausreißer betrachtet und umgekehrt.