Ein Quartil ist eine Art Quantil. Das erste Quartil ( Q 1 ) ist definiert als die mittlere Zahl zwischen der kleinsten Zahl und dem Median des Datensatzes. Das zweite Quartil ( Q 2 ) ist der Median der Daten. Das dritte Quartil ( Q 3 ) ist der mittlere Wert zwischen dem Median und dem höchsten Wert des Datensatzes.
In Anwendungen von Statistiken wie Epidemiologie, Soziologie und Finanzen sind die Quartile einer Reihe von Datenwerten die vier Teilmengen, deren Grenzen die drei Quartilpunkte sind. So kann ein einzelner Gegenstand als "im oberen Viertel" bezeichnet werden.
Definitionen [ edit ]
| Symbol | Namen | Definition |
|---|---|---|
| Q 1 | spaltet die niedrigsten 25% der Daten von den höchsten 75% ab | |
| Q 2 |
| halbiert den Datensatz |
| Q 3 |
| spaltet die höchsten 25% der Daten von den niedrigsten 75% ab |
Rechenmethoden [ edit ]
Für diskrete Verteilungen besteht keine allgemein gültige Vereinbarung über die Auswahl der Quartilwerte. [1]
Methode 1 [ edit ]]
- Verwenden Sie den Median, um den geordneten Datensatz in zwei Hälften zu unterteilen.
- Wenn eine ungerade Anzahl von Datenpunkten im ursprünglich geordneten Datensatz enthalten ist, darf der Median (der zentrale Wert in der geordneten Liste) nicht in der einen Hälfte enthalten sein.
- Falls vorhanden Bei einer geraden Anzahl von Datenpunkten im ursprünglich geordneten Datensatz wird dieser Datensatz genau in zwei Hälften geteilt.
- Der untere Quartilwert ist der Median der unteren Hälfte der Daten. Der Wert des oberen Quartils ist der Median der oberen Hälfte der Daten.
Diese Regel wird vom Taschenrechner-Plot des TI-83 und von "1-Var Stats" -Funktionen verwendet.
Methode 2 [ edit ]
- Verwenden Sie den Median, um den geordneten Datensatz in zwei Hälften zu teilen.
- Wenn der ursprünglich geordnete Datensatz eine ungerade Anzahl von Datenpunkten enthält, dann den Median (den zentralen Wert in der geordneten Liste) in beiden Hälften.
- Wenn es eine gerade Zahl gibt von Datenpunkten im ursprünglich geordneten Datensatz, teilen Sie diesen Datensatz genau in zwei Hälften.
- Der untere Quartilwert ist der Median der unteren Hälfte der Daten. Der obere Quartilwert ist der Median der oberen Hälfte der Daten.
Die mit dieser Methode ermittelten Werte werden auch als "Tukeys Scharniere" bezeichnet; [2] siehe auch Midhinge.
Methode 3 [ edit ]
- Wenn es eine gerade Anzahl von Datenpunkten gibt, ist Methode 3 die gleiche wie oben, da der Median kein einzelnes Datum ist. [19659017Wennes(4 n +1) Datenpunkte gibt, dann beträgt das untere Quartil 75% des n ten Datenwerts plus 25% des ( n [19459007)] +1) Datenwert; Das obere Quartil beträgt 25% des (3 n +1) -ten Datenpunkts plus 75% des (3 n +2) -ten Datenpunktes.
- Falls vorhanden (4 n +3) Datenpunkte, dann beträgt das untere Quartil 75% des (19459006] n + 1) ten Datenwerts plus 25% des ( n [19459007)] +2) Datenwert; das obere Quartil beträgt 25% des (3 n +2) -ten Datenpunkts plus 75% des (3 n +3) -ten Datenpunkts.
Dies gibt immer das arithmetische Mittel der Methoden 1 und 2; Dadurch wird sichergestellt, dass der Medianwert korrekt gewichtet wird, und die Quartilwerte ändern sich so reibungslos wie möglich, wenn zusätzliche Datenpunkte hinzugefügt werden.
Beispiel 1 [ edit ]
Auftragsdatensatz: 6, 7, 15, 36, 39, 40, 41, 42, 43, 47, 49
| Methode 1 | Methode 2 | Methode 3 | |
|---|---|---|---|
| Q 1 | 15 | 25.5 | 20,25 |
| Q 2 | 40 | 40 | 40 |
| Q 3 | 43 | 42,5 | 42,75 |
Beispiel 2 [ edit ]
Auftragsdatensatz: 7, 15, 36, 39, 40, 41
Da es eine gerade Anzahl von Datenpunkten gibt, liefern alle drei Methoden die gleichen Ergebnisse.
| Methode 1 | Methode 2 | Methode 3 | |
|---|---|---|---|
| Q 1 | 15 | 15 | 15 |
| Q 2 | 37,5 | 37,5 | 37,5 |
| Q 3 | 40 | 40 | 40 |
Ausreißer [ edit ]
Es gibt Methoden, mit denen nach Ausreißern in der Disziplin Statistik und statistische Analyse gesucht werden kann. Wie die Grundidee der deskriptiven Statistik, müssen wir bei einem Ausreißer diesen Wert durch weitere Analyse der Ursache oder des Ursprungs des Ausreißers erklären. Bei extremen Beobachtungen, die nicht selten vorkommen, müssen die typischen Werte analysiert werden. Im Falle von Quartilen kann der Interquartilbereich (IQR) zur Charakterisierung der Daten verwendet werden, wenn Extremitäten vorhanden sein können, die die Daten verzerren; Der Interquartilsabstand ist eine relativ robuste Statistik (manchmal auch als "Widerstand" bezeichnet), verglichen mit dem Bereich und der Standardabweichung. Es gibt auch eine mathematische Methode, um auf Ausreißer zu prüfen und "Zäune", obere und untere Grenzen zu bestimmen, von denen aus nach Ausreißern gesucht werden soll.
Nachdem das erste und das dritte Quartil und der Interquartilbereich wie oben beschrieben bestimmt wurden, werden die Zäune nach folgender Formel berechnet:
wobei Q 1 und Q 3 3 das erste und dritte Quartil sind, beziehungsweise. Der untere Zaun ist die "untere Grenze" und der obere Zaun ist die "obere Grenze" der Daten, und alle Daten, die außerhalb dieser definierten Grenzen liegen, können als Ausreißer betrachtet werden. Alles unter dem unteren Zaun oder über dem oberen Zaun kann als solcher Fall betrachtet werden. Die Zäune bieten eine Richtlinie zur Definition eines Ausreißers, die auf andere Weise definiert werden kann. Die Zäune definieren einen "Bereich", außerhalb dessen ein Ausreißer existiert; Eine Möglichkeit, sich dies vorzustellen, ist die Begrenzung eines Zauns, außerhalb dessen Außenseiter im Gegensatz zu Ausreißern stehen.
No comments:
Post a Comment