Median

Aus BS-Wiki: Wissen teilen
Version vom 15. September 2008, 14:01 Uhr von Dg (Diskussion | Beiträge) (Die Seite wurde neu angelegt: Der '''Median''' (oder ''Zentralwert'') halbiert eine Verteilung, darf aber nicht mit dem Mittelwert verwechselt werden. == Median einer Stichprobe == Der Media...)
(Unterschied) nächstältere Version→ | Aktuelle Version (Unterschied) | ←nächstjüngere Version (Unterschied)
Wechseln zu: Navigation, Suche

Der Median (oder Zentralwert) halbiert eine Verteilung, darf aber nicht mit dem Mittelwert verwechselt werden.


Median einer Stichprobe

Der Median m ist der Wert einer Stichprobe, wenn höchstens die Hälfte der Beobachtungen in der Stichprobe einen Wert Fehler beim Parsen (Das texvc-Programm ist nicht installiert. Weitere Infos in math/README.):

und höchstens die Hälfte einen Wert Fehler beim Parsen (Das texvc-Programm ist nicht installiert. Weitere Infos in math/README.): 
hat.

Sortiert man die Beobachtungswerte der Größe nach („geordnete Stichprobe“), so ist der Median bei einer ungeraden Anzahl von Beobachtungen der Wert der in der Mitte dieser Folge liegenden Beobachtung. Bei einer geraden Anzahl von Beobachtungen gibt es kein einziges mittleres Element, sondern zwei. Hier sind die Werte der beiden mittleren Beobachtungen sowie alle Werte dazwischen (obwohl diese bei keiner Beobachtung aufgetreten sind) ein Median der Stichprobe, da für alle diese Werte obige Bedingung zutrifft.

Bei kardinal skalierten Messgrößen (wenn es also sinnvoll möglich ist, die Differenz von Messwerten zu berechnen) verwendet man im Falle einer geraden Anzahl Beobachtungen meist das arithmetische Mittel der beiden mittleren Beobachtungswerte. Der Median Fehler beim Parsen (Das texvc-Programm ist nicht installiert. Weitere Infos in math/README.):

einer geordneten Stichprobe Fehler beim Parsen (Das texvc-Programm ist nicht installiert. Weitere Infos in math/README.): 
von Fehler beim Parsen (Das texvc-Programm ist nicht installiert. Weitere Infos in math/README.): 
Messwerten ist dann also
Fehler beim Parsen (Das texvc-Programm ist nicht installiert. Weitere Infos in math/README.):


Oft möchte man dagegen sicherstellen, dass der Median in jedem Fall eines der Elemente der Stichprobe sein soll. In diesem Fall wird alternativ zu dieser Definition bei einer geraden Anzahl von Elementen entweder der Untermedian Fehler beim Parsen (Das texvc-Programm ist nicht installiert. Weitere Infos in math/README.):

oder der Obermedian Fehler beim Parsen (Das texvc-Programm ist nicht installiert. Weitere Infos in math/README.): 
genutzt und als Median bezeichnet.

Diese Medianbestimmung spielt beispielsweise bei Datenbanksystemen eine große Rolle, wie z. B. bei SELECT-Abfragen mittels des Medians der Mediane.

Eigenschaften

Der Median Fehler beim Parsen (Das texvc-Programm ist nicht installiert. Weitere Infos in math/README.): , und im Fall einer geraden Anzahl von Messwerten alle Werte Fehler beim Parsen (Das texvc-Programm ist nicht installiert. Weitere Infos in math/README.):

mit Fehler beim Parsen (Das texvc-Programm ist nicht installiert. Weitere Infos in math/README.): 

, minimieren die Summe der absoluten Abweichungen, das heißt für Fehler beim Parsen (Das texvc-Programm ist nicht installiert. Weitere Infos in math/README.):

gilt
Fehler beim Parsen (Das texvc-Programm ist nicht installiert. Weitere Infos in math/README.):


Beispiele

  • Messwerte 1, 2, 4, 5, 18: ungerade Anzahl. Der Median (auch der Ober- und Untermedian) ist der Wert an der mittleren Stelle, also 4. Das arithmetische Mittel ist 6.
  • Messwerte 1, 1, 2, 3, 4, 37: gerade Anzahl. Der Median ist die Hälfte der Summe der beiden mittleren Zahlen, also ½ (2 + 3), also 2,5. Der Obermedian ist 3, und der Untermedian 2. Das arithmetische Mittel ist 8.
  • Messwerte 1, 3, 3, 3: gerade Anzahl. Der Median ist ½ (3 + 3), also 3. Der Ober- und der Untermedian sind ebenfalls 3. Das arithmetische Mittel ist 2,5.

Median einer Verteilung

Dichtefunktion einer Dreiecksverteilung mit Median

Eine Verallgemeinerung des Begriffes liefert die stochastische Betrachtung einer Zufallsvariable Fehler beim Parsen (Das texvc-Programm ist nicht installiert. Weitere Infos in math/README.):

bzw. deren Verteilungsfunktion Fehler beim Parsen (Das texvc-Programm ist nicht installiert. Weitere Infos in math/README.): 

. Dort ist der Median das 0,5-Quantil, also

Fehler beim Parsen (Das texvc-Programm ist nicht installiert. Weitere Infos in math/README.):


Übertragen auf die oben genannte Stichprobe wäre nach dieser Definition der Median vergleichbar mit dem dort erwähnten Obermedian.

Er ist, neben beispielsweise Erwartungswert, Modus, ein Lageparameter.

Beispiel

Bei der Dreiecksverteilung

Fehler beim Parsen (Das texvc-Programm ist nicht installiert. Weitere Infos in math/README.):


ist der Median der Fehler beim Parsen (Das texvc-Programm ist nicht installiert. Weitere Infos in math/README.): -Wert, welcher die Fläche

Fehler beim Parsen (Das texvc-Programm ist nicht installiert. Weitere Infos in math/README.):


unter der Dichtefunktion in zwei gleich große Flächen teilt. Dieser Wert wird somit durch die Gleichung

Fehler beim Parsen (Das texvc-Programm ist nicht installiert. Weitere Infos in math/README.):


bestimmt. Für deren Lösung Fehler beim Parsen (Das texvc-Programm ist nicht installiert. Weitere Infos in math/README.):

gilt damit Fehler beim Parsen (Das texvc-Programm ist nicht installiert. Weitere Infos in math/README.): 

.

D.h. in diesem Beispiel ist der Median Fehler beim Parsen (Das texvc-Programm ist nicht installiert. Weitere Infos in math/README.):

nicht identisch mit dem Erwartungswert Fehler beim Parsen (Das texvc-Programm ist nicht installiert. Weitere Infos in math/README.): 

.

Median von gruppierten Daten

Vor allem in den Sozialwissenschaften wird bei Statistiken häufig der Median geschätzt, da nicht alle Daten explizit und exakt gegeben sind, sondern jene nur in Intervallen gruppiert vorliegen. So wird beispielsweise bei Umfragen selten nach dem exakten Gehalt gefragt, sondern nur nach der Einkommensklasse, also dem Bereich, in welchem das Gehalt liegt. Die Berechnungsvorschrift für diese Schätzung unterscheidet sich deswegen von der oben vorgestellten exakten Berechnung des Medians.

Es seien Fehler beim Parsen (Das texvc-Programm ist nicht installiert. Weitere Infos in math/README.):

die Anzahl aller Daten, Fehler beim Parsen (Das texvc-Programm ist nicht installiert. Weitere Infos in math/README.): 
die jeweilige Anzahl der Daten der Fehler beim Parsen (Das texvc-Programm ist nicht installiert. Weitere Infos in math/README.): 

-ten Gruppe und Fehler beim Parsen (Das texvc-Programm ist nicht installiert. Weitere Infos in math/README.):

bzw. Fehler beim Parsen (Das texvc-Programm ist nicht installiert. Weitere Infos in math/README.): 
die entsprechenden oberen bzw. unteren Intervallgrenzen.

Zunächst wird nun die mediane Klasse (oder mediane Gruppe) bestimmt, d. h. diejenige Gruppe, in welche der Median (nach obiger, konventioneller Definition) hineinfällt, z. B. die Fehler beim Parsen (Das texvc-Programm ist nicht installiert. Weitere Infos in math/README.): -te Gruppe. Wenn keine weiteren Angaben über die Verteilung der Daten gegeben sind, wird z. B. Gleichverteilung postuliert, sodass man sich der linearen Interpolation als Hilfsmittel bedienen kann, um eine Schätzung des Medians der gruppierten Daten zu erhalten:

Fehler beim Parsen (Das texvc-Programm ist nicht installiert. Weitere Infos in math/README.):


Im Gegensatz zur konventionellen Definition des Medians muss dieser nicht zwangsläufig ein Element aus der tatsächlichen Datenmenge sein, welche in aller Regel nicht bekannt ist.

Beispiel

Einkommen:

Klasse (Fehler beim Parsen (Das texvc-Programm ist nicht installiert. Weitere Infos in math/README.):

)

Bereich (Fehler beim Parsen (Das texvc-Programm ist nicht installiert. Weitere Infos in math/README.):
bis Fehler beim Parsen (Das texvc-Programm ist nicht installiert. Weitere Infos in math/README.): 

)

Gruppengröße (Fehler beim Parsen (Das texvc-Programm ist nicht installiert. Weitere Infos in math/README.):

)

1 mind. 0, weniger als 1500 160
2 mind. 1500, weniger als 2500 320
3 mind. 2500, weniger als 3500 212

Man berechne

Fehler beim Parsen (Das texvc-Programm ist nicht installiert. Weitere Infos in math/README.):


Also liegt der Median in der 2. Klasse (d. h. Fehler beim Parsen (Das texvc-Programm ist nicht installiert. Weitere Infos in math/README.): ), da die erste Klasse nur 160 Elemente umfasst. Somit ergibt sich als Schätzung für den Median

Fehler beim Parsen (Das texvc-Programm ist nicht installiert. Weitere Infos in math/README.):


Eine Veranschaulichung dieses Verfahrens zur Festlegung des Medians bei gruppierten Daten ist die grafische Ermittlung mit Hilfe der Summenkurve. Hier wird der Abszissenwert Fehler beim Parsen (Das texvc-Programm ist nicht installiert. Weitere Infos in math/README.):

gesucht, der zum Ordinatenwert Fehler beim Parsen (Das texvc-Programm ist nicht installiert. Weitere Infos in math/README.): 
gehört. Bei kleinerem und geradem Fehler beim Parsen (Das texvc-Programm ist nicht installiert. Weitere Infos in math/README.): 
kann auch stattdessen der Ordinatenwert Fehler beim Parsen (Das texvc-Programm ist nicht installiert. Weitere Infos in math/README.): 
gewählt werden.

Vorteile des Medians

Durch seine Resistenz gegen Ausreißer eignet sich der Median besonders gut als Lageparameter für nicht normalverteilte Grundgesamtheiten.

Beispiel:

Die Einkommen einer Gruppe von 10 Personen verteilen sich wie folgt:

  • 9 Personen verdienen jeweils EUR 1.000 und
  • 1 Person verdient EUR 1.000.000.

Das Durchschnittseinkommen beträgt EUR 100.900, der Median jedoch nur EUR 1.000.

Alternativen

Eine Alternative zum Median bei der Ermittlung des Masseneinkommens aus einer gegebenen Einkommensverteilung ist die von Amartya Sen vorgeschlagene Wohlfahrtsfunktion.

Siehe auch

Vorlage:Wiktionary

Weblinks

Ausführliche Erläuterungen zur Berechnung des Medians auf dem „Fußweg“:

Wikibooks und Statscan