Median: Unterschied zwischen den Versionen

Aus BS-Wiki: Wissen teilen
Wechseln zu: Navigation, Suche
(Die Seite wurde neu angelegt: Der '''Median''' (oder ''Zentralwert'') halbiert eine Verteilung, darf aber nicht mit dem Mittelwert verwechselt werden. == Median einer Stichprobe == Der Media...)
 
Zeile 4: Zeile 4:
 
== Median einer Stichprobe ==
 
== Median einer Stichprobe ==
  
Der Median <i>m</i> ist der Wert einer [[Stichprobe]], wenn höchstens die Hälfte der Beobachtungen in der Stichprobe einen Wert <math> < m </math> und höchstens die Hälfte einen Wert <math> > m </math> hat.
+
Der Median <i>m</i> ist der Wert einer [[Stichprobe]], wenn höchstens die Hälfte der Beobachtungen in der Stichprobe einen Wert <i> < m </i> und höchstens die Hälfte einen Wert <i> > m </i> hat.
  
Sortiert man die Beobachtungswerte der Größe nach („geordnete Stichprobe“), so ist der Median bei einer ungeraden Anzahl von Beobachtungen der Wert der in der Mitte dieser [[Folge (Mathematik)|Folge]] liegenden Beobachtung. Bei einer geraden Anzahl von Beobachtungen gibt es kein einziges mittleres Element, sondern zwei. Hier sind die Werte der beiden mittleren Beobachtungen sowie alle Werte dazwischen (obwohl diese bei keiner Beobachtung aufgetreten sind) ein Median der Stichprobe, da für alle diese Werte obige Bedingung zutrifft.
+
Sortiert man die Werte der Größe nach („geordnete Stichprobe“), so ist der Median bei einer ungeraden Werteanzahl der Wert der in der Mitte dieser Folge, egal wie hoch der rechnerische [[Mittelwert]] ist.
  
Bei [[Intervallskala|kardinal skalierten]] Messgrößen (wenn es also sinnvoll möglich ist, die Differenz von Messwerten zu berechnen) verwendet man im Falle einer geraden Anzahl Beobachtungen meist das arithmetische Mittel der beiden mittleren Beobachtungswerte. Der Median <math>\tilde x</math> einer geordneten Stichprobe <math>(x_1, x_2, \dots, x_n)</math> von <math>n</math> Messwerten ist dann also
+
Bei einer geraden Werteanzahl gibt es zwei mittlere Elemente.leren Beobachtungen sowie alle Werte dazwischen (obwohl diese bei keiner Beobachtung aufgetreten sind) ein Median der Stichprobe, da für alle diese Werte obige Bedingung zutrifft.
 
 
:<math>\tilde x =\begin{cases}
 
  x_\frac{n+1}{2}                                    & n\text{ ungerade}\\
 
  \frac 12\left(x_{\frac n2} + x_{\frac n2+1}\right) & n \text{ gerade.}
 
\end{cases}
 
</math>
 
 
 
Oft möchte man dagegen sicherstellen, dass der Median in jedem Fall eines der Elemente der Stichprobe sein soll. In diesem Fall wird alternativ zu dieser Definition bei einer geraden Anzahl von Elementen entweder der ''Untermedian'' <math>\tilde x_u = x_\frac{n}{2}</math> oder der ''Obermedian'' <math>\tilde x_o = x_{\frac{n}{2}+1}</math> genutzt und als ''Median'' bezeichnet.
 
 
 
Diese Medianbestimmung spielt beispielsweise bei [[Datenbanksystem]]en eine große Rolle, wie z. B. bei [[SQL#Abfrage: SELECT|SELECT-Abfragen]] mittels des Medians der Mediane.
 
 
 
=== Eigenschaften ===
 
 
 
Der Median <math>\tilde x</math>, und im Fall einer geraden Anzahl von Messwerten alle Werte <math>\tilde x</math> mit <math>\tilde{x}_u \le \tilde x \le \tilde{x}_o</math>, minimieren die Summe der absoluten Abweichungen, das heißt für <math>1 \le k \le n</math> gilt
 
 
 
:<math>\sum_{i=1}^n |\tilde x - x_i| \le \sum_{i=1}^n |x_k - x_i|.</math>
 
  
 
=== Beispiele ===
 
=== Beispiele ===
  
* Messwerte 1, 2, 4, 5, 18: ungerade Anzahl. Der Median (auch der Ober- und Untermedian) ist der Wert an der mittleren Stelle, also 4. Das arithmetische Mittel ist 6.
+
* Messwerte 1, 2, {{Mark|'''4'''}}, 5, 18: ungerade Anzahl. Der Median ist der Wert an der mittleren Stelle, also 4. Das arithmetische Mittel dagegen beträgt 6.
* Messwerte 1, 1, 2, 3, 4, 37: gerade Anzahl. Der Median ist die Hälfte der Summe der beiden mittleren Zahlen, also ½ (2 + 3), also 2,5. Der Obermedian ist 3, und der Untermedian 2. Das arithmetische Mittel ist 8.
+
* Messwerte 1, 1, 2, 3, 4, 37: gerade Anzahl. Der Median ist die Hälfte der Summe der beiden mittleren Zahlen, also ½ (2 + 3), also 2,5. Das arithmetische Mittel ist 8.
* Messwerte 1, 3, 3, 3: gerade Anzahl. Der Median ist ½ (3 + 3), also 3. Der Ober- und der Untermedian sind ebenfalls 3. Das arithmetische Mittel ist 2,5.
+
* Messwerte 1, 3, 3, 3: gerade Anzahl. Der Median ist ½ (3 + 3), also 3. Das arithmetische Mittel ist 2,5.
 
 
== Median einer Verteilung ==
 
 
 
[[Bild:BäckereiMed.png|300px|thumb|Dichtefunktion einer Dreiecksverteilung mit Median]]
 
 
 
Eine Verallgemeinerung des Begriffes liefert die [[Stochastik|stochastische]] Betrachtung einer [[Zufallsvariable]] <math>X</math> bzw. deren [[Verteilungsfunktion]] <math>F</math>. Dort ist der Median das 0,5-[[Quantil]], also
 
 
 
:<math>\inf\{x\in\R:F(x) \ge \frac 12\}.</math>
 
 
 
Übertragen auf die oben genannte Stichprobe wäre nach dieser Definition der Median vergleichbar mit dem dort erwähnten ''Obermedian''.
 
 
 
Er ist, neben beispielsweise [[Erwartungswert]], [[Modus (Statistik)|Modus]], ein [[Lageparameter]].
 
 
 
=== Beispiel ===
 
 
 
Bei der [[Dreiecksverteilung]]
 
 
 
:<math>f(x) = \frac x{18},\quad 0 \le x \le 6,</math>
 
 
 
ist der Median der <math>x</math>-Wert, welcher die Fläche
 
 
 
:<math>F(x)=\frac 12\cdot x\cdot\frac{x}{18}</math>
 
 
 
unter der [[Dichtefunktion]] in zwei gleich große Flächen teilt. Dieser Wert wird somit durch die Gleichung
 
 
 
:<math>F(m)=\frac 12\cdot m\cdot\frac{m}{18}=\frac 12</math>
 
 
 
bestimmt. Für deren Lösung <math>m=\sqrt{18}\approx 4{,}24</math> gilt damit <math>P(X \le 4{,}24) \approx 0{,}5</math>.
 
 
 
D.h. in diesem Beispiel ist der Median <math>m</math> nicht identisch mit dem Erwartungswert <math>E(X)=4</math>.
 
 
 
== Median von gruppierten Daten ==
 
 
 
Vor allem in den [[Sozialwissenschaft]]en wird bei Statistiken häufig der Median geschätzt, da nicht alle Daten explizit und exakt gegeben sind, sondern jene nur in [[Intervall (Mathematik)|Intervallen]] gruppiert vorliegen. So wird beispielsweise bei [[Umfrage]]n selten nach dem exakten Gehalt gefragt, sondern nur nach der Einkommensklasse, also dem Bereich, in welchem das Gehalt liegt. Die Berechnungsvorschrift für diese [[Schätzung]] unterscheidet sich deswegen von der oben vorgestellten exakten Berechnung des Medians.
 
 
 
Es seien <math>n</math> die Anzahl ''aller'' Daten, <math>n_i</math> die jeweilige Anzahl der Daten der <math>i</math>-ten Gruppe und <math>u_i</math> bzw. <math>o_i</math> die entsprechenden oberen bzw. unteren Intervallgrenzen.
 
 
 
Zunächst wird nun die ''mediane Klasse'' (oder ''mediane Gruppe'') bestimmt, d.&nbsp;h. diejenige Gruppe, in welche der Median (nach obiger, konventioneller Definition) hineinfällt, z.&nbsp;B. die <math>m</math>-te Gruppe. Wenn keine weiteren Angaben über die [[Wahrscheinlichkeitsverteilung|Verteilung]] der Daten gegeben sind, wird z.&nbsp;B. [[Gleichverteilung]] postuliert, sodass man sich der [[Lineare Interpolation|linearen Interpolation]] als Hilfsmittel bedienen kann, um eine Schätzung des Medians der gruppierten Daten zu erhalten:
 
 
 
:<math>x_{med} = u_m+\frac{\frac n2 - \sum\limits_{k=1}^{m-1}n_k}{n_m} \cdot (o_m-u_m).</math>
 
 
 
Im Gegensatz zur konventionellen Definition des Medians muss dieser ''nicht'' zwangsläufig ein Element aus der tatsächlichen Datenmenge sein, welche in aller Regel nicht bekannt ist.
 
 
 
===== Beispiel =====
 
 
 
''Einkommen'':
 
{|  class="prettytable"
 
|-
 
! Klasse (<math>i</math>)
 
! Bereich (<math>u_i</math> bis <math>o_i</math>)
 
! Gruppengröße (<math>n_i</math>)
 
|-
 
| 1
 
| mind. 0, weniger als 1500
 
| 160
 
|-
 
| 2
 
| mind. 1500, weniger als 2500
 
| 320
 
|-
 
| 3
 
| mind. 2500, weniger als 3500
 
| 212
 
|}
 
 
 
Man berechne
 
 
 
:<math>\textstyle{\frac n2 = \frac{212+320+160}2 = \frac{692}2=346}.</math>
 
 
 
Also liegt der Median in der 2. Klasse (d.&nbsp;h. <math>m=2</math>), da die erste Klasse nur 160 Elemente umfasst. Somit ergibt sich als Schätzung für den Median
 
 
 
:<math>\textstyle{x_{med} = 1500+\frac{346-160}{320}\cdot (2500-1500) = 2081{,}25}.</math>
 
 
 
Eine Veranschaulichung dieses Verfahrens zur Festlegung des Medians bei gruppierten Daten ist die grafische Ermittlung mit Hilfe der [[Summenkurve]]. Hier wird der [[Abszisse]]nwert <math>x_{med}\,</math> gesucht, der zum [[Ordinate]]nwert <math>\textstyle{\frac{n}{2}}</math> gehört. Bei kleinerem und geradem <math>n</math> kann auch stattdessen der Ordinatenwert <math>\textstyle{\frac{n}{2}+1}</math> gewählt werden.
 
  
 
== Vorteile des Medians ==
 
== Vorteile des Medians ==
Zeile 119: Zeile 29:
 
Das Durchschnittseinkommen beträgt EUR 100.900, der Median jedoch nur EUR 1.000.
 
Das Durchschnittseinkommen beträgt EUR 100.900, der Median jedoch nur EUR 1.000.
  
== Alternativen ==
+
== {{www}} ==
 
 
Eine Alternative zum Median bei der Ermittlung des Masseneinkommens aus einer gegebenen Einkommensverteilung ist die von [[Amartya Sen]] vorgeschlagene [[Wohlfahrtsfunktion]].
 
 
 
== Siehe auch ==
 
 
 
{{Wiktionary|Median}}
 
 
 
* [[Medianalter]]
 
* [[Medianfilter]]
 
* [[Medianwähler]]
 
 
 
== Weblinks ==
 
  
 
Ausführliche Erläuterungen zur Berechnung des Medians auf dem „Fußweg“:
 
Ausführliche Erläuterungen zur Berechnung des Medians auf dem „Fußweg“:

Version vom 15. September 2008, 15:33 Uhr

Der Median (oder Zentralwert) halbiert eine Verteilung, darf aber nicht mit dem Mittelwert verwechselt werden.


Median einer Stichprobe

Der Median m ist der Wert einer Stichprobe, wenn höchstens die Hälfte der Beobachtungen in der Stichprobe einen Wert < m und höchstens die Hälfte einen Wert > m hat.

Sortiert man die Werte der Größe nach („geordnete Stichprobe“), so ist der Median bei einer ungeraden Werteanzahl der Wert der in der Mitte dieser Folge, egal wie hoch der rechnerische Mittelwert ist.

Bei einer geraden Werteanzahl gibt es zwei mittlere Elemente.leren Beobachtungen sowie alle Werte dazwischen (obwohl diese bei keiner Beobachtung aufgetreten sind) ein Median der Stichprobe, da für alle diese Werte obige Bedingung zutrifft.

Beispiele

  • Messwerte 1, 2, 4, 5, 18: ungerade Anzahl. Der Median ist der Wert an der mittleren Stelle, also 4. Das arithmetische Mittel dagegen beträgt 6.
  • Messwerte 1, 1, 2, 3, 4, 37: gerade Anzahl. Der Median ist die Hälfte der Summe der beiden mittleren Zahlen, also ½ (2 + 3), also 2,5. Das arithmetische Mittel ist 8.
  • Messwerte 1, 3, 3, 3: gerade Anzahl. Der Median ist ½ (3 + 3), also 3. Das arithmetische Mittel ist 2,5.

Vorteile des Medians

Durch seine Resistenz gegen Ausreißer eignet sich der Median besonders gut als Lageparameter für nicht normalverteilte Grundgesamtheiten.

Beispiel:

Die Einkommen einer Gruppe von 10 Personen verteilen sich wie folgt:

  • 9 Personen verdienen jeweils EUR 1.000 und
  • 1 Person verdient EUR 1.000.000.

Das Durchschnittseinkommen beträgt EUR 100.900, der Median jedoch nur EUR 1.000.

== Weblinks

Ausführliche Erläuterungen zur Berechnung des Medians auf dem „Fußweg“:

Wikibooks und Statscan