Gennemsnit

fra Wikipedia, den gratis encyklopædi
Spring til navigation Spring til søgning

En middelværdi (også bare betyde, et andet ord middelværdi) er et tal, der bestemmes ud fra givne tal efter en bestemt aritmetiske regel . Beregningsregler for det aritmetiske , det geometriske og det kvadratiske middel er almindelige . Ordet middel eller gennemsnit bruges mest til at henvise til det aritmetiske middel.

Middelværdier bruges oftest i statistik . Middelværdien er en karakteristisk værdi for en fordelings centrale tendens . Det aritmetiske middel er tæt forbundet med den forventede værdi af en fordeling. Mens middelværdien bestemmes ud fra specifikke tilgængelige numeriske værdier, er den forventede værdi baseret på den teoretisk forventede frekvens.

historie

I matematik viste middelværdier, især de tre klassiske middelværdier (aritmetisk, geometrisk og harmonisk middelværdi), allerede i antikken. Pappos fra Alexandria angiver ti forskellige middelværdier af to tal og ( ) efter særlige værdier af ruteforholdet . Uligheden mellem harmonisk, geometrisk og aritmetisk middelværdi er også kendt og fortolket geometrisk i antikken. I det 19. og 20. århundrede spiller middelværdier en særlig rolle i analysen, hovedsageligt i forbindelse med berømte uligheder og vigtige funktionelle egenskaber som konveksitet ( Hölder -ulighed , Minkowski -ulighed , Jensens ulighed osv.). De klassiske midler blev generaliseret i flere trin, først til Potency-værdierne (se afsnittet generaliseret gennemsnit nedenfor) og disse igen til de aritmetiske kvasi-gennemsnit . Den klassiske ulighed mellem harmoniske, geometriske og aritmetiske middelværdier bliver til mere generelle uligheder mellem kraftmidler eller kvasi-aritmetiske midler.

Visualisering af det aritmetiske middel

Visualisering af det aritmetiske middel med en rocker.
Genberegning uden dimension :
Kuglevægt ens Afstande til drejepunktet lige og resultater

Det mest almindeligt anvendte middel, det aritmetiske middel, kan f.eks. B. visualisere bolde med samme vægt på en vippe, som er afbalanceret af en trekant (drejepunkt) på grund af lovgivningen om gearing . Forudsat at bjælkens vægt kan negligeres, er positionen af ​​trekanten, der skaber balancen, det aritmetiske middel af boldpositionerne.

Definitioner af de tre klassiske middelværdier

Følgende er givet reelle tal , i statistik såsom måleværdier , hvis middelværdi skal beregnes. [1]

Aritmetisk middelværdi

Det aritmetiske middel er summen af ​​de givne værdier divideret med antallet af værdier.

Geometrisk middelværdi

For tal, der ikke fortolkes på grundlag af deres sum, men af ​​deres produkt, kan det geometriske middel beregnes. For at gøre dette multipliceres tallene med hinanden, og den nte rod tages, hvor n svarer til det antal tal, der skal beregnes i gennemsnit.

Harmonisk middelværdi

Det harmoniske middel bruges, når tallene er defineret i forhold til en enhed. For at gøre dette divideres antallet af værdier med summen af ​​de gensidige værdier for tallene.

Eksempler på brug af forskellige midler

Funktionsbærer værdi
3
2
2
2
3
4.
5
Søjlediagram for eksemplerne

I det følgende skal de syv poster til højre i værditabellen bruges som et eksempel til at vise, hvor hvilken definition af middelværdien giver mening.

Det aritmetiske middel bruges f.eks. Til at beregne gennemsnitshastigheden, så værdierne tolkes som hastigheder: Hvis en skildpadde først kører tre meter i timen i en time, derefter i tre timer hver anden meter og accelererer igen til tre , fire og i en time fem meter i timen er det aritmetiske gennemsnit for en afstand på 21 meter på 7 timer:

Det harmoniske middel kan også være nyttigt til beregning af en gennemsnitshastighed, hvis målingerne ikke udføres på samme tidspunkter, men over de samme afstande. I dette tilfælde angiver værdierne i tabellen de tidspunkter, hvor en ensartet afstand tilbagelægges: Skildpadden kører 1. meter ved 3 meter i timen, yderligere 3 m ved 2 m / t hver og accelererer igen på de sidste 3 meter til henholdsvis 3, 4 og 5 m / t. Gennemsnitshastigheden skyldes en afstand på 7 meter in Timer:

Det geometriske middel bruges til at beregne den gennemsnitlige vækstfaktor. Værditabellen tolkes således som specificerende vækstfaktorer. For eksempel vokser en bakteriekultur fem gange på den første dag, fire gange på den anden, derefter tre gange to gange, og i de sidste tre dage fordobles den dagligt. Lageret efter den syvende dag beregnes derfor ved hjælp af Alternativt kan den endelige opgørelse bestemmes ved hjælp af det geometriske middelværdi, fordi

og sådan er det

En daglig vækst af bakteriekulturen 2,83 gange ville have ført til det samme resultat efter syv dage.

Fælles definition af de tre klassiske middelværdier

Ideen, som de tre klassiske middelværdier er baseret på, kan formuleres i generelle termer som følger:

Med det aritmetiske middel kigger du efter tallet , for

gælder, hvor summen er tilovers Summands strækker sig. Det aritmetiske middel betyder derfor gennemsnit med hensyn til det aritmetiske link "sum". Ved hjælp af det aritmetiske middel af søjler i forskellige længder kan man klart bestemme en med en gennemsnitlig eller mellemlang længde.

I det geometriske middel ser man efter tallet , for

gælder, med produktet tilovers Faktorer strækker sig. Det geometriske middelværdi er derfor gennemsnitligt med hensyn til det aritmetiske link "produkt".

Det harmoniske middel løser ligningen

Forbindelser

Forbindelse med forventet værdi

Den generelle forskel mellem en middelværdi og den forventede værdi er, at middelværdien anvendes på et bestemt datasæt, mens den forventede værdi giver information om fordelingen af ​​en tilfældig variabel . Det vigtige er forbindelsen mellem disse to parametre. Hvis datasættet, som middelværdien anvendes på, er en stikprøve af fordelingen af ​​den tilfældige variabel, er det aritmetiske middel det objektive og konsistente estimat af den forventede værdi af den tilfældige variabel. Da den forventede værdi svarer til det første øjeblik i en fordeling, bruges middelværdien derfor ofte til at begrænse fordelingen baseret på empiriske data. I tilfælde af den ofte anvendte normalfordeling, som er fuldstændigt bestemt af de to første øjeblikke, er middelværdien derfor af afgørende betydning.

Forholdet mellem aritmetisk, harmonisk og geometrisk middelværdi

Det gensidige middel for det harmoniske middel er lig med det aritmetiske middelværdi for tallernes gensidige værdier.

til middelværdierne er relateret til hinanden på følgende måde:

eller løst i henhold til det geometriske middel

Uligheden mellem midlerne

Uligheden af ​​det aritmetiske og geometriske middel sammenligner værdierne for det aritmetiske og geometriske middelværdi for to givne tal: Det gælder altid for positive variabler

Uligheden kan også udvides til andre middelværdier, f.eks. B. (for positiv variabel)

Der er også en grafisk illustration til to (positive) variabler:

Geometrisk bevis på uligheden for midler til to variabler

Det geometriske middelværdi følger direkte af den euklidiske højde sætning og det harmoniske middel fra den euklidiske cathetus sætning med forholdet

Sammenlignet med andre mål for central tendens

Sammenligning mellem tilstand, median og "middelværdi" (faktisk: forventet værdi ) af to log-normale fordelinger

En middelværdi bruges ofte til at beskrive en central værdi af et datasæt. Der er andre parametre, der også opfylder denne funktion, median og tilstand . Medianen beskriver en værdi, der deler datasættet i to, mens tilstanden angiver værdien med den højeste frekvens i datasættet. Sammenlignet med medianen er gennemsnittet mere modtageligt for ekstremværdier og derfor mindre robust . Det er også muligt, da medianen beskriver en kvantil af fordelingen, at denne beskriver en værdi fra den oprindelige mængde. Dette er især interessant, hvis tallene mellem de givne data ikke er meningsfulde for andre - for eksempel fysiske - overvejelser. Medianen bestemmes generelt ved hjælp af følgende beregningsregel. [1]

Andre middelværdier og lignende funktioner

Vægtet middel

De vægtede eller også vægtede middelværdier opstår, når de enkelte værdier tildeles forskellige vægte, som de flyder ind i det samlede middelværdi ; For eksempel når mundtlig og skriftlig præstation i en eksamen har forskellige grader af indflydelse i den samlede karakter.

De nøjagtige definitioner kan findes her:

Firkantet og kubisk middelværdi

Andre midler, der kan bruges, er kvadratisk middelværdi og kubisk middelværdi . Roden betyder kvadrat beregnes ved hjælp af følgende beregningsregel:

Det kubiske middel bestemmes som følger:

Logaritmisk middelværdi

Det logaritmiske middel fra og er defineret som

til er det logaritmiske middel mellem det geometriske og det aritmetiske middel (for det er ikke defineret på grund af division med nul ).

Vundet og trimmet betyder

Hvis man kan antage, at dataene er kontamineret af “ outliers ”, det vil sige et par værdier, der er for høje eller for lave, kan dataene enten trimmes eller “winsorize” (opkaldt efter Charles P. Winsor ) og den trimmede (eller trimmede) ( afkortet middelværdi ) eller winsoriseret middelværdi ( Winsorized middelværdi ). I begge tilfælde sorteres observationsværdierne først i stigende rækkefølge. Ved trimning afbryder du derefter et lige antal værdier i begyndelsen og i slutningen af ​​sekvensen og beregner middelværdien ud fra de resterende værdier. På den anden side, når "vinder", erstattes outliers i begyndelsen og slutningen af ​​sekvensen med den næste lavere (eller højere) værdi af de resterende data.

Eksempel: Du har 10 reelle tal sorteret i stigende rækkefølge , så det trimmede gennemsnit på 10% er det samme

Gennemsnittet på 10% winsorized er imidlertid det samme

Det betyder, at det trimmede middel ligger mellem det aritmetiske middel (ingen afkortning) og medianen (maksimal afkortning). Normalt bruges et 20% trimmet middelværdi, dvs. 40% af dataene tages ikke i betragtning ved middelberegningen. Procentdelen er i det væsentlige baseret på antallet af formodede udsving i dataene; for betingelser for en trimning på mindre end 20%henvises til litteraturen. [2] [3]

Kvartil middelværdi

Kvartilgennemsnittet defineres som middelværdien af ​​1. og 3. kvartil :

Her henvist til 25% -kvantilen (1. kvartil) og følgelig 75% kvantil (3. kvartil) af de målte værdier.

Kvartilgennemsnittet er mere robust end det aritmetiske middel, men mindre robust end medianen .

Midt på den korteste halvdel

Være det korteste interval blandt alle intervaller med , det er det også midten af ​​den korteste halvdel. I tilfælde af unimodale symmetriske fordelinger konvergerer denne værdi til det aritmetiske middel. [4]

Gastwirth-Cohen midler

Gastwirth-Cohen-middelværdien [5] bruger tre kvantiler af dataene: det -Kvantil og det -Kvantil hver med vægt samt medianen med vægt :

med og .

Er særlige tilfælde

  • kvartilværdien med , og
  • Trimean med , .

Område betyder

Intervallet middelværdi ( engelsk mellemklasse ) er defineret som det aritmetiske middelværdi for den største og den mindste observationsværdi:

Dette svarer til:

"A-middel"

For en given rigtig vektor med bliver udtrykket

være over alle permutationer fra opsummeres som " -Medium "[ ] af de ikke -negative reelle tal udpeget.

I tilfælde , der giver nøjagtigt det aritmetiske middel af tallene ; i tilfælde præcis de geometriske middelresultater.

For -Mean anvender Muirhead -uligheden.

Eksempel: Vær og

gælder derefter og sættet af permutationer (i stenografi) af er

Dette resulterer i

Glidende gennemsnit

Glidende gennemsnit bruges i den dynamiske analyse af måleværdier . De er også et almindeligt middel til teknisk analyse inden for finansiel matematik . Med glidende gennemsnit kan den stokastiske støj filtreres fra signaler, der skrider fremad. Ofte er det FIR -filtre . Det skal dog bemærkes, at de fleste glidende gennemsnit vil sænke det virkelige signal. For forudsigende filtre se f.eks. B. Kalman filtre .

Glidende gennemsnit kræver normalt en uafhængig variabel, der angiver størrelsen af ​​den efterfølgende prøve eller vægten af ​​den foregående værdi for de eksponentielle glidende gennemsnit.

Almindelige glidende gennemsnit er:

  • aritmetiske glidende gennemsnit ( Simple Moving Average - SMA),
  • eksponentielle glidende gennemsnit (eksponentielt glidende gennemsnit - EMA)
  • dobbelt eksponentielle glidende gennemsnit ( Dobbelt EMA , DEMA),
  • tredobbelt, -fold eksponentielle glidende gennemsnit ( Triple EMA - TEMA),
  • lineære vægtede glidende gennemsnit (lineært faldende vægtning),
  • kvadrerede vægtede glidende gennemsnit og
  • yderligere vægtninger: sinus, trekantet, ...

I finanslitteraturen kan der også findes såkaldte adaptive glidende gennemsnit, som automatisk tilpasser sig et skiftende miljø (forskellig volatilitet / spredning osv.):

  • Kaufmanns adaptive glidende gennemsnit (KAMA) også
  • Variabelt indeks dynamisk gennemsnit (VIDYA).

For anvendelse af glidende gennemsnit, se også Glidende gennemsnit (diagramanalyse) og MA -model .

Kombinerede midler

Gennemsnitlige værdier kan kombineres; so entsteht etwa das arithmetisch-geometrische Mittel , das zwischen dem arithmetischen und geometrischen Mittel liegt.

Verallgemeinerte Mittelwerte

Es gibt eine Reihe weiterer Funktionen, mit denen sich die bekannten und weitere Mittelwerte erzeugen lassen.

Hölder-Mittel

Für positive Zahlen definiert man den -Potenzmittelwert , auch Hölder-Mittel ( englisch -th power mean ) als

Für ist der Wert durch stetige Ergänzung definiert:

Man beachte, dass sowohl Notation als auch Bezeichnung uneinheitlich sind.

Für ergeben sich daraus etwa das harmonische, das geometrische, das arithmetische, das quadratische und das kubische Mittel. Für ergibt sich das Minimum, für das Maximum der Zahlen.

Außerdem gilt bei festen Zahlen : Je größer ist, desto größer ist ; daraus folgt dann die verallgemeinerte Ungleichung der Mittelwerte

Lehmer-Mittel

Das Lehmer-Mittel [6] ist ein anderer verallgemeinerter Mittelwert; zur Stufe ist es definiert durch

Es hat die Spezialfälle

  • ist das harmonische Mittel;
  • ist das geometrische Mittel von und ;
  • ist das arithmetische Mittel;

Stolarsky-Mittel

Das Stolarsky-Mittel zweier Zahlen ist definiert durch

Integraldarstellung nach Chen

Die Funktion

ergibt für verschiedene Argumente die bekannten Mittelwerte von und : [7]

  • ist das harmonische Mittel.
  • ist das geometrische Mittel.
  • ist das arithmetische Mittel.

Aus der Stetigkeit und Monotonie der so definierten Funktion folgt die Mittelwertungleichung

Mittelwert einer Funktion

Das arithmetische Mittel einer stetigen Funktion in einem geschlossenen Intervall ist

, wobei die Zahl der Stützstellen ist.

Das quadratische Mittel einer stetigen Funktion ist

Diese finden in der Technik erhebliche Beachtung, siehe Gleichwert und Effektivwert .

Literatur

  • F. Ferschl: Deskriptive Statistik. 3. Auflage. Physica-Verlag Würzburg, ISBN 3-7908-0336-7 .
  • PS Bullen: Handbook of Means and Their Inequalities. Kluwer Acad. Pub., 2003, ISBN 1-4020-1522-4 (umfassende Diskussion von Mittelwerten und den mit ihnen verbundenen Ungleichungen).
  • GH Hardy, JE Littlewood, G. Polya: Inequalities. Cambridge Univ. Press, 1964.
  • E. Beckenbach, R. Bellman: Inequalities. Springer, Berlin 1961.
  • F. Sixtl: Der Mythos des Mittelwertes. R. Oldenbourg Verlag, München/Wien 1996, 2. Aufl., ISBN 3-486-23320-3

Weblinks

Wiktionary: Durchschnittswert – Bedeutungserklärungen, Wortherkunft, Synonyme, Übersetzungen
Wiktionary: Mittelwert – Bedeutungserklärungen, Wortherkunft, Synonyme, Übersetzungen

Einzelnachweise

  1. a b F. Ferschl: Deskriptive Statistik. 3. Auflage. Physica-Verlag Würzburg, ISBN 3-7908-0336-7 . S. 48–74.
  2. RK Kowalchuk, HJ Keselman, RR Wilcox, J. Algina: Multiple comparison procedures, trimmed means and transformed statistics . In: Journal of Modern Applied Statistical Methods . Band   5 , 2006, S.   44–65 , doi : 10.22237/jmasm/1146456300 .
  3. RR Wilcox, HJ Keselman: Power analysis when comparing trimmed means . In: Journal of Modern Applied Statistical Methods . Band   1 , 2001, S.   24–31 , doi : 10.22237/jmasm/1020254820 .
  4. L. Davies: Data Features . In: Statistica Neerlandica . Band   49 , 1995, S.   185–245 , doi : 10.1111/j.1467-9574.1995.tb01464.x .
  5. Gastwirth JL, Cohen ML (1970) Small sample behavior of some robust linear estimators of location . J Amer Statist Assoc 65:946–973, doi : 10.1080/01621459.1970.10481137 , JSTOR 2284600
  6. Eric W. Weisstein : Lehmer Mean . In: MathWorld (englisch).
  7. H. Chen: Means Generated by an Integral. In: Mathematics Magazine. Vol. 78, Nr. 5 (Dez. 2005), S. 397–399, JSTOR 30044201 .