Aritmetisk middelværdi

fra Wikipedia, den gratis encyklopædi
Spring til navigation Spring til søgning

Det aritmetiske middel , også kaldet det aritmetiske middel (i daglig tale også gennemsnittet ) er et begreb, der bruges i statistik . Det er en placeringsparameter . Vi beregner dette gennemsnit med summen af de observerede tal med deres taldeler .
Det aritmetiske middel for en prøve kaldes også det empiriske middel . [1]

definition

Halvdelen af ​​summen af ​​to størrelser og er givet af:

.

Som størrelserne danne en aritmetisk sekvens , er summen af egenskabernes karakteristika divideret med antallet af funktionsbærere

som "aritmetisk middelværdi" (Læs: på tværs ). Hvis det aritmetiske middel ikke vejes (se også afsnittet Vægtet aritmetisk middel ), betegnes det også som simpelt aritmetisk middel eller uvægtet aritmetisk middel .

For eksempel er det aritmetiske middel af de to tal og :

.

Det aritmetiske middelværdi beskriver midten af ​​en fordeling med en numerisk værdi og repræsenterer således en positionsparameter Det aritmetiske middel er defineret meningsfuldt for alle metriske egenskaber. Generelt er det ikke egnet til kvalitative egenskaber, men det giver digotomiske træk med to kategorier og en meningsfuld fortolkning. I dette tilfælde er det aritmetiske middel det samme som den relative frekvens . [2] Af og til bruges gennemsnitsymbolet ø til at betegne det aritmetiske middel. I modsætning til den empiriske median er det aritmetiske middel meget modtageligt for outliers (se median ). Det aritmetiske middel kan tolkes som "midtpunktet" for de målte værdier. Der er imidlertid ingen oplysninger om, i hvilket omfang de målte værdier spredes rundt om det aritmetiske middel. Dette problem kan løses med indførelsen af ​​den "gennemsnitlige kvadratafvigelse" fra det aritmetiske middel, den empiriske varians .

Definition for frekvensdata

Til frekvensdata med egenskaberne og de tilhørende relative frekvenser det aritmetiske middelresultat som [3]

.

Aritmetisk middel for stratificering

Hvis en stratificeret prøve er tilgængelig, er det aritmetiske middelværdi for lagene kendt, det aritmetiske middel for den samlede undersøgelse kan beregnes. Det er en undersøgelsespopulation med Funktionsbærere i lag med det respektive antal funktionsbærere og aritmetiske midler tildelt. Det aritmetiske middel i er derefter defineret af [3]

.

Rekursiv repræsentation af det aritmetiske middel

Når man overvejer stationære stokastiske processer , hvor dataene registreres i en kronologisk rækkefølge, er det tilrådeligt at bruge en rekursionsformel til at beregne det aritmetiske middel. Dette kan udledes direkte af det aritmetiske gennemsnits grundformel. Som det kan ses i den givne formel for small dataene mere vægtet og for store det tidligere beregnede aritmetiske middel. Fordelen ved rekursionsformlen er, at dataene behøver ikke at blive gemt, hvilket er z. B. tilbyder til applikationer på en mikrokontroller .

Et første skridt i at gøre denne rekursive variant af det aritmetiske middel, der kan bruges til tidsvariable stokastiske processer, er indførelsen af ​​en såkaldt forglemmelsesfaktor . Tidsvariabel betyder her, at den faktiske forventede værdi varierer som funktion af tiden. Typisk kan det antages, at klyngens middelværdier svarer til de tidsmæssige middelværdier. Indførelsen af ​​glemmefaktoren betyder, at rekursionsligningen kan reagere på sådanne ændringer. En mulighed er f.eks. B. en procentvis vægtning af grænseværdien for :

At omgå de rationelle vilkår afhængigt af , kan denne ligning også bruges direkte i grænseværdien specificer som følger:

Selvfølgelig skal det præciseres, om denne fremgangsmåde er praktisk mulig i en bestemt applikation. Det skal bemærkes, at brug af grænseværdien resulterer i et andet "forbigående svar". Set fra systemteori (eller kontrolteknik) betegnes en sådan rekursionsligning også som et tidsdiskret PT1-element . I praktisk sprogbrug ville man bruge parameteren som det er beskrevet her, kald det "fumlefaktoren", som er beregnet til at afsløre, at dette i første omgang ikke er optimalt valgt. Kalman -filteret , Wiener -filteret , den rekursive mindst kvadratiske algoritme , metoden for maksimal sandsynlighed og det optimale filter generelt skal nævnes yderligere om dette emne.

Sammenligning af de rekursive aritmetiske middelværdier med og uden glemmefaktoren i en simpel tidsvarierende stokastisk proces

Opførslen af ​​de rekursionsligninger, der er givet her, kan ses som et eksempel på en simpel ustabil, stokastisk proces ( normalt fordelt i områder ). I løbet af tiden viser den forventede værdi og variansen af ​​tilfældige data uregelmæssig adfærd. Den enkle rekursionsligning uden at glemme faktor (aritmetisk middelværdi 1) reagerer kun meget langsomt på datasættets adfærd. Hvorimod rekursionsligningerne med glemmefaktor (aritmetisk middelværdi 2 & 3, ) reagerer meget hurtigere. Det er også mærkbart, at algoritmerne med glemmefaktoren fører til et lidt højere støjniveau. I dette eksempel bør det imidlertid være klart, at den hurtigere responstid har forrang. Resultaterne "Aritmetisk middelværdi 2" og "Aritmetisk middelværdi 3" adskiller sig kun meget lidt fra hinanden. Afhængigt af datasættet, især datamængden, kan dette se meget anderledes ud.

ejendomme

Substitut værdi ejendom

Det følger direkte af definitionen af ​​det aritmetiske middel, at

.

Når du får det aritmetiske gennemsnit med stikprøvestørrelsen ganges, så får du summen af ​​funktionerne . [4] Denne beregningsregel kaldes egenskaben substitutværdi eller ekstrapolationsegenskab og bruges ofte i matematiske beviser. Det kan tolkes således: Summen af ​​alt Individuelle værdier kan betragtes som erstattet af lige værdier af størrelsen af ​​det aritmetiske middel.

Fokus ejendom

Afvigelserne af de målte værdier fra middelværdien

kaldes også "tilsyneladende fejl". Tyngdepunktets egenskab (også kaldet nul -egenskab ) betyder, at summen af ​​de tilsyneladende fejl eller summen af ​​afvigelserne for alle observerede måleværdier fra det aritmetiske middel er lig med nul, dvs.

eller i tilfælde af frekvens .

Dette kan vises ved hjælp af egenskaben substitutværdi som følger:

Tyngdepunktet spiller en stor rolle i begrebet frihedsgrader . På grund af egenskaben ved tyngdepunktet for det aritmetiske middel er den sidste afvigelse allerede gennem den første helt bestemt. Følgelig kun variere Afvigelser er gratis og man derfor gennemsnit, f.eks. B. med den empiriske varians ved at se på antallet af frihedsgrader opdelt. [5]

Optimality ejendom

I statistik er man ofte interesseret i summen af ​​de kvadrerede afvigelser fra et center for at minimere. Når du sætter midten gennem en værdi ønsker at sætte på den vandrette akse, som er summen af ​​de kvadrerede afvigelser

mellem datoerne og center minimeret så er den minimerende værdi. Dette resultat kan opnås ved blot at udlede den objektive funktion til der skal vises:

.

Dette er et minimum, da det er det andet derivat af til er lig med 2, dvs. større end 0, hvilket er en tilstrækkelig betingelse for et minimum.

Dette resulterer i følgende egenskab for optimalitet (også kaldet minimeringsegenskab):

for alle [6] eller med andre ord [7]

Lineær transformationsejendom

Afhængigt af skalaen er det aritmetiske middel lig med særlige transformationer. Det gælder den lineære transformation [6]

,

der

.

Triangel uligheder

Følgende trekant ulighed gælder for det aritmetiske middel: Det aritmetiske middel af positive egenskaber er større end eller lig med det geometriske middel af disse karakteristiske værdier, dvs.

.

Ligheden gives kun, hvis alle karakteristika er ens. Endvidere gælder den absolutte mængde af det aritmetiske middelværdi for flere karakteristiske værdier, at det er mindre end eller lig med rodgennemsnittet

. [8.]

Eksempler

Enkle eksempler

  • Det aritmetiske gennemsnit på 50 og 100 er
  • Det aritmetiske gennemsnit på 8, 5 og -1 er

Applikationseksempel

En bil kører 100 km / t i en time og 200 km / t den følgende time. Ved hvilken konstant hastighed skal en anden bil køre for at tilbagelægge den samme distance på to timer?

Vejen at den første bil har kørt i alt er

og den anden bil

hvori er hastigheden på den anden bil. Ud overgav sig

og dermed

Vægtet aritmetisk middelværdi

Du kan også definere et vægtet aritmetisk middelværdi (også kendt som et vægtet aritmetisk middelværdi). Det udvider omfanget af det enkle aritmetiske middel til værdier med forskellige vægtninger . Et eksempel er beregningen af ​​en skolekarakter, hvor mundtlige og skriftlige resultater er inkluderet i forskellige grader. Når Richmanns blandingsregel bruges til at bestemme blandingstemperaturen for to legemer lavet af det samme materiale, beregnes også et vægtet aritmetisk middel.

Beskrivende statistik

For eksempel bruges det vægtede middel, når man ser på midler , slutningen Prøver af samme population med forskellige stikprøvestørrelser vil kombinere:

.

sandsynlighedsberegning

Prøve middelværdi

De specifikke egenskaber kan ses som erkendelse af tilfældige variabler forståelse. Alle sammen Værdi repræsenterer således en realisering af den respektive tilfældige variabel, efter at prøven er blevet trukket Det aritmetiske gennemsnit af disse tilfældige variabler

er også kendt som prøve middelværdi og er også en tilfældig variabel.

Omvendt variansvægtning

Er uafhængigt fordelte tilfældige variabler (dvs. er en tilfældig variabel med tilfældige variabler og er en tilfældig variabel med tilfældige variabler ) med en fælles forventet værdi men forskellige afvigelser , har den vejede middelværdi også den forventede værdi og dens varians er

.

Man vælger som vægt , så variansen forenkles til

.

Det følger af Cauchy-Schwarz-uligheden

.

Valget af vægte eller et valg, der er proportionalt med det, minimerer variansen af det vægtede middel. Denne formel kan bruges til at beregne vægtene Vælg hensigtsmæssigt afhængigt af variansen af ​​den respektive værdi, som følgelig påvirker middelværdien i større eller mindre omfang.

Uafhængigt og identisk fordelt tilfældige variabler

Er Tilfældige variabler, der er uafhængigt og identisk fordelt med forventet værdi og varians er, så har prøven middelværdi også den forventede værdi , men den mindre varians (se standardfejl ). Så hvis en tilfældig variabel har begrænset forventning og varians, følger det af Chebyshev -uligheden, at det aritmetiske gennemsnit af en prøve konvergerer stokastisk til forventningen om den tilfældige variabel. Ifølge mange kriterier er det aritmetiske middel derfor et passende skøn for den forventede værdi af fordelingen, hvorfra prøven stammer.

Er især prøveværdier for omfanget fra den samme befolkning, så har variansen så valget er dit optimal.

Vægtet aritmetisk middelværdi som forventet værdi

I tilfælde af en diskret tilfældig variabel med en ubegrænset bærer den forventede værdi af de tilfældige variable resultater som

.

Her er sandsynligheden for det værdien accepterer. Denne forventede værdi kan bruges som et vejet gennemsnit af værdierne med sandsynlighederne blive fortolket. I tilfælde af lige fordeling gælder følgende og dermed bliver til det aritmetiske middelværdi af værdierne [9]

.

Eksempler på vægtede gennemsnit

En landmand producerer 100 kg smør som en sidelinie. Han kan sælge 10 kg for 10 € / kg, yderligere 10 kg for 6 € / kg og resten skal han sælge for 3 € / kg. Til hvilken (vægtet) gennemsnitspris solgte han sit smør? Løsning: (10 kg x 10 € / kg + 10 kg x 6 € / kg + 80 kg x 3 € / kg) / (10 kg + 10 kg + 80 kg) = 400 € / 100 kg = 4 € / kg. Gennemsnitsprisen, vægtet med den solgte mængde, svarer til den faste pris, som den samlede mængde skulle sælges til for at opnå samme indtægt som ved salg af delmængder til ændrede priser.

Det aritmetiske middel det Nummer 1, 2 og 3 er lig med 2, det aritmetiske middel det Nummer 4 og 5 er 4,5. Det aritmetiske gennemsnit af alle 5 tal resulterer som middelværdien af ​​de delvise middelværdier vægtet med stikprøvestørrelsen:

Hvis observationer er tilgængelige som en klassificeret frekvens, kan det aritmetiske middel cirka bestemmes som et vægtet middelværdi, med klassen midt som værdien og klassens størrelse som vægten. For eksempel hvis der er et barn i en skoleklasse i vægtklassen 20 til 25 kg, 7 børn i vægtklassen 25 til 30 kg, 8 børn i vægtklassen 30-35 kg og 4 børn i 35 til 40 kg vægtklasse, kan gennemsnitsvægten beregnes som

skøn. For at fastslå kvaliteten af ​​dette estimat skal minimum / maksimum mulig middelværdi derefter bestemmes ved at tage de mindste / største værdier pr. Interval som grundlag. Damit ergibt sich dann, dass der tatsächliche Mittelwert zwischen 28,75 kg und 33,75 kg liegt. Der Fehler der Schätzung 31,25 beträgt also maximal ±2,5 kg oder ±8 %.

Der Mittelwert einer Funktion

Als Mittelwert der Riemann-integrierbaren Funktion wird die Zahl

definiert.

Die Bezeichnung Mittelwert ist insofern gerechtfertigt, als für eine äquidistante Zerlegung des Intervalls mit der Schrittweite das arithmetische Mittel

gegen konvergiert. [10]

Ist stetig , so besagt der Mittelwertsatz der Integralrechnung , dass es ein gibt mit , die Funktion nimmt also an mindestens einer Stelle ihren Mittelwert an.

Der Mittelwert der Funktion mit dem Gewicht (wobei für alle ) ist

.

Für Lebesgue-Integrale im Maßraum mit einem endlichen Maß lässt sich der Mittelwert einer Lebesgue-integrierbaren Funktion als

definieren. Handelt es sich um einen Wahrscheinlichkeitsraum , gilt also , so nimmt der Mittelwert die Form

an; das entspricht genau dem Erwartungswert von .

Der Mittelwert einer Funktion hat in Physik und Technik erhebliche Bedeutung insbesondere bei periodischen Funktionen der Zeit, siehe Gleichwert .

Quasi-arithmetischer Mittelwert ( f -Mittel)

Sei eine auf einem reellen Intervall streng monotone stetige (und daher invertierbare) Funktion und seien

Gewichtsfaktoren. Dann ist für das mit den Gewichten gewichtete quasi-arithmetische Mittel definiert als

.

Offensichtlich gilt

Für erhält man das arithmetische, für das geometrische Mittel und für das - Potenzmittel .

Dieser Mittelwert lässt sich auf das gewichtete quasi-arithmetische Mittel einer Funktion verallgemeinern, wobei in einem die Bildmenge von umfassenden Intervall streng monoton und stetig sei:

Siehe auch

Weblinks

Einzelnachweise

  1. Karl Bosch : Elementare Einführung in die angewandte Statistik . 8. Auflage. Vieweg, Wiesbaden 2005, S.   13 .
  2. Ludwig Fahrmeir , Rita Künstler, Iris Pigeot , Gerhard Tutz : Statistik. Der Weg zur Datenanalyse. 8., überarb. und erg. Auflage. Springer Spektrum, Berlin / Heidelberg 2016, ISBN 978-3-662-50371-3 , S. 49.
  3. a b Ludwig Fahrmeir, Rita Künstler, Iris Pigeot, Gerhard Tutz: Statistik. Der Weg zur Datenanalyse. 8., überarb. und erg. Auflage. Springer Spektrum, Berlin / Heidelberg 2016, ISBN 978-3-662-50371-3 , S. 50.
  4. Horst Degen, Peter Lorscheid: Statistik-Lehrbuch: mit Wirtschafts- und Bevölkerungsstatistik. S. 42.
  5. Ludwig Fahrmeir, Rita Künstler, Iris Pigeot, Gerhard Tutz: Statistik. Der Weg zur Datenanalyse. 8., überarb. und erg. Auflage. Springer Spektrum, Berlin / Heidelberg 2016, ISBN 978-3-662-50371-3 , S. 65.
  6. a b Ludwig Fahrmeir, Rita Künstler, Iris Pigeot, Gerhard Tutz: Statistik. Der Weg zur Datenanalyse. 8., überarb. und erg. Auflage. Springer Spektrum, Berlin / Heidelberg 2016, ISBN 978-3-662-50371-3 , S. 54.
  7. bezeichnet analog zu ( Argument des Maximums ) das Argument des Minimums
  8. IN Bronstein, KA Semendjajew ua: Taschenbuch der Mathematik . 2. Auflage. 1995, S. 19 ff.
  9. IN Bronstein, KA Semendjajew ua: Taschenbuch der Mathematik. 2. Auflage. 1995, S. 629.
  10. H. Heuser: Lehrbuch der Analysis . Teil 1. 8. Auflage. Teubner, Stuttgart 1990, ISBN 3-519-12231-6 .