Hopp til innhald

Ekstremverdi i statistikk

Frå Wikipedia – det frie oppslagsverket

Ein ekstremverdi, òg kjend som utliggar[1][2] (frå engelsk outlier), er eit omgrep innan statistikk og matematisk statistikk som viser til avvikande eller ytterleggåande observerte verdiar som skil seg særleg ut frå resten av dei observerte verdiane («løpsk» eller «vill» observasjon). Ein ekstremverdi vil ikkje ha same karakteristikk som resten av datapunkta, altså ein distinkt statistisk verdi.

Ekstremverdiar kan førekoma som tilfeldige variablar i kva for eit som helst forsøk, men indikerer ofte anten målefeil eller at populasjonen har ei skeiv fordeling. Ekstremverdiar vert stundom eliminerte frå måledata (dersom dei er feilaktige eller ikkje representative) før vidare analyse.

I eit datasett med fylgjande variablar er 2 og 64 ekstremverdiar. I større datasett kan ein også finna ekstremverdiar ved å vurdera dataa i eit diagram, til dømes med eit boksplott. Ymse sentralitetsmål kan verta påverka av ekstremverdiar i større eller mindre grad. Til dømes kan gjennomsnittet jamnan endrast svært mykje på grunn av ein ekstremverdi, medan medianen som regel vert endra i mykje mindre grad.[3] Det same gjeld spreiingsmål, til dømes er standardavviket vanlegvis meir kjenslevart for ekstremverdiar samanlikna med kvartilavstanden.

Bakgrunnsstoff

[endre | endre wikiteksten]
Commons har multimedium som gjeld: Ekstremverdi i statistikk