Percentil

Percentil (prosentil) et spredningsmål som egner seg når vi har ikkeparametriske fordelinger.

For å forstå prosentil kan det være naturlig å sammenligne det med median. En god definisjon på median er at det er den observasjonen som ligger i midten av et datasett når alle verdiene er sortert i stigende rekkefølge. For å forstå sammenhengen mellom median og prosentil kan en annen definisjon på median benyttes: medianen kalles 50-prosentilet fordi 50% av de aktuelle observasjonene er mindre eller lik medianen. (1) Ofte vil man angi andre punkt i et datasett enn bare midtpunktet og da er det fint med percentil. Tilsvarende som man kan finne 50-percentil, altså median, kan man definere 70-prosentilet som verdiene som er mindre eller lik 70% av observasjonene osv. Ut av dette kan man si at P-prosentilet er mindre eller lik P% der P vil være tall fra 0-100.

Prosentil deler et datasett i 100 like store deler, men man kan også dele et datasett i fjerde- eller tideler: Deciler: Obersvasjonene blir fordelt i 10 like store deler. (P10, P20,P30...P90) Kvartiler: Observasjonene blir fordelt i fire like store deler (Q25, Q50,Q75) (2)

Percentiler benyttes ofte i forbindelse med store tallmengder som blir betraktet som en populasjon. Populasjonen kan bestå av individer, prøvesvar mm. Det er viktig at alle observasjonene er sammenlignbare. Eksempel på fordelingen kan være samme kjønn, samme alder og prøveresultat av samme analytt. Disse tallmengdene blir ordnet i et frekvensdiagram slik at man får en fordeling av observasjonene over et visst areal. I diagrammet trekkes vertikale linjer slik at arealet blir delt opp. Linjene tilsvarer percentilene. (3)


 * Eksempel på beregninger med percentil: **

__Eksempel 1 __

Ut i fra tabell 1 og n=90 finn maxårsinntekt til 90% av befolkningen. Husk at prosentil angis som desimaltall.

Tabell 1: Fordeling etter årsinntekt for 128 personer X(prosentil*n) = antall observasjoner. Denne telles nedenfra i tabellen og er lavere enn den aktuelle prosentilen n = antall personer
 * **Årsinntekt(1000-talls kr) ** || **Antall personer ** || **Kumulert frekvens ** ||
 * 150-159 || 1  || 1  ||
 * 160-164 || 4  || <span style="font-family: Georgia,serif;">5  ||
 * <span style="font-family: Georgia,serif;">165-169 || <span style="font-family: Georgia,serif;">31  || <span style="font-family: Georgia,serif;">36  ||
 * <span style="font-family: Georgia,serif;">170-174 || <span style="font-family: Georgia,serif;">44  || <span style="font-family: Georgia,serif;">80  ||
 * <span style="font-family: Georgia,serif;">175-179 || <span style="font-family: Georgia,serif;">38  || <span style="font-family: Georgia,serif;">118  ||
 * <span style="font-family: Georgia,serif;">180-200 || <span style="font-family: Georgia,serif;">10  || <span style="font-family: Georgia,serif;">128  ||

<span style="font-family: Georgia,serif;">X = 0,90 * n = <span style="font-family: Georgia,serif;">X = 0,90 * 128 <span style="font-family: Georgia,serif;">X = 115

<span style="font-family: Georgia,serif;">Dette innebærer at P90 ligger i klassen 175-179 fordi 118 < 115 < 80.

<span style="font-family: Georgia,serif;">Vi får P90 = 174.5+((115-80)/38)*5) = 179

__<span style="font-family: Georgia,serif;">10 prosent av personene har en årsinntekt på over 179 000 kroner, altså har 90 prosent av personene en årsinntekt på under 179 000 kroner. __

__<span style="font-family: Georgia,serif;">Eksempel 2: __

<span style="font-family: Georgia,serif;">Dersom man måler egenskap, som f.eks. IQ, vil denne være tilnærmet normalfordelt. Resultatene vil da ligge tett omkring gjennomsnittsverdien og avtar i frekvens utover mot kurvens ender.

<span style="font-family: Georgia,serif;">Figur 1: Resultatet fra en IQ-måling som viser normalområdet fra analysen, hvor man får en oversikt over prosentilrangeringen.

<span style="font-family: Georgia,serif;">Dersom en person har oppnådd en gjennomsnittlig score (se figur 1), vil 50 % av den sammenlignbare populasjonen gjøre det bedre enn vedkommende og 50 % vil gjøre det dårligere. En IQ over den 98. percentil betyr at man befinner seg blandt de 2 % mest intelligente.

<span style="font-family: Georgia,serif;"> Referanser: (1) Løvås, G.G. (2013), //Stastistikk for universiteter og høyskoler//. Oslo: Universitetsforlaget <span style="font-family: Georgia,serif;">(2) Körner, S. & Wahlgren, L., 2002, Praktisk statistik, Studentlitteratur, Sverige, Side 95-97 <span style="font-family: Georgia,serif;">(3) Thoresen, T., 2008, Statistikk for laboratoriet, Eureka Forlag, Tromsø, Side 55 og 232

<span style="font-family: Georgia,serif;">(URL1) [] (hentet 26.10.12) <span style="font-family: Georgia,serif;">(URL2) [] (hentet 26.10.12) <span style="font-family: Georgia,serif;">(URL3) [] (hentet 26.10.12) <span style="font-family: Georgia,serif;">(URL4) Wikipedia, Percentil, 21.oktober 2013, Tilgjengelig fra: <span style="font-family: Georgia,serif; line-height: 1.5;">[] (hentet 24.10.13)