Korrelasjon

Korrelasjon er et matematisk mål på sammenhengen mellom to variable størrelser.

Korrelasjonstallet, ρ (rho), er et tall som ligger mellom -1 og 1, hvor fortegnet angir retningen til sammenhengen. Det er absoluttverdien til ρ som sier noe om hvor sterk sammenhengen er. Jo større ρ er jo sterkere er sammenhengen, og jo bedre linearitet er det mellom de to datasettene.

Korrelasjonskoeffisient = +1 tilsier god linær samvariasjon og de to variable størrelsene varierer i takt. Punktene ligger på en rett linje i et punktdiagram. Korrelasjonskoeffisient = 0 tilsier at det ikke er noen linær sammenheng mellom de to variable. Korrelasjonskoeffisient = - 1 tilsier at de to variable størrelsene varierer i utakt. Korrelasjonskoffisienten bør være over 0,975 før lineariteten er tilstrekkelig.

Korrelasjon er kun et numerisk mål på om to datasett varierer i takt, ikke at det er en årsakssammenheng mellom de to variable.

Figur 1: F ire ulike korrelasjoner mellom to variable størrelser x og y.

Korrelasjons-diagram blir brukt på laboratoriet i metodevalidering, der en undersøker riktighet for en testmetode mot en godkjent metode. Korrelasjonen gir da et uttrykk for om det er noen tilfeldige feil eller ikke. For å finne korrelasjonen mellom to datasett må man sette opp et korrelasjonsdiagram hvor man plotter to metoder mot hverandre på excel. Når man har plottet korrelasjons-diagrammet kan man finne korrelasjonskoeffisient. Det er korrelasjonskoeffisienten man ser på for å vurdere metodenes linearitet.

Korrelasjonskoeffisienten kan beregnes ut fra denne ligningen:



Referanser: 1) http://snl.no/korrelasjon/statistikk 2) Per Chr. Hagen, Innføring i sannsynlighetsregning og statistikk 5.utgave, side 247. 3) []