Korrelasjon og kovarians er to statistisk mål vi kan beregne for å finne ut om det er en lineær samvariasjon mellom to variabler.

Kovarians og korrelasjon er styrkemål som indikerer hvordan to variabler henger sammen. Er det f.eks. en sammenheng mellom reklameinnsatsen og fortjenesten eller omsetningen ?
Kovarians
La oss si at vi har benyttet et statestikkprogram og kommet frem til at kovariansen mellom X - og Y - variablen er 453. Hva sier denne verdien (kovariansen) oss ? Ved fullstendig samvariasjon mellom X og Y variablene vil kovariansen være lik summen av variansen til X og Y variablen. Hvis X har en varians på 250, mens y har en varians på 203 vil dette gi en kovarians på 453 - altså en perfekt samvariasjon. Ved fullstendig uavhengighet vil kovariansen bli lik 0.
Perfekt avhengighet: Kovarians = X-variabelens varians + Y-variabelens varians
Perfekt uavhengighet: Kovarians = 0
Positiv samvariasjon: Kovarians > 0
Negativ samvariasjon: Kovarians < 0
Formelen for å regne ut kovariansen mellom to variabler i en stikkprøve er:

Korrelasjon
Metoden går ut på å beregne en korrelasjonskoeffisient mellom de to variablene som skal måles. Denne koeffisienten kan variere mellom -1.0 og +1.0. En høy korrelasjonskoeffisient mellom f.eks. alder og inntekt forteller oss at det er en sterk samvariasjon mellom variablene. Jo elder man blir, jo sikrere er det at man har en høy inntekt. Vi kan imidlertid ikke si noe om størrelsen på effekten av en økning i en av variabelen ved hjelp av korrelasjonskoeffisienten.
Korrelasjonskoeffisient = +1 - Perfekt linær samvariasjon
Korrelasjonskoeffisient = 0 - Ingen linær sammenheng
Korrelasjonskoeffisient = - 1 - Perfekt negativ samvariasjon
Korrelasjonskoeffisienten ( r ) beregnes slik:

Tegnforklaring:
n =antall observasjoner (utvalget/stikkprøvens størrelse)
=X - variablens verdi (den observerte verdien)
= X - variablens gjennomsnittsverdi
= Y - variablens verdi (den observerte verdien)
= Y - variablens gjennomsnittsverdi
= X - variablens absolutte avvik fra gjennomsnittet




Svakheten med å bruke korrelasjon er at metoden forutsetter at variablene er på intervall- eller forholdstallsnivå.