Ulike former for skjevhet og beregning av skjevheten i utvalget.
Når utvalget skal beskrives, vil det alltid være interessant å vite om det finnes skjevheter i utvalget. Spesielt gjelder dette hvis man ønsker å generalisere resultatene til å gjelde hele populasjonen. For å kunne utføre statisktiske beregninger som baserer seg på en normalfordeling, må det ikke være store skjevheter i stikkprøven for at resultatet skal være pålitelig og gyldig. Vis derfor hvordan sammensatt, slik at lesern av analysen kan danne seg et bilde av hvilke skjevheter som eventuelt finnes i stikkprøvene.
For å kunne bruke en normalfordeling skal utvalge helst være symetrisk fordelt. Det vil si at avstanden mellom
og
skal være lik avstanden mellom
og
. De fleste utvalg vil imidlertid være enten være høyre- eller venstre skjevt. Det som varierer er graden av skjevhet. Utvalgsskjevheter best illustreres i et plott.

Høyreskjev fordeling

Symetrisk fordeling

Venstreskjev fordeling
Skjevhet = et mål for usymmetri
Skjevheten i et utvalg regnes ut med følgende formel:
Blir svaret = 1 er det en symetrisk fordeling (normalfordeling)
Blir svaret > 1 er det en høyreskjev fordeling
Blir svaret < 1 er det en venstreskjev fordeling
Sentralgrenseteoremet - normalfordelt
Er utvalget symetrisk fordelt, sier vi at utvalget er normaltfordelt. Normalfordelings-begrepet bygger på en teori som kalles sentralgrenseteoremet, og står sentralt i alle undersøkelser som tilstreber statistisk inferens. Dvs. i undersøkelser hvor vi ønsker å kunne generalisere resultatene.
Sentralgrenseteoremets innhold kan formuleres slik:
"Hvis et tilfeldig utvalg av størrelsen n trekkes fra en populasjon med gjennomsnitt
og varians
, vil gjennomsnittet for utvalget være tilnærmet normalfordelt hvis n er stor. Gjennomsnittet i utvaltet vil dermed bli lik
og variansen i utvalget vil bli lik
"
Viktige karakteristika ved en normalfordeling er:
- Symetrisk fordelt kurve med kun ett "MODE"
- Symmetrisk rundt gjennomsnittet, og de tre målene for sentraltendensen (Gjennomsnitt, median og mode) har lik verdi.
- Unikt definert ved dets gjennomsnitt og standardavvik
- 90% av alle observasjoner ligger i området: Gjennomsnitt +/- 1,64 standardavvik
- 95% av alle observasjoner ligger i området: Gjennomsnitt +/- 1,96 standardavvik
- Nesten alle observasjonene dekkes hvis vi tar tre standardavvik på hver side av gjennomsnittet.

Normalfordelings verdien (Z) kan beregnes ved hjelp av følgende formel:

For at vi skal kunne bruke teorien om normalfordeling må n>30.
Standard normal distribusjon
Enhver normalfordeling kan transformeres til det vi kaller en "standard normaldistribusjon". Standard normaldistribusjon har de samme egenskapene som normaldistribusjonen, men midtpunktet er alltid null og standardavviket er alltid lik 1.

Formelen for å transformere en verdi X fra en normalfordeling til dets ekvivalente verdi Z for en standard normaldistribusjon er:

Tegnforklaring:
X = Variablens verdi
= Gjennomsnittet til variablen i populasjonen
= Standardavviket til variablen