Hvordan avgjøre hvordan det er mulig å generalisere resultatene som er samlet inn?
Hvis 75% sier at de foretrekker vårt produkt i en undersøkelse bestående av 50 respondenter, hvor representativt vil dette resultatet være ? Skyldes resultatet en tilfeldighet ? Vi har vært inne på dette temaet tidligere, men her følger oppskriften på hvordan det gjøres i praksis.
Fremgangsmåten som benyttes kalles hypoteseprøving, og kan beskrives ved hjelp av følgende modell.

Fordelen ved å gjennomføre en hypotesetest er flere. En av fordelene er at vi kan følge overstående modell uansett om vi skal teste et gjennomsnitt, en median, en andel, en krysstabell, en korrelasjonskoffisient, et standardavvik, en kovarians eller hva det enn måtte være. Fremgangsmåten er stort sett denne:
Ta utgangspunkt i en teori eller problemstilling. F.eks. er det en tilfeldighet at vårt produkt foretrekkes fremfor konkurrentens, eller skyldes arbeidslediheten rente-oppgangen forrigje kvartal. Siden de i de fleste tilfeller ikke er mulig å sette denne problemstillingen eller teorien direkte opp som en nullhypotese og en hjelpe hypotes (et alternativ), må problemstillingen operasjonaliseres.
Endimensjonale variabler lar seg uten videre operasjonaliseres til testbare hypoteser. Fullt så enkelt er det ikke med de flerdimensjonale variablene. For at det skal være mulig å teste de fler-dimensjonale variablene i ved hjelp av hypoteseprøving, må vi utvikle indikatorer. Dvs. endimensjonale variabler som tilsammen utgjør den fler- dimensjonale variablen som vi ønsker å teste.
Eksempel på en null- og hjelpehypotese er:
Nullhypotese: Gjennomsnittlig foretrekker 70% vårt produkt (
)
Hjelpehypotese: Gjennomsnittlig merkepreferanse er ikke 70% (
)
Når hypotesene er satt opp må vi velge et signifikansnivå. Signifikansnivået er en målestokk for hvilken risiko vi er villig til å akseptere for å ta feil. "Bransjestandarden" er å velge et signifikansnivå på 95%, men dette kan variere. Et signifikansnivå på 95% vil si at vi i 95 av 100 tilfeller vil ta rett.

Følgende betegnelser blir brukt om hverandre, men betyr det samme:
- Konfidensnivå
- Konfidenssannsynlighet
- Sannsynlighet for å ha rett
- 1 - 2

Disse betegnelsene har også samme betydning:
- Signifikansnivå
- Feilsannsynlighet
- Risiko for å ta feil
- 2

Hvis en stikkprøve får oss til å forkaste nullhypotesen med et konfidensnivå på 0,95, sier vi at "stikkprøven er signifikant på 5 % - nivå i forhold til hypotesen".