Sammenligning av to stikkprøver. Hvordan gjøre dette ved bruk av statistiske metoder?
De finnes flere tester vi kan bruke for å sammenligne to stikkprøver. De to vanlige testene innenfor statistikken er:
- Fortegnstest
- Wilcoxons tegnrangtest
1. Fortegnstest
I hypoteseprøving og markedsforskning forøvrig er man ofte interessert i å finne ut om et tiltak har noen virkning. I slike tilfeller kan fortegntesten være en alternativ metode.
Hva mener vi med parvise sammenligninger ? Med parvise sammenligninger mener vi "før - etter" observasjoner på individuell basis. Hvert individ danner så et par. Ser vi på differansen innen hvert par får vi så parvise sammenligninger.
La oss si at man har gjennomført et salgskurs og ønsker å se om salgskurset har ført til at selgerne har økt sin måndesomsetning. La oss si at du har 40 selgere som har deltatt på kurset. For å kontrollere effekten har du valgt ut en stikkprøve bestående av salgsresultatene til 10 tilfeldige selgere.
Salgsresultatene før og etter salgskurset er oppgitt i hele tusen i tabellen under:
| Selger nr | Omsetning før salgskurs | Omsetning etter salgskurs | Differanse |
| 1 2 3 4 5 6 7 8 9 10 | 327 328 338 338 314 298 341 339 321 311 | 315 347 332 263 297 302 307 342 347 394 | -12 19 -6 -75 -17 4 -34 3 30 83 |
Nullhypotesen vil som regel være at tiltaket ikk har noen virkning. Vi setter derfor opp disse hypotesene:
Nullhypotese (H0): medianen i populasjonen = 0
Hjelpehypotese (H1) Medianen i populasjonen # 0
Vi velger et signifikantnivå på 5% (0,05), dvs. et konfidensnivå på 95% (0,95).
Ved å slå opp i tabellen vi gjenga forann i forbindelse med beregning av konfidensintervall, finner vi kritisk verdi på C=2 når n=10, ved et konfidensnivå på 0,95.
Dette betyr at konfidensintervallet går fra
. Altså fra den nest laveste verdien til den nest høyeste verdien i stikkprøven.
Som det går frem av tabellen over er det 5 positive differanser (salgsøkning) og 5 negative differanser (salgsreduksjon) i utvalget. Siden nullhypotesen er at effekten er lik 0 kan vi ved fortegntesten foreta hypoteseprøvningen ved å telle opp antall positive og negative avvik/differanser. Hvis antall negative differanser er ekte mindre enn C -verdien kan vi forkaste nullhypotesen. Vi kan også forkaste hypotesen hvis antall posive differanser er mindre enn C-verdien. I dette tilfellet kan vi derfor ikke forkaste nullhypotesen ved fortegnstesten.
Fortegnstesten kan oppsummeres slik (F. Wenstrøp - 94):
1. Test: Fortegnstest
2. Nullhypotese: Differansemedian = 0
3. Hjelpehypotese: Differansemedian # 0
4. Signinifikansnivå: 2
5. Kritisk verdi: Finn C - verdi i tabell
Forkastningsområde: alle verdier < C
6. Testobservatorverdi: Tell opp antall negative- og antall positive differanser. Testobservator er den minste av disse tallene
7. Konklusjon:
Hvis testobservatorverdien er ekte mindre enn C, forkast H0 til fordel for H1. Hvis testobservatorveriden er lik eller større enn C, behold H0
2. Wilcoxons tegnrangtest
Fortegnstesten er lett å forstå og enkel å utføre, men den tar ikke hensyn til størrelsen på differansene, bare fortegnet. Wilcoxons tegnrangtest er et godt alternativ som nettopp tar hensyn til størrelsene. Her rangerer man alle differansene etter størrelse uten å bry seg om fortegnet, og teller så opp summen av rangene for hendholdsvis de positive og negative differansene. Er nullhypotesen om en differanse lik null riktig, venter vi at disse summene skal bli omtrent like store. En påfallende ubalanse tyder på at nullhypotesen må være gal.
La oss se på hvordan denne testen slår ut i eksemplet vårt:
| Selger nr | Omsetning før salgskurs | Omsetning etter salgskurs | Avvik | Rang |
| 1 2 3 4 5 6 7 8 9 10 | 327 328 338 338 314 298 341 339 321 311 | 315 347 332 263 297 302 307 342 347 394 | -12 19 -6 -75 -17 4 -34 3 30 83 | 4 6 3 9 5 2 8 1 7 10 |
Summen av rangene til de negative og positive differansene er:
T- = 29 T+ = 26
Den forskjellen vi ser her tyder på at det er små forskjeller mellom i differansene, noe som intiuitaiv sier at vi bør beholde nullhypotesen. Dette fordi det bør være en stor forskjell mellom disse to T-verdiene for at nullhypotesen kan forkastes. Når T - verdiene er beregnet kan man sjekke om forskjellen er signifikant ved å slå opp i tabellen under:
2 | 0,1 | 0,05 | 0,02 | 0,01 |
| n | | | | |
| 10 | 11 | 8 | 5 | 3 |
| 12 | 17 | 14 | 10 | 7 |
| 14 | 26 | 21 | 16 | 13 |
| 16 | 36 | 30 | 24 | 19 |
| 18 | 47 | 40 | 33 | 28 |
| 20 | 60 | 52 | 43 | 37 |
| 22 | 75 | 66 | 56 | 49 |
| 24 | 92 | 81 | 69 | 61 |
| 26 | 110 | 98 | 85 | 76 |
| 28 | 130 | 117 | 102 | 92 |
| 30 | 152 | 137 | 120 | 109 |
Forkast nullhypotese om differansemedian = 0 hvis testobservatoren er mindre enn C - verdien i tabellen over. Ved tosidig test: 2
= Signifikansnivå. Ved ensidig test:
= signifikansnivå.
Ved store stikkprøver brukes formelen under:

 | 0,005 | 0,01 | 0,025 | 0,05 |
 | 2,58 | 2,33 | 1,96 | 1,645 |
Wilcoxons tegnrangtest kan oppsummeres i følgende modell (F. Wenstrøp - 94):
1. Testmetode: Wilcoxons tegnrangtest
2. Nullhypotese Differansemedian = 0
3. Hjelpehypotese Differansemedian # 0
4. Bestem signifikansnivå 2 
5. Finn kritisk verdi C Bruk tabellen over
Forkastningsområdet Alle verdier som er < C - verdien
6. Beregn testobservatorverdien
Ranger differansene uten å ta hensyn til fortegnene. Gi minste differanse rang nr. 1 osv. Beregn T - = summen av rangene til de negative differansene. Beregn også T+.
7. Konklusjon:
Hvis testobervatorverdien er ekte mindre enn C, forkastes nullhypotesen til fordel til hjelpehypotese.