|
Hva er et trangere konfidensintervall, og hvordan beregne det?
Hvis man ønsker å finne alderen til "gjennomsnitts nordmannen" (populasjons-medianen), og intervjuer 10 personer som har en alder fra 12 - 85 år kan man med ganske stor sikkerhet si at aldersmedianen vil ligge mellom 12 -85 år. Dette er visste vi i grunnen fra før. Slik informasjon er for omtrentlig til å være til nytte. Vi behøver trangere konfidensintervall. Ved å avkorte spredningen, f.eks. ta bort de verdiene som ligger under nedre kvartil og øver øvre kvartil, sitter man kansje igjen med et konfidensintervall på mellom 30 - 45 år. Når man avkorter intervallet på denne måter reduserer man samtidig konfidensnivået. Sannsynligheten for å få rett reduseres. Men, som vi skal se, trenger denne redusksjonen av konfidensnivå ikke å bli så stor. Trangere konfidensintervall = Lavere konfidensnivå Når vi skal gjøre konfidensintervallet trangere kan dette gjøres på to måter:  Tosidig konfidensintervall Hvis man lager konfidensintervallet trangere ved å fjerne f.eks. de 5 laveste og de 5 høyeste verdiene kaller vi dette et tosidig konfidensintervall. Dette fordi vi fjerner like mange verdier på begge side av medianen. Et tosidig konfidensintervall, hvor de 5 høyeste og laveste verdiene er fjernet angis slik: [ ] Hvor høyt konfidensnivået blir ved ulike tosidige konfidensintervaller blir er vist i tabellen under. Tabellen tar for seg konfidensnivået for utvalg (n) opp til 20 enheter og en avgrensning opp til den 10 ordningsobservator nedenfra og ovenfra [ ]. | | X (min)= | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | | n = | X (max)= | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | | 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 25 | ,5000 ,7500 ,8750 ,9375 ,9688 ,9844 ,9822 ,9961 ,9980 ,9990 ,9995 ,99976 ,99988 ,999939 ,999969 ,999985 ,999992 ,999996 ,999998 ,999999 | ,3750 ,6250 ,7813 ,8750 ,9297 ,9609 ,9785 ,9883 ,9937 ,9966 ,9982 ,99902 ,99948 ,99973 ,99986 ,99992 ,99996 ,99999 | ,3125 ,5468 ,7110 ,8203 ,8906 ,9346 ,9614 ,9775 ,9871 ,9921 ,9958 ,9977 ,9987 ,99927 ,9996 ,99997 | ,2734 ,4922 ,6563 ,7734 ,8540 ,9077 ,9426 ,9648 ,9787 ,9873 ,9925 ,9956 ,9974 ,99983 | ,2461 ,4512 ,6123 ,7332 ,8204 ,8815 ,9232 ,9510 ,9691 ,9808 ,9882 ,9990 | ,2256 ,4160 ,5761 ,6982 ,7899 ,8565 ,9037 ,9364 ,9586 ,9955 | ,2095 ,3928 ,5455 ,6677 ,7621 ,8329 ,8847 ,9839 | ,1964 ,3709 ,5193 ,6407 ,7385 ,9524 | ,1855 ,3254 ,4965 ,8814 | ,1762 ,7474 | ,533 | ,4355 | | c | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | c = hvilket konfidensnivå som brukes [ ]. n = antall verdier i stikkprøven. Hvilke av disse overstående konfidensintervallene skal man så bruke? Vanlig praksis er å fastsette en nedre grense for sannsynligheten for å komme til korrekt konklusjon og så bruke det trengeste intervallet som tilfredstiller dette konfidensnivået. Jo trangere konfidensintervallet er, jo større er presisjonen, men jo lavere blir konfidensnivået eller sikkerheten/strong>. Hvis du vil ha både i pose og sekk, dvs. høy sikkerhet og høy presisjon, er eneste mulighet å øke stikkprøvestørrelsen. Men det koster penger. Tommelfingerregelen blandt statistikkerene er etterhvert å forlange et konfidensnivå på 95 %. En enklere måte å beregne det trangeste tosidige konfidensintervallet som kan aksepteres for å oppnå et bestemt konfidensnivå er vist i tabellen på neste side. Her går du rett inn på linjen for den aktuelle verdi av n og kolonnen for det aktuelle konfidensnivået. | Konfidensnivå | 0,999 | 0,998 | 0,99 | 0,98 | 0,95 | 0,90 | 0,50 | | n = 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 | 1 1 1 1 2 2 2 2 3 3 3 4 4 4 5 5 5 6 6 6 7 7 7 8 8 8 9 9 10 10 10 11 11 11 12 12 12 13 13 14 | 1 1 1 1 2 2 2 2 3 3 3 4 4 4 5 5 5 6 6 6 7 7 8 8 8 8 9 9 10 10 10 11 11 12 12 13 13 13 14 14 14 | 1 1 1 1 2 2 2 3 3 3 3 4 4 5 5 6 6 6 7 7 7 8 7 8 9 9 10 10 10 11 11 12 12 12 13 13 14 14 14 15 15 16 16 | 1 1 1 1 2 2 2 3 3 3 4 4 5 5 5 6 6 6 7 7 8 8 8 9 9 10 10 10 11 11 12 12 12 13 13 14 14 14 15 15 16 16 16 17 | 1 1 1 2 2 2 3 3 3 4 4 5 5 5 6 6 6 7 7 8 8 8 9 9 10 10 11 11 11 12 12 13 13 13 14 14 15 15 16 16 16 17 17 18 18 | 1 1 1 2 2 2 3 3 4 4 4 5 5 6 6 6 7 7 8 8 8 9 9 10 10 11 11 11 12 12 13 13 14 14 14 15 15 16 16 17 17 17 18 18 19 19 | 1 2 2 3 3 3 4 4 5 5 6 6 7 7 8 8 9 9 10 10 11 11 12 12 13 13 14 14 15 15 16 16 16 17 17 18 18 19 19 20 21 21 21 22 22 23 | For n over 50 brukes følgende formel for å beregne kritisk verdi (C-verdi):  1-2 | 0,999 | 0,998 | 0,99 | 0,98 | 0,95 | 0,90 | 0,50 |  | 3,29 | 3,09 | 2,58 | 2,33 | 1,98 | 1,645 | 0,67 |  | 0,0005 | 0,001 | 0,005 | 0,001 | 0,025 | 0,05 | 0,26 | Ensidige konfidensintervaller Hvis man velger å fjerne bare de høyeste eller bare de laveste verdiene i stikkprøven får man et ensidig konfidensintervall. Dette er hensiktsmessig i de tilfellene hvor man kun ønsker å estimere en øvre eller nedre grense. I denne sammenheng skiller vi mellom venstre- og høyre grense intervall. 
Venstre grense intervall Fjerner man bare de laveste verdiene i stikkprøven, sier vi at vi har et venstre grense intervall. Et slikt intervall angis slik: [ ] Høyre grense intervall Fjerner man bare de høyste verdiene i stikkprøven sier vi at vi har et høyre grense intervall. Et slikt intervall angis slik: [.................., ] er den greske bokstaven "alfa". Tosidig konfidensintervall 2 = feilsannsynligheten vi er villig til å tåle (f.eks. 5% = 2*0,025 = 0,5) 1 - 2 = konfidensnivået vi forlanger (f.eks. 95% = 1 - 0,05 = 0,95)
|