Hypotesetesting for normalfordeling

Hypotesetester sjekker et resultat mot noe du allerede tror er sant. La X1,X2,,Xn være n uavhengige tilfeldige variabler med lik forventningsverdi μ og standardavvik σ. La X være gjennomsnittet av disse n tilfeldige variablene, så

X = 1 n i=1nX i.

X har da forventningsverdi μ og standardavvik  σ n. Du ønsker å utføre en hypotesetest på denne forventningsverdien. Du har en nullhypotese H0: μ = μ0 og tre mulige alternativhypoteser: Ha: μ < μ0, Ha: μ > μ0 eller Ha: μμ0. De to første alternativhypotesene hører til det du kaller en ensidig test, mens den siste er tosidig.

Ved hypotesetesting regner du på den alternative hypotesen for å si noe om nullhypotesen.

Regel

Hypotesetesting for normalfordeling

1.
Du setter opp en nullhypotese H0 mot en alternativ hypotese HA. H0: μ = μ0 mot Ha: μ > μ0 (eventuelt Ha: μ < μ0, Ha: μμ0).
2.
Deretter gjør du et eksperiment og finner at gjennomsnittsverdien er x. Du regner så ut sannsynligheten P (X x) for alternativhypotesen Ha: μ > μ0.
3.
Hvis denne sannsynligheten er mindre enn 1 %, 5 % eller 10 %, så forkaster du H0.

NB! Ved tosidig test må du gange p-verdien med 2 før du sjekker opp mot forkastingsområdet.

Eksempel 1

Som produksjonssjef i den nye brusfabrikken er du bekymret for at de ikke fyller flaskene slik de skal. Hver flaske skal fylles med 0,5L brus, men stikkprøver viser at 48 brusflasker har et gjennomsnitt 0,48L med empirisk standardavvik 0,1. Du lurer om du trenger å rekalibrere maskinene slik at de blir mer presise.

Dette er et klassisk tilfelle av hypotesetesting ved normalfordeling. Du følger nå oppskriften over og velger 10 % forkastningsnivå siden det kun er snakk om en mengde brus og ikke et liv- og død-tilfelle.

1.
Nullhypotesen er at det er 0,5 L i hver flaske:
μ0 = 0,5

Alternativhypotesen blir i dette tilfellet at flaskene ikke inneholder 0,5 L og at maskinene ikke er presise nok. Dette blir dermed en tosidig hypotesetest og du må derfor huske å gange p-verdien med 2 før du bestemmer om p-verdien er i forkastingsområdet. Dette er fordi normalfordelingen er symmetrisk så P (X k) = P (X k). Altså er det like sannsynlig å observere en like ekstrem høy verdi som en like ekstrem lav:

μ00,5
2.
Finner p-verdien ved å regne ut P (X 0,48): P (X 0,48) = P (Z 0,48 0,5 0,1 48 ) = P (Z 1,39) = 0,0823 p = 0,0823 2 = 0,1646 = 16,46%.
3.
Du har valgt at dersom maskinene skal rekalibreres må din p-verdi være mindre enn 10 %. Altså, det må være mindre enn 10 % sjanse for at maskinen fyller 0,5 L i snitt på flaskene. Din p-verdi er
p = 16,46% > 10%,

slik at H0 må beholdes og maskinen er fin slik den er.

Hadde p-verdien vært mindre enn forkastningsnivået ville det betydd at kalibreringen representert ved alternativhypotesen er signifikant bedre for bedriften.

Vil du vite mer?Registrer degDet er gratis!