|
Titel
16
|
Binomialtest - konfidensintervaller
Vi starter med at genkalde os, hvad der menes med sandsynlighed og begrebet en stokastisk variabel. Begge begreber er kendt fra 1.g.
Vi ser også på sandsynligheden for enten ... eller, som er en sum af sandsynligheder. Dette er vigtigt for beregninger og forståelse af binomialtest.
Vi ser på tabeller for en sandsynlighedsfordeling, og vi bestemmer sandsynligheder som eksempelvis P(X=5), P(X≤5) og P(X≥5).
Vi bestemmer også middelværdien.
Vi gentager betingelserne for, at der er tale om en binomalfordeling. Bl.a. at et eksperiment gentages n gange, at der er to mulige udfald, og at sandsynligheden for et udfald er p ("succes") og for det andet 1-p ("fiasko"). Resultatet af basiseksperimenterne er uafhængige og den stokastiske variabel X tæller antallet af "succeser" i de n basiseksperimenter.
n er antalsparameteren
p er sandsynlighedsparameteren
Der beregnes punktsandsyynligheder og kumulerede (kumulative) sandsynligheder i Nspire med kommandoerne binomPdf og binomCdf. Her er det netop vigtigt at vide, at binomCdf beregner en sum af sandsynligheder.
Middelværdien bestemmes som
μ=np og spredningen som σ=\sqrt(np(1-p)) , altså σ=√(np(1-p)) (rodtegnet dækker ikke korrekt).
Herefter skifter vi over til at se på søjlediagrammer for binomialfordelingen, og vi ser på summen af sandsynligheder i højre og venstre side. Her arbejder vi i GeoGebra.
Vi relaterer søjlediagrammet og kumuleret sandsynlighed til kommandoerne:
invbinom
binomCdf
i Nspire.
Vi arbejder med kumulerede sandsynligheder på 5% med kommandoerne.
Vi taler om, at inv her betegner invers, og output er det antal der kræves, for at nå en bestemt kumuleret sandsynlighed.
Der fører os hen til at tale om, hvor vi tager udgangspunkt i en kandidats vælgertilslutning ved et tidligere valg og resultatet for en stikprøve, hvor vi starter med et tosidet test:
nulhypotese ("ingen ændring")
alternativ hypotese ("en ændring")
stikprøver og stikprøvestørrelsen n
acceptområdet
det kritiske område
signifikansniveau
og vigtigt at de kritiske værdier i det kritisk områder ved at 5% signifikansniveau er for
P(X≤x)≤2,5% og P(X≥x)≤2,5%
Vi taler også om, at man godt kan arbejde med et signifikansniveau på fx 1% eller 10%, og vi ser på konsekvensen for acceptområdet.
Vi lærer om beregning af og brug af p-værdien. Her lærer vi, at man skal tage udgangspunkt i middelværdien og observationen, og bestemme summen af højre og venstre side for de kumulerede sandsynligheder.
Vi lærer om, hvornår man og hvordan man arbejder med et etsidet binomialtest.
Konfidensintervaller
Vi bevæger os over mod problemstillinger, hvor der skal bestemmes konfidensintervaller. Her er tre vigtige begreber:
p̂ som er stikprøvens andel, estimatet for en sandsynlighed
p som er populationens andel, den sande sandsynlighedsparameter
konfidensinterval (ofte 95%)
VI taler en del om, hvad men præcist skal forstå ved et konfidensinterval, nemlig at ved gentagne forsøg vil 95% af konfidensintervallerne vil indeholde den sande sandsynlighedsparameter. (Her forudsættes, at der arbejdes med et 95% konfidensinterval!)
Vi lærer om normalfordelingsapproksimationen.
Vi taler om, at normalfordelingen er en kontinuert fordeling. Vi ved fra tidligere at binomialfordelingen er en diskret fordeling.
Vi lærer som spredningen - hvad det dækker over - og vi lærer at beregne spredning og konfidensinterval. Igen er middelværdien vigtig.
Her er det vigtigt at:
P(μ - 1,96σ ≤ X μ +1,96σ ) = 0,95
Naturligvis lærer vi også at bruge konfidensintervallet i virkelighedsnære problemstillinger, hvor vi kan evaluere, om der fx er sket en ændring i vælgertilslutning.
Desuden lærer vi om en stikprøves størrelse i forhold til en population, og her taler vi om stikprøver med eller uden tilbagelægning. Som en tommelfingerregel:
Stikprøven skal maksimalt udgøre 10% af populationens størrelse.
Bevis
Ræsonnemt for formlen for beregning af konfidensinterval.
Undervisningsmateriale
Bog (PDF-fil) fra Mathematicus (mathematicus.dk).
Se ved de enkelte moduler.
Alle PDF-filer placeret ved modulerne er relevante.
Alle (web)links er relevante.
Formelsamlingen.
Hele forløbet findes på holdets OneNote-sider ved sektionerne "Hypotestest i binomialfordelingen" og "Konfidensintervaller". Alle undersider er relevante.
Undervisningsmateriale slut
|