Titel
14
|
6. Statistik
Statistik.
Pensum: Kapitel 5, 6 og 10 i Kernestof Mat 2, stx.
1. Stokastiske variable og binomialfordeling
-> Generelle stokastiske variable. Notation, sandsynligheder, middelværdi og spredning. Sandsynlighedsfordelinger
-> Definition af binomialfordelingen b(n,p).
-> Formel for sandsynligheder inkl. beskrivelse af kombinationer K(n,r) og Pascal's trekant.
-> Middelværdi og spredning af en binomialfordelt stokastisk variabel
------------------------------------------------------------------------
2. Binomialtest
-> Nulhypotese og opstilling af test (to-sidet, venstre eller højre)
-> Acceptområde og kritisk område
-> Signifikansniveau, p-værdi og fejltyper
------------------------------------------------------------------------
3. Konklusioner fra data
-> Normalfordelingsapproksimationen
-> Stikprøver og 95%-konfidensintervaller
-> Regression og mindste kvadraters metode
-> Residualer, residualplot, residualspredning.
-> Polynomiel regression
------------------------------------------------------------------------
Beskrivelse af emnet i læreplanen fra UVM:
Sandsynlighedsregning
Begrebet stokastisk variabel indgår i kernestoffet, men det er ikke tanken, at det skal gives en selvstændig behandling. Begrebet skal indføres i behandlingen af binomialfordelingen, hvorved man opnår en
notation, der gør det mere enkelt at formulere spørgsmål og opstille formler. Eleverne skal kunne håndtere beregninger med middelværdi, varians og spredning for en stokastisk variabel med en given
sandsynlighedsfordeling. Eleverne skal kunne håndtere begreberne stokastisk eksperiment og sandsynlighed, og de skal kunne
anvende binomialfordelingen til løsning af virkelighedsnære problemstillinger, dvs. de skal kunne beregne punktsandsynligheder og kumulerede sandsynligheder samt middelværdi og spredning. Desuden skal eleverne kunne tegne og kunne aflæse på et søjlediagram på baggrund af en binomialfordeling.
leverne skal kende betingelserne for, hvornår et empirisk datasæt kan betragtes som realiserede værdier af en binomialfordelt stokastisk variabel; herunder inddrages diskussion af eksperimenter med og
uden tilbagelægning. Hypotesetest i binomialfordelingen anvendes til at vurdere situationer, hvor der ud fra stikprøver sluttes
til generelle udsagn om en population. Bemærk, at eleverne ved den skriftlige prøve kun forventes at kunne håndtere to-sidet test, herunder
kunne opstille af simple nulhypoteser af typen p = p_0 .
Udgangspunktet for beregning af de forventede værdier i testet er den sandsynlighedsparameter p, som vi i den aktuelle situation betragter som ’den sande’ værdi for p i populationen. De centrale begreber i et binomialtest er population, stikprøve, nulhypotese, alternativ hypotese, teststørrelse, kritisk område, acceptområde, signifikansniveau og p-værdi. Konklusioner draget af et hypotesetest diskuteres med henblik på systematiske fejl (bias) og skjulte variable (konfundering). Eleverne skal opnå forståelse af begrebet nulhypotese, herunder at hypotesen altid opstilles, før stikprøven til belysning af hypotesen udtages, og at en påfaldende afvigende observation i én stikprøve peger på en ny hypotese, som testes på baggrund af en ny stikprøve.
Eleverne skal kunne bestemme konfidensintervaller for sandsynlighedsparameteren p (’den sande’ værdi for p i populationen) ud fra stikprøvens størrelse n og et stikprøveestimat for p (ofte kaldet pˆ )
med de indbyggede faciliteter, som et matematisk værktøjsprogram tilbyder, og de forventes herudfra at kunne uddrage den statistiske usikkerhed. Eleverne forventes også at kunne håndtere beregninger
med den eksakt udledte formel (gengivet i formelsamlingen) for usikkerhed baseret på normalfordelingsapproximationen. En rimelig normalfordelingsapproksimation kræver, at både n*p > 5 og
n(p-1 )>5 , men eleverne forventes ikke at argumentere for dette i besvarelsen af opgaver ved den skriftlige prøve.
Simuleringer og beregninger med binomialfordelingens sandsynlighedsfunktion giver gode muligheder for at diskutere løsningsmetodernes grad af præcision set i relation til praktisk anvendelse. Simulering kan desuden udnyttes til eksperimentelt at forstå statistiske sammenhænge, som er for svære at behandle teoretisk.
Eleverne skal kende begreberne normale udfald, der højst ligger to spredninger fra middelværdien, og exceptionelle udfald, der ligger mere end tre spredninger fra middelværdien. Begreberne er hentet fra
normalfordelingen, og normalfordelingsapproximationen til binomialfordelingen omtales gennem konkrete eksempler, der behandles grafisk i et matematisk redskabsprogram.
|