Titel
2
|
Statistik
Statistikforløb
Stokastisk variabel og sandsynlighedsfelt (1 modul)
For at indføre begrebet stokastisk variabel, asymmetrisk sandsynlighedsfelt, middelværdi/forventet værdi og spredning, tages udgangspunkt i et lykkehjul, hvor eleverne kan vinde guldkarameller eller lignende.
Eleverne skal i grupper give et bud på sandsynligheder og middelværdi før der samles op på klassen. Vi diskuterer, hvad det skal koste at købe et lod til spillet.
Spredning behandles kun gennem et matematisk værktøjsprogram.
Binomialfordeling (5 moduler)
Vi lægger ud med, at eleverne hver kaster 20 terninger og noterer antallet af seksere. Antallet (værdien af den stokastiske variabel) markeres med et kryds på tavlen, så vi på den måde for simuleret en binomialfordeling.
Vi definerer et binomialeksperiment, og herudfra hvornår en stokastisk variabel er binomialfordelt.
Geogebra anvendes til at opstille sandsynlighedsfordelingen som tabel og pinde/søjle-diagram, samt til bestemmelse af punktsandsynligheder og kumulerede sandsynligheder.
Middelværdi og spredning beregnes med og uden elektroniske hjælpemidler.
Der redegøres for formlen til bestemmelse af punktsandsynligheder, ved at se på et specifikt eksempel, og herudfra generalisere.
Binomialtest (3 moduler)
Vi skal jf. vejledningen omkring begreberne population, stikprøve, nulhypotese af typen p = p0, alternativ hypotese, teststørrelse, kritisk område, acceptområde, signifikansniveau og p-værdi.
Vi vil primært konkludere på baggrund af acceptområde og kritisk område, som bestemmes i Geogebra, men vil også på baggrund af en given eller beregnet p-værdi konkludere på testet.
Vi vil begrænse os til dobbeltsidet test.
Vi vil kun kort se på bias, konfudering og fejltyper ud fra eksempler uden at gøre det til genstand for afprøvning i evalueringen.
Konfidensintervaller (2 moduler)
Vi skal visuelt i Geogebra se at normalfordelingen approksimerer binomialfordelingen tilstrækkeligt fornuftigt, når my = n p > 5, og når n - my = n(1-p) > 5.
Vi ser på middelværdi og spredning i forhold til grafen, og indfører herudfra normale og exceptionelle udfald.
Konfidensintervallet beregnes dels ud fra formlen, dels som ”Z interval for andel” under statistik i Geogebras sandsynlighedslommeregner.
Vi udleder 95%-konfidensintervallet ud fra antagelsen, at 95% af alle udfald vil ligge inden for 2 gange spredningen fra den sande middelværdi, og under antagelse af, at middelværdi og spredning for populationen og stikprøven ligner hinanden.
Regression (2 moduler)
Lineær regression repeteres, og eleverne får lov til at eksperimentere med at finde den mindste kvadratsum ved manuelt at justere på modellinjen.
Residualerne beregnes i en liste og plottes i et residualplot. Vi ser på systematik samt den relative størrelse af residualerne i forhold til modelværdierne.
Eleverne gøres bekendt med den varsomhed vi skal udvise, når hældningskoefficienten kommer tæt på nul.
Vi diskuterer, hvorfor en model ikke behøver at gå gennem nogle af punkterne og overvejer modellers rækkevidde.
Vi ser på, hvordan et polynomium af graden n, altid kan bestemmes, så grafen går gennem n+1 punkter med forskellige x-værdier. Herfra diskuterer vi, om den fundne model er bedre end et polynomium med lavere grad, som måske ikke går gennem alle punkterne.
Vi bruger polynomisk regression til at lave en kryptering, hvor alle eleverne får en nøgle, men kun kan dekryptere, når de går sammen med to andre.
Opvarmning
I moduler der starter med teoretisk læreroplæg, varmes først op med få opgaver inden for brøkregning og potensregneregler, herunder rødder.
Faglige mål fra læreplanen
– anvende statistiske og sandsynlighedsteoretiske modeller til beskrivelse af data fra andre fagområder, foretage simuleringer, gennemføre hypotesetest, bestemme konfidensinterval, stille spørgsmål ud fra modellen og have blik for, hvilke svar der
kan forventes, samt være i stand til at formulere konklusioner i et klart sprog
– anvende funktionsudtryk i modellering af data, foretage simuleringer og fremskrivninger ud fra modellerne samt diskutere rækkevidde af modeller
Kernestof fra læreplanen
– anvendelse af lineær, eksponentiel, potens og polynomiel regression, herunder usikkerhedsbetragtning og residualplot
– kombinatorik, grundlæggende sandsynlighedsregning, sandsynlighedsfelt og stokastisk variabel, binomialfordeling samt normalfordelingsapproksimation hertil, konfidensinterval og hypotesetest i binomialfordelingen
Pensum
Kernestof Mat 2 hf: Kapitel 5, 6 og 10 fraregnet sætning 27 om residualspredning (i alt 26 sider)
Evaluering
Forløbet evalueres mundtligt gennem videoafleveringer:
- Redegørelse af formlen til beregning af punktsandsynligheder i en binomialfordeling.
- Udledning af konfidensintervallet under visse betingelser.
Forløbet evalueres skriftlig gennem afleveringer og forløbstest.
Specielt testes
- Bestemmelse af punktsandsynligheder og kumulerede sandsynligheder i binomialfordelingen.
- Opstilling af nulhypotese og dobbeltsidet test i forskellige tilfælde
- Bestemmelse og konklusion på konfidensintervaller
Tidsestimat
13 moduler af 95 min
|