Holdet 2024 si - Undervisningsbeskrivelse

Undervisningsbeskrivelse

Stamoplysninger til brug ved prøver til gymnasiale uddannelser
Termin(er) 2024/25
Institution Espergærde Gymnasium og HF
Fag og niveau Statistik C
Lærer(e) Henning Friis Andersen
Hold 2024 si (2g3g2h si)

Oversigt over gennemførte undervisningsforløb
Titel 1 Grundlæggende sandsynlighedsregning
Titel 2 Diskrete sandsynlighedsfordelinger
Titel 3 Test i diskrete fordelinger
Titel 4 Kontinuerte fordelinger
Titel 5 Test i normalfordelingen
Titel 6 Fup i statistik
Titel 7 Simulation
Titel 8 Design af undersøgelser

Beskrivelse af de enkelte undervisningsforløb (1 skema for hvert forløb)
Titel 1 Grundlæggende sandsynlighedsregning

Kort om deskriptiv statistik

Kort om kombinatorik (nok til at kunne forstå binomialkoefficientens rolle i binomialfordelingen)

Udfald, hændelse, udfaldsrum, sandsynlighedsfordeling, sandsynlighedsfelt
P(X=x) og P(X<=x) (fordelingsfunktion)
Betinget sandsynlighed (P(A|B)=P(A og B)/P(B)
Uafhængighed: P(A|B)=P(A) alternativt P(A og B)=P(A)*P(B)
Det additive og det multilplikative princip (inkl betingelser)
Forventet værdi (E(X)), varians og spredning
Regneregler for E(X) (E(a*X1+b*X2+c)=a*E(X1)+b*E(X2)+c
Middelværdi, varians og spredning for gennemsnit af ens fordelte og uafhængige variable

Projekt i dette om betingede sandsynligheder i medicin udvikling (fase 1, 2 og 3 og endelig godkendelse) og forventet endelig indtjening
Indhold
Omfang Estimeret: 6,00 moduler
Dækker over: 4 moduler
Særlige fokuspunkter
Væsentligste arbejdsformer

Titel 2 Diskrete sandsynlighedsfordelinger

Definition af diskrete fordelinger
  Grundlægende egenskaber 0<=p(x)<=1, sum af alle p(x)=1

Den diskrete ligefordeling (definition, middelværdi)

Binomialfordelingen (definition, anvendelse, udledning, middelværdi (inkl. bevis), varians, spredning, mest sandsynlige udfald)

Poisson fordelingen (definition, anvendelse, middelværdi, varians og spredning)

Geometrisk fordeling vist men kun kort

Indhold
Omfang Estimeret: 5,00 moduler
Dækker over: 4 moduler
Særlige fokuspunkter
Væsentligste arbejdsformer

Titel 3 Test i diskrete fordelinger

Generel teori om test og konfidensintervaller
Statistisk model, statistisk hypotese, estimation af parametre, konfidensinterval, p-værdi

Test i binomialfordelingen
Test af p=p0, (eksakt) p-værdi, accept område, kritisk område, estimation af p, konfidensinterval for p, chi-i-anden test for dette
Test af pA=pB (sammenligning mellem to grupper), chi-i-anden test for dette, konfidensinterval for forskellen pA-pB

Test i poissonfordelingen
Test af lambda=lambda0, (chi-i-anden) p-værdi, estimation af lambda, konfidensinterval for lambda
Test af lambdaA=lambdaB (sammenligning mellem to grupper), chi-i-anden test for dette, konfidensinterval for forskellen lambdaA-lambdaB

Kort gennemgået hvordan man kan udvide til at sammenligne mere end to grupper

Projekt 2 om dette. Test af p=p0, pA=pB, lambda=lambda0 samt lambdaA=lambdaB i selvvalgte undersøgelser
Indhold
Omfang Estimeret: 6,00 moduler
Dækker over: 6 moduler
Særlige fokuspunkter
Væsentligste arbejdsformer

Titel 4 Kontinuerte fordelinger

Fordelinger givet ved tætheder
Sandsynlighed som areal (integral) under tætheden fra a til b
  Specielt er ssh. for enkelte punkter dermed 0
Middelværdi, median, varians og spredning for kontinuerte fordelinger
Normalfordelingens symmetriegenskab
Fordelingsfunktion ( F(x)=P(X<=x) )
Vigtige eksempler på kontinuerte fordelinger
  lige fordelingen, eksponential fordelingen, normal fordelingen
Mere om normalfordelingen
  Tætheden for N(0,1)
  Tætheden for N(my,sigma)
  Vigtige ssh'eder for N(0,1) (P([-1.96 ; 1.96]), P(X<=0), P(X<=1),..)
Store Tals Lov (gennemsnit af uafhængige og ens fordelte stokastiske variable vil approksimativt følge en normalfordeling)
Bestemmelse af normeringskonstant så den samlede ssh. bliver 1
Indhold
Omfang Estimeret: 7,00 moduler
Dækker over: 7 moduler
Særlige fokuspunkter
Væsentligste arbejdsformer

Titel 5 Test i normalfordelingen

Test af my=my0
Test af myA=myB
Parret t-test overfor uparret t-test (og fordelen ved parrat t-test når det er muligt)
Konfidensinterval for my
Konfidensinterval for myA-myB
Lineær regression som normalfordelingsmodel
Multipel lineær regression, herunder
  Multipel lineær regression
  p-værdi for om hældning er 0 i lineær regression
  Konfidensinterval for hældning i lineær regression
  Konfidensinterval for ændring i y ved ændring på k på x-aksen i Lin Reg
  Andengrads regression som multipel lineær regression med x og x^2

Projekt 3 om test af my=my0 og myA=myB i selvvalgt undersøgelse og mulitipel lineær regresssion af År og CO2 vs Temperaturstigning
Indhold
Omfang Estimeret: 8,00 moduler
Dækker over: 8 moduler
Særlige fokuspunkter
Væsentligste arbejdsformer

Titel 6 Fup i statistik

Forløb om fup i statistik

Fup i deskriptiv statistik
Valg af start/slut tidspunkt, valg af y-akse, relativ forskel vist men ikke de absolutte tal, N ikke oplyst, etc.

Fup i design
Kontrol gruppe ikke sammenlignelig, Mange ting undersøgt men kun få (en) ting rapporteret, ledende spørgsmål, misledende kausalitet (ved at A->B og A->C men undersøger kun B vs C), A sammenlignes med (B+C+D+E+...) og konkluderes så bedre end alle andre selvom det måske kun er bedre end B, etc.

Fup i analyse:
Outliers droppet uden videre,  analyse ikke præspecificeret (fisket efter analyse metode der giver det ønskede), massevis af test lavet med forudsigelig signifikans i mindst 5% af tilfældene, misledende vurdering af kausalitet, etc.
Indhold
Omfang Estimeret: 4,00 moduler
Dækker over: 3 moduler
Særlige fokuspunkter
Væsentligste arbejdsformer

Titel 7 Simulation

Brug af simulation i statistik

Test af hypotese ved simulation under hypotesen og optælling hvor mange gange noget mere ekstremt kom ud
Beregning af svære sandsynlighedsberegninger ved simulation
Vurdering af betydning af approksimationer ved simulation

Indhold
Omfang Estimeret: 3,00 moduler
Dækker over: 1 moduler
Særlige fokuspunkter
Væsentligste arbejdsformer

Titel 8 Design af undersøgelser

Gevinsten ved kontrol grupper
  og hvorfor man så alligevel ikke altid gør dette
Dobelltblindede randomiserede undersøgelser
cross-over undersøgelser (alle personer får begge "behandlinger" men i forskellig rækkefølge)
Styrkeberegning (myA=myB i t-test)
  (dette ses mest som supplerende stof og elever forventes ikke at kunne det)

Projekt 4 om dette. Fælles design af undersøgelse om effekt af "indgreb" på matematik test. Udført på lærerens sagesløse øvrige matematik hold og derefter analyserer
Indhold
Omfang Estimeret: 6,00 moduler
Dækker over: 7 moduler
Særlige fokuspunkter
Væsentligste arbejdsformer