Statistik viden eller tilfældighed
|
|
|
- Andreas Christoffersen
- 10 år siden
- Visninger:
Transkript
1 MATEMATIK i perspektiv Side 1 af 9 DNA-analyser 1 Sandsynligheden for at en uskyldig anklages Følgende histogram viser, hvordan fragmentlængden for et DNA-område varierer inden for befolkningen. Der indgår 315 tilfældigt udvalgte personer og observationerne er grupperet i intervaller af længde 3 mm Fragmentlængde Vi går ud fra at fordelingen er repræsentativ for befolkningen. Antag nu at et spor har en fragmentlængde på 58 mm. Hvor stor del af befolkningen vil have en fragmentlængde, der er overensstemmende med sporet, hvis der benyttes en acceptgrænse på 3 mm? Antag at befolkningsvariationen er som ovenfor for alle 8 DNA-områder, der udgør DNA-profilen, og at de otte fragmentlængder er uafhængige af hinanden. Hvor stor en del af befolkningen kan have samme DNA-profil, som et givet spor?
2 MATEMATIK i perspektiv Side 2 af 9 2 Konstant måleusikkerhed Punkt-plottet i teksten tyder på at måleusikkerheden ikke er afhængig af fragmentlængden. Man kan undersøge dette nærmere ved at beregne spredningen af L1 L2, hvor L 1 og L 2 er to målinger af samme fragmentlængde, for par ( L1, L 2) grupperet efter gennemsnittet af L1 og L 2. I den følgende tabel er 1000 par delt op i to grupper; midtpunktet af intervallet fra 40 til 180 er brugt til at dele op efter. Beregn spredningen af L1 L2 i hver af de to grupper. Interval Hyppighed af L L når 1 2 L1 L2 < Hyppighed af L L når 1 2 L1 L2 > ] 2,5; 2,0] 3 1 ] 2,0; 1,5] 9 6 ] 1,5; 1,0] ] 1,0; 0,5] ] 0,5; 0,0] ]0, 0; 0,5] ]0,5; 1,0] ]1, 0; 1, 5] ]1, 5; 2,0] 21 7 ]2,0; 2,5] 2 3 ]2,5; 3,0] 1 0
3 MATEMATIK i perspektiv Side 3 af 9 Sandsynlighedsberegninger i Plejebo-sagen 3 Binomialsandsynligheder De resultater, der er illustreret på figur 1 i teksten, fik man ved at lave simulationseksperimenter, men ved brug af binomialsandsynligheder kan man få det samme frem. Antallet af dødsfald på en afdeling i løbet af to år kaldes X. Når man går ud fra den model, der lå bag simulationseksperimenterne, gælder der, at X er binomialfordelt med antalsparameter n = 730 og sandsynlighedsparameter p = 16 / 730. a) Find PX ( 40) og PX ( 44) ved brug af for eksempel TI-83. Hvis man ser på 2000 afdelinger, vil antallet Y af afdelinger, der har 44 dødsfald eller mere, være binomialfordelt med n = 2000 og p= P( X 44). b) Find sandsynligheden for at der er mindst én afdeling med mere end 43 dødsfald. Find sandsynligheden for, at der er mindst én afdeling med mere end 39 dødsfald, og sammenlign med resultatet af simulationseksperimenterne i teksten. c) Find sandsynligheden for, at der i løbet af 2000 år vil være mindst en afdeling ud af 2000 med flere end 43 dødsfald, når de 2000 år tænkes delt op i 1000 par på hvert 2 år.
4 MATEMATIK i perspektiv Side 4 af 9 4 Poissonsandsynligheder Modellen kan ændres så der godt kan ske flere dødsfald pr. dag. I stedet for at opdele de to år i 730 dage kan man opdele i n = timer eller n = minutter. Den tilsvarende sandsynlighed p, for at der sker et dødsfald i løbet af den pågældende tidsenhed, skal så vælges således at n p= 16. Jo højere n jo mere realistisk er modellen, men der er en grænse for hvor højt n en lommeregner som for eksempel TI-83 kan klare, når man beregner binomialsandsynligheder. Man kan imidlertid vise, at når man lader n gå mod uendelig og samtidig sørger for at n p= λ, så gælder der, at binomialsandsynligheden n px (1 p) x n x går mod e λ λ x (1) x! En sandsynlighedsfordeling af sidstnævnte type, hvor x gennemløber tallene 0,1,2, kaldes en poissonfordeling. n x a) Benyt at (1 + ) går mod e x, når n går mod uendelig, til at vise (1); n binomialsandsynligheden kan for eksempel først omskrives til np ( np p) ( np px + p) n p 1 (1 ) n ( ) x x! n 1 p b) Kumulerede poissonsandsynligheder kan udregnes på TI-83. Antag at Z er poissonfordelt med λ= 16. Find PZ ( 20) og PZ ( 44), og sammenlign med de tilsvarende sandsynligheder i en binomialfordeling med n = 730 og p = 16 / 730.
5 MATEMATIK i perspektiv Side 5 af 9 5 Gevinster i Lotto Vi vil se på, hvordan sandsynligheden for at vinde i lotto afhænger af antallet af rækker, der spilles. En lotto-række består af 7 af tallene fra 1 til 36, og der er gevinst, hvis mindst 4 af disse er blandt de 7 vindertal, der senere udtrækkes blandt tallene fra 1 til 36. Antallet af rigtige på en given lottorække betegnes X. a) Beregn PX= ( 4), PX= ( 5), PX= ( 6) og PX= ( 7). Hvis man spiller flere rækker, vil hver enkelt række isoleret set have samme gevinstsandsynlighed, men samtidig ved man, at jo flere rækker man spiller jo større gevinstsandsynlighed har man. b) Beregn sandsynligheden for gevinst, når man spiller henholdsvis 1, 10 og 100 rækker.
6 MATEMATIK i perspektiv Side 6 af 9 Fødes der færre og færre drenge i forhold til piger? 6 Test af hypoteser I 1996 offentliggjorde Henrik Møller en artikel i The Lancet, hvor han gjorde opmærksom på, at der er tegn på, at der efter 1951 fødes færre og færre drenge i forhold til piger. Analysen byggede på tallene i nedenstående tabeller, som er offentligt tilgængelige: år Antal drenge Procent drenge år Antal drenge Procent drenge , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , ,14 I det følgende betegner x antal år efter 1951, og y procent drengefødsler det pågældende år. Et plot af punkterne ( x, y ) viser måske nok en faldende tendens, men ikke mere end at man nok synes, at det kunne skyldes tilfældige udsving.
7 MATEMATIK i perspektiv Side 7 af 9 51,80 51,60 51,40 51,20 51, Regressionslinien gennem punkterne har hældningen 0,0054, og vi skal nu se, hvordan man kan vurdere om denne afvigelse fra 0 kan skyldes tilfældigheder. Hvis der ikke sker nogen ændring i sandsynligheden for at få en dreng i perioden fra 1951 til 1995, kan de 45 observationer stort set (NB antal fødsler varierer noget) opfattes som resultater af gentagelser af samme eksperiment. Et eksperiment, der giver resultater med en middelværdi på ca. 51,4 og en spredning på ca. 0,2. Den vandrette linie, der går gennem middelværdierne for hvert år, kaldes den sande regressionslinie, og den vil altså have hældningen 0. Vi vil finde ud af, hvordan hældningerne fordeler sig for regressionslinier til et stort antal simulerede observationssæt, ved hjælp af et program på TI-83, der er vist nedenfor: : 0 S : 1 K : seq(x,x,1,45) L 1 : Input N : While K N : randnorm(51.4,0.2,45) L 2 : LinReg(a+bx) L 1,L 2,Y 1 : Y(1) 1 Y(0) 1 H : (abs( H ) ) +S S : K+1 K : End : Disp P =, S/N I hvert af årene 1 til 45 (svarende til 1951 til 1995) vælger lommeregneren tilfældigt et tal fra en normalfordeling med middel 51,4 og spredning 0,2. Disse tal lægges i L 2 og årene lægges i L 1. Antallet af observationssæt kaldes N, og H er hældningen af en simuleret regressionslinie.
8 MATEMATIK i perspektiv Side 8 af 9 Programmet giver en P-værdi, der siger, hvor ofte den simulerede hældning har været under 0,0054 eller over 0,0054. Når man skal vurdere P-værdien bruger man normalt følgende regel: Hvis P er under 0,05 forkaster man den hypotese man vil teste; i dette tilfælde hypotesen: der sker ikke nogen ændring i andelen af drengefødsler. a) Kør programmet med for eksempel N lig med 100 (det tager ca. 10 minutter), og lav en passende konklusion. b) Man kan godt lave andre, mere enkle tests: hvis yx betegner andelen af drengefødsler x år efter 1950, kan man se på forskellene dx = yx+ 23 yx.ved optælling ses, at 7 ud af 22 forskelle er negative. Antallet af negative differenser kaldes D. Hvis det er rigtigt, at der ikke sker nogen ændring i sandsynligheden for at få en dreng, skulle man forvente lige mange negative og positive differenser. Beregn PD ( 7) under forudsætning af, at sandsynligheden for en negativ differens er 0,5. Hvad ville man konkludere på baggrund af dette test med hensyn til, om der sker ændring af sandsynligheden for at føde en dreng. c) I ovenstående test udnytter man ikke den information, der ligger i differensernes størrelse, man ser kun på fortegnet. Lav et plot af differenserne i for eksempel Excel. Viser dette plot tegn på, at der sker ændring af sandsynligheden for at føde en dreng?
9 MATEMATIK i perspektiv Side 9 af 9 7 Misvisende sammenligninger a) Lav selv eksempler som de fiktive avisnotitser, hvor man får falske sammenhænge fordi man ikke deler op efter betydningsfulde variable. b) Find autentiske eksempler i aviser eller tidsskrifter c) Diskuter følgende tabel, der viser at man kan vende sammenhænge om. Her virker behandling 2 bedst i begge patientgrupper, mens behandling 1 ser ud til at virke bedst, hvis ikke man tager hensyn til, hvor raske patienterne er. Behandling 1 Behandling 2 Patient Overlevelse Pct. der Patient Overlever Pct. der tilstand ja nej overlever tilstand ja nej overlever Værre % Værre % Bedre % Bedre % Alle % Alle % Konstruer selv tilsvarende eksempler. d) I det følgende eksempel har man samme overlevelse for de to behandlinger i begge patientgrupper, og samme overlevelse i den samlede gruppe. Prøv at beskrive, hvorfor det går godt at sammenligne i den samlede tabel. Prøv at formulere en generel betingelse for, at man må have lov til at slå grupper sammen. Behandling 1 Behandling 2 Patient Overlevelse Pct der Patient Overlever Pct med tilstand ja nej overlever tilstand ja nej overlever Dårlig % Dårlig % God % God % Alle % Alle % e) Spørgsmålet om sammenligne grupper, der har fået forskellige behandlinger spiller fx en meget stor rolle i den kliniske afprøvning af lægemidler. Skal man sammenligne to lægemidler, er det vigtigt, at sikre så godt man nu kan, at det ene ikke bliver givet til gruppe relativt raske patienter, mens det andet bliver givet til nogen der i udgangspunktet er sygere. Dette prøver man at forhindre ved at udføre det, der hedder randomiserede forsøg, hvor man for hver patient trækker lod om behandlingen. Herved har man ingen garanti for at få sammenlignelige grupper, men man forhindrer i hvert fald, at et bestemt middel på forhånd bevidst favoriseres. Diskuter, en sådan fremgangsmåde i lyset af resultaterne fra opgave 4.
Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 136
Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 36 Det er besværligt at regne med binomialfordelingen, og man vælger derfor ofte at bruge en approksimation med normalfordeling. Man
Løsninger til kapitel 5
1 Løsninger til kapitel 5 Opgave 51 Det nemmeste er her at omskrive alle sandsynlighederne til differenser mellem kumulerede sandsynligheder, dvs af sandsynligheder af formen, og derefter beregne disse
Note til styrkefunktionen
Teoretisk Statistik. årsprøve Note til styrkefunktionen Først er det vigtigt at gøre sig klart, at når man laver statistiske test, så kan man begå to forskellige typer af fejl: Type fejl: At forkaste H
2. Ved et roulettespil kan man vinde 0,10,100, 500 og 1000 kr. Sandsynligheden for gevinsterne ses af følgende skema:
Der er hjælp til opgaver med # og facit på side 6 1. Et eksperiment kan beskrives med følgende skema: u 1 2 3 4 5 P(u) 0,3 0,2 0,1 0,2 x Bestem x og sandsynligheden for at udfaldet er et lige tal.. 2.
Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.
Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 9, 2015 Sandsynlighedsregning og lagerstyring Normalfordelingen
2 -test. Fordelingen er særdeles kompleks at beskrive med matematiske formler. 2 -test blev opfundet af Pearson omkring år 1900.
2 -fordeling og 2 -test Generelt om 2 -fordelingen 2 -fordelingen er en kontinuert fordeling, modsat binomialfordelingen som er en diskret fordeling. Fordelingen er særdeles kompleks at beskrive med matematiske
Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/
Program: 1. Repetition af vigtige sandsynlighedsfordelinger: binomial, (Poisson,) normal (og χ 2 ). 2. Populationer og stikprøver 3. Opsummering af data vha. deskriptive størrelser og grafer. 1/29 Binomial
Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0
Hypotesetest Hypotesetest generelt Ingredienserne i en hypotesetest: Statistisk model, f.eks. X 1,,X n uafhængige fra bestemt fordeling. Parameter med estimat. Nulhypotese, f.eks. at antager en bestemt
Oversigt. Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger
Introduktion til Statistik Forelæsning 2: og diskrete fordelinger Oversigt 1 2 3 Fordelingsfunktion 4 Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 017 Danmarks Tekniske Universitet 2800
Ovenstående figur viser et (lidt formindsket billede) af 25 svampekolonier på en petriskål i et afgrænset felt på 10x10 cm.
Multiple choice opgaver Der gøres opmærksom på, at ideen med opgaverne er, at der er ét og kun ét rigtigt svar på de enkelte spørgsmål. Endvidere er det ikke givet, at alle de anførte alternative svarmuligheder
Kvantitative Metoder 1 - Efterår Dagens program
Dagens program Approksimation af binomialsandsynligheder, Afsnit 4.5 Multinomial fordeling, Afsnit 4.8 Negativ binomialfordeling, Afsnit 4.4 Poisson fordeling og Poisson process, Afsnit 4.6 Kontinuerte
Note om Monte Carlo metoden
Note om Monte Carlo metoden Kasper K. Berthelsen Version 1.2 25. marts 2014 1 Introduktion Betegnelsen Monte Carlo dækker over en lang række metoder. Fælles for disse metoder er, at de anvendes til at
Personlig stemmeafgivning
Ib Michelsen X 2 -test 1 Personlig stemmeafgivning Efter valget i 2005 1 har man udspurgt en mindre del af de deltagende, om de har stemt personligt. Man har svar fra 1131 mænd (hvoraf 54 % har stemt personligt
Program. Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering. Test for ens spredninger
Program Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering Helle Sørensen E-mail: [email protected] I formiddag: Analyse af ikke-parrede stikprøver: repetition of rettelse af fejl! Lidt
Elementær sandsynlighedsregning
Elementær sandsynlighedsregning Sandsynlighedsbegrebet Et udfaldsrum S er mængden af alle de mulige udfald af et eksperiment. En hændelse A er en delmængde af udfaldsrummet S. Den hændelse, der ikke indeholder
Kvantitative Metoder 1 - Forår 2007
Dagens program Kapitel 4: Diskrete fordelinger Hypergeometrisk fordeling, Afsnit 4.3 Multinomial fordeling, Afsnit 4.8 Geometrisk fordeling og Negativ binomialfordeling (Inverse Sampling), Afsnit 4.4 Approksimation
for gymnasiet og hf 2016 Karsten Juul
for gymnasiet og hf 75 50 5 016 Karsten Juul Statistik for gymnasiet og hf Ä 016 Karsten Juul 4/1-016 Nyeste version af dette håfte kan downloades fra http://mat1.dk/noter.htm HÅftet mç benyttes i undervisningen
J E T T E V E S T E R G A A R D
BINOMIALT EST J E T T E V E S T E R G A A R D F I P B I O L O G I M A R S E L I S B O R G G Y M N A S I U M D. 1 3. M A R T S 2 0 1 9 K A L U N D B O R G G Y M N A S I U M D. 1 4. M A R T S 2 0 1 9 HVEM
Løsninger til kapitel 1
Opgave. a) observation hyppighed frekvens kum. frekvens 2,25,25 3,875,325 2 3,875,5 3 3,875,6875 4,625,75 5,625,825 6,,825 7 2,25,9375 8,,9375 9,625, Frekvenser illustreres i et pindediagram,2,8,6,4,2,,8,6,4,2
Produkt og marked - matematiske og statistiske metoder
Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 11, 2016 1/22 Kursusindhold: Sandsynlighedsregning og lagerstyring
for matematik pä B-niveau i hf
for matematik pä B-niveau i hf 014 Karsten Juul TEST 1 StikprÅver... 1 1.1 Hvad er populationen?... 1 1. Hvad er stikpråven?... 1 1.3 Systematiske fejl ved valg af stikpråven.... 1 1.4 TilfÇldige fejl
Elementær sandsynlighedsregning
Elementær sandsynlighedsregning Sandsynlighedsbegrebet Et udfaldsrum S er mængden af alle de mulige udfald af et eksperiment. En hændelse A er en delmængde af udfaldsrummet S. Et sandsynlighedsmål er en
3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve
Temaopgave i statistik for
Temaopgave i statistik for matematik B og A Indhold Opgave 1. Kast med 12 terninger 20 gange i praksis... 3 Opgave 2. Kast med 12 terninger teoretisk... 4 Opgave 3. Kast med 12 terninger 20 gange simulering...
Simpsons Paradoks. Et emnearbejde om årsag og sammenhæng i kvantitative undersøgelser. Inge Henningsen
Simpsons Paradoks Et emnearbejde om årsag og sammenhæng i kvantitative undersøgelser Afdeling for Anvendt Matematik og Statistik Københavns Universitet 1 Simpsons Paradoks -Et emnearbejde om årsag og sammenhæng
Statistik. Peter Sørensen: Statistik og sandsynlighed Side 1
Statistik Formålet... 1 Mindsteværdi... 1 Størsteværdi... 1 Ikke grupperede observationer... 2 Median og kvartiler defineres ved ikke grupperede observationer således:... 2 Middeltal defineres ved ikke
Løsning til eksaminen d. 14. december 2009
DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,
Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.
Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet March 1, 2013 Sandsynlighedsregning og lagerstyring Normalfordelingen
Kapitel 4 Sandsynlighed og statistiske modeller
Kapitel 4 Sandsynlighed og statistiske modeller Peter Tibert Stoltze [email protected] Elementær statistik F2011 1 Indledning 2 Sandsynlighed i binomialfordelingen 3 Normalfordelingen 4 Modelkontrol
Kvantitative Metoder 1 - Forår 2007
Dagens program Kapitel 8.7, 8.8 og 8.10 Momenter af gennemsnit og andele kap. 8.7 Eksempel med simulationer Den centrale grænseværdisætning (Central Limit Theorem) kap. 8.8 Simulationer Normalfordelte
1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...
Indhold 1 Statistisk inferens: Hypotese og test 2 1.1 Nulhypotese - alternativ.................................. 2 1.2 Teststatistik........................................ 3 1.3 P-værdi..........................................
Kønsproportion og familiemønstre.
Københavns Universitet Afdeling for Anvendt Matematik og Statistik Projektopgave forår 2005 Kønsproportion og familiemønstre. Matematik 2SS Inge Henningsen februar 2005 Indledning I denne opgave undersøges,
I. Deskriptiv analyse af kroppens proportioner
Projektet er delt i to, og man kan vælge kun at gennemføre den ene del. Man kan vælge selv at frembringe data, fx gennem et samarbejde med idræt eller biologi, eller man kan anvende de foreliggende data,
Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo
Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte
Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)
Formelsamlingen 1 Regneregler for middelværdier M(a + bx) a + bm X M(X+Y) M X +M Y Spredning varians og standardafvigelse VAR(X) 1 n n i1 ( X i - M x ) 2 Y a + bx VAR(Y) VAR(a+bX) b²var(x) 2 Kovariansen
Statistiske modeller
Statistiske modeller Statistisk model Datamatrice Variabelmatrice Hændelse Sandsynligheder Data Statistiske modeller indeholder: Variable Hændelser defineret ved mulige variabel værdier Sandsynligheder
Statistik Lektion 2. Betinget sandsynlighed Bayes regel Diskrete stokastiske variable Middelværdi og varians for diskret SV Binomialfordelingen
Statistik Lektion etinget sandsynlighed ayes regel Diskrete stokastiske variable Middelværdi og varians for diskret SV inomialfordelingen Repetition Udfaldsrum S Hændelse S Simpel hændelse O i 1, 3 4,
Teoretisk Statistik, 2. december 2003. Sammenligning af poissonfordelinger
Uge 49 I Teoretisk Statistik, 2. december 2003 Sammenligning af poissonfordelinger o Generel teori o Sammenligning af to poissonfordelinger o Eksempel Opsummering om multinomialfordelinger Fishers eksakte
Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau
Hvad skal vi lave? 1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ. Teststatistik P-værdi Signifikansniveau 2 t-test for middelværdi Tosidet t-test for middelværdi Ensidet t-test for middelværdi
Institut for Matematiske Fag Sandsynlighedsregning og Statistik 2. R opgaver
Institut for Matematiske Fag Sandsynlighedsregning og Statistik 2 Københavns Universitet Susanne Ditlevsen og Helle Sørensen R opgaver Det er en god ide at vænne sig til at skrive kommandoerne i en editor
Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele
Anvendt Statistik Lektion 4 Hypotesetest generelt Test for middelværdi Test for andele Hypoteser og Test Hypotese I statistik er en hypotese en påstand om en populationsparameter. Typisk en påstand om
for matematik pä B-niveau i hf
for matematik pä B-niveau i hf 75 50 5 016 Karsten Juul GRUPPEREDE DATA 1.1 Hvad er deskriptiv statistik?...1 1. Hvad er grupperede og ugrupperede data?...1 1.1 Eksempel pä ugrupperede data...1 1. Eksempel
Kapitel 7 Forskelle mellem centraltendenser
Kapitel 7 Forskelle mellem centraltendenser Peter Tibert Stoltze [email protected] Elementær statistik F2011 1 / 29 Indledning 1. z-test for ukorrelerede data 2. t-test for ukorrelerede data med ens
for gymnasiet og hf 2017 Karsten Juul
for gymnasiet og hf 75 50 5 017 Karsten Juul Statistik for gymnasiet og hf 017 Karsten Juul 5/11-017 Nyeste version af dette hæfte kan downloades fra http://mat1.dk/noter.htm Hæftet må benyttes i undervisningen
Kvantitative Metoder 1 - Forår 2007. Dagens program
Dagens program Hypoteser: kap: 10.1-10.2 Eksempler på Maximum likelihood analyser kap 9.10 Test Hypoteser kap. 10.1 Testprocedure kap 10.2 Teststørrelsen Testsandsynlighed 1 Estimationsmetoder Kvantitative
Produkt og marked - matematiske og statistiske metoder
Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 19, 2016 1/26 Kursusindhold: Sandsynlighedsregning og lagerstyring
Binomialfordelingen. X ~ bin(n,p): X = antal "succeser" i n uafhængige forsøg, der alle har samme sandsynlighed p for at ende med succes.
Uge 9 Teoretisk Statistik 23. februar 24 1. Binomialfordelingen 2. Den hypergeometriske fordeling 3. Poissonfordelingen 4. Den negative binomialfordeling 5. Gammafordelingen Binomialfordelingen X ~ bin(n,p):
Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ 2 -test og Goodness of Fit test.
Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ -test og Goodness of Fit test. Anvendelser af statistik Statistik er et levende og fascinerende emne, men at læse om det er alt
Repetition. Diskrete stokastiske variable. Kontinuerte stokastiske variable
Normal fordelingen Normal fordelingen Egenskaber ved normalfordelingen Standard normal fordelingen Find sandsynligheder ud fra tabel Transformation af normal fordelte variable Invers transformation Repetition
Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se
Epidemiologi og biostatistik. Uge, torsdag 5. februar 00 Morten Frydenberg, Institut for Biostatistik. Type og type fejl Statistisk styrke Nogle speciale metoder: Normalfordelte data : t-test eksakte sikkerhedsintervaller
Normalfordelingen og Stikprøvefordelinger
Normalfordelingen og Stikprøvefordelinger Normalfordelingen Standard Normal Fordelingen Sandsynligheder for Normalfordelingen Transformation af Normalfordelte Stok.Var. Stikprøver og Stikprøvefordelinger
Stastistik og Databehandling på en TI-83
Stastistik og Databehandling på en TI-83 Af Jonas L. Jensen ([email protected]). 1 Fordelingsfunktioner Husk på, at en fordelingsfunktion for en stokastisk variabel X er funktionen F X (t) = P (X t) og at
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Indledende om Signifikanstest Boldøvelser
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Indledende om Signifikanstest Boldøvelser 1 Påstand: Et nyt præparat M virker mod migræne. Inden præparatet kan markedsføres, skal denne påstand
Projekt 8.3 Hvordan undersøges om et talmateriale normalfordelt?
Projekt 8.3 Hvordan undersøges om et talmateriale normalfordelt? Projektet drejer sig om at udvikle en metode, til at undersøge om et givet talmateriale med rimelighed kan siges at være normalfordelt.
Matematik A. Studentereksamen. Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet
Matematik A Studentereksamen Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet stx11-matn/a-080501 Tirsdag den 8. maj 01 Forberedelsesmateriale til stx A Net MATEMATIK Der
Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)
Afdeling for Biostatistik Bo Martin Bibby 23. november 2006 Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Vi betragter 4699 personer fra Framingham-studiet. Der er oplysninger om follow-up
Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ
Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet
Forelæsning 3: Kapitel 5: Kontinuerte fordelinger
Kursus 02402 Introduktion til Statistik Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.
Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke. 1/23 Opsummering af fordelinger X 1. Kendt σ: Z = X µ σ/ n N(0,1)
Kvantitative Metoder 1 - Efterår Dagens program
Dagens program Estimation: Kapitel 9.7-9.10 Estimationsmetoder kap 9.10 Momentestimation Maximum likelihood estimation Test Hypoteser kap. 10.1 Testprocedure kap 10.2 Teststørrelsen Testsandsynlighed 1
Teoretisk Statistik, 13 april, 2005
Poissonprocessen Teoretisk Statistik, 13 april, 2005 Setup og antagelser Fordelingen af X(t) og et eksempel Ventetider i poissonprocessen Fordeling af ventetiden T 1 til første ankomst Fortolkning af λ
Hvad er danskernes gennemsnitshøjde? N = 10. X 1 = 169 cm. X 2 = 183 cm. X 3 = 171 cm. X 4 = 113 cm. X 5 = 174 cm
Kon densintervaller og vurdering af estimaters usikkerhed Claus Thorn Ekstrøm KU Biostatistik [email protected] Marts 18, 2019 Slides @ biostatistics.dk/talks/ 1 Population og stikprøve 2 Stikprøvevariation
Basal Statistik Kategoriske Data
Basal Statistik Kategoriske Data 8 oktober 2013 E 2013 Basal Statistik - Kategoriske data Michael Gamborg Institut for sygdomsforebyggelse Københavns Universitetshospital [email protected]
Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19
Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 For test med signifikansniveau α: p < α forkast H 0 2/19 p-værdi Betragt tilfældet med test for H 0 : µ = µ 0 (σ kendt). Idé: jo større
Analyse af måledata II
Analyse af måledata II Usikkerhedsberegning og grafisk repræsentation af måleusikkerhed Af Michael Brix Pedersen, Birkerød Gymnasium Forfatteren gennemgår grundlæggende begreber om måleusikkerhed på fysiske
UNDERVISNINGSEFFEKT-MODELLEN 2006 METODE OG RESULTATER
UNDERVISNINGSEFFEKT-MODELLEN 2006 METODE OG RESULTATER Undervisningseffekten udregnes som forskellen mellem den forventede og den faktiske karakter i 9. klasses afgangsprøve. Undervisningseffekten udregnes
Afsnit E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse
Afsnit 8.3 - E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse Først skal normalfordelingen lige defineres i Maple, så vi kan benytte den i vores udregninger. Dette gøres
Løsning til eksamen d.27 Maj 2010
DTU informatic 02402 Introduktion til Statistik Løsning til eksamen d.27 Maj 2010 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th edition]. Opgave I.1
Hvad skal vi lave i dag?
p. 1/2 Hvad skal vi lave i dag? Eksempler på stokastiske variable. Ventetid på krone ved møntkast. Antal plat ved n kast. Antal radioaktive henfald. Ventetiden på en flyulykke. Udtrækning af tal i et interval.
Nanostatistik: Opgaver
Nanostatistik: Opgaver Jens Ledet Jensen, 19/01/05 Opgaver 1 Opgaver fra Indblik i Statistik 5 Eksamensopgaver fra tidligere år 11 i ii NANOSTATISTIK: OPGAVER Opgaver Opgave 1 God opgaveskik: Når I regner
c) For, er, hvorefter. Forklar.
1 af 13 MATEMATIK B hhx Udskriv siden FACITLISTE TIL KAPITEL 7 ØVELSER ØVELSE 1 c) ØVELSE 2 og. Forklar. c) For, er, hvorefter. Forklar. ØVELSE 3 c) ØVELSE 4 90 % konfidensinterval: 99 % konfidensinterval:
Deskriptiv statistik. Version 2.1. Noterne er et supplement til Vejen til matematik AB1. Henrik S. Hansen, Sct. Knuds Gymnasium
Deskriptiv (beskrivende) statistik er den disciplin, der trækker de væsentligste oplysninger ud af et ofte uoverskueligt materiale. Det sker f.eks. ved at konstruere forskellige deskriptorer, d.v.s. regnestørrelser,
Dig og din puls Lærervejleding
Dig og din puls Lærervejleding Indledning I det efterfølgende materiale beskrives et forløb til matematik C, hvori eleverne skal måle hvilepuls og arbejdspuls og beskrive observationerne matematisk. Materialet
1 Hb SS Hb Sβ Hb SC = , (s = )
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.
Statistik. Deskriptiv statistik, normalfordeling og test. Karsten Juul
Statistik Deskriptiv statistik, normalfordeling og test Karsten Juul Intervalhyppigheder En elevgruppe på et gymnasium har spurgt 100 tilfældigt valgte elever på gymnasiet om hvor lang tid det tager dem
Kapitel 4 Sandsynlighed og statistiske modeller
Kapitel 4 Sandsynlighed og statistiske modeller Peter Tibert Stoltze [email protected] Elementær statistik F2011 1 / 22 Generalisering fra stikprøve til population Idé: Opstil en model for populationen
(Projektets første del er rent deskriptiv, mens anden del peger frem mod hypotesetest. Projektet kan gemmes til dette emne, eller tages op igen der)
Projekt 2.4 Menneskets proportioner (Projektets første del er rent deskriptiv, mens anden del peger frem mod hypotesetest. Projektet kan gemmes til dette emne, eller tages op igen der) I. Deskriptiv analyse
Skriftlig Eksamen ST501: Science Statistik Mandag den 11. juni 2007 kl. 15.00 18.00
Skriftlig Eksamen ST501: Science Statistik Mandag den 11. juni 2007 kl. 15.00 18.00 Forskningsenheden for Statistik IMADA Syddansk Universitet Alle skriftlige hjælpemidler samt brug af lommeregner er tilladt.
Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen
Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen Microsoft Excel har en del standard anvendelsesmuligheder i forhold til den beskrivende statistik og statistisk
