Nogle anvendelser af programmel R, bl.a. til hypotesetest
|
|
|
- Knud Lauritsen
- 10 år siden
- Visninger:
Transkript
1 Frank Bengtson 2013 ÖÒºÒØ ÓÒÑкÓÑ Nogle anvendelser af programmel R, bl.a. til hypotesetest R er specielt egnet til statistik og simulering og kan frit installeres på egen pc. R udfører en programlinje ad gangen, viser resultatet straks og er derfor let at eksperimentere med. Man kan tilpasse og indsætte egne data i R programmer, de virker så som alle andre værktøjer. R leverer betydeligt pænere grafik end mange kommercielle produkter, et plot kan gemmes i flere formater f.eks. ***.eps og ***.ps, hvorfra der kan konverteres til andre formater. Simulering giver en rimelig begrundelse for χ 2 -fordelingers optræden i χ 2 -test. R burde derfor også være egnet til ungdomsuddannelserne. Der findes mange tilgængelige vejledninger på www, f.eks. MORTEN LARSEN og PETER SESTOFT Noter om R, men det er ganske få ting der skal til. Eks. 1. Sum af to terninger simulering ÖÔØ ÚÒÙ ÑÒÑÐÙÚ ¹ ÙÑ ØÓ ØÖÒÒÖ ¹ ÑÙÐÖÒ Ü½¹ ÑÔÐºÒØ Þ½¼¼¼ ÖÔÐÌÊ͵ ÐÓÖÐÒ ÒÖ ÒØ ܽ ÙÑÑÖÝ Ü½µ ܾ¹ ÑÔÐºÒØ Þ½¼¼¼ ÖÔÐÌÊ͵ ݹܽ ܾ Ý ÙÑÑÖÝ Ýµ ØÐ ݵ ÔÐÓØ ØÐ ݵµ ÔÐÓØ ݵµ Ê ÓÒ ÓÐ ÚÒÙ table(y) ÙÑÑÖÝ Ü½µ ÅÒº ½ Ø ÉÙº ÅÒ ÅÒ Ö ÉÙº Åܺ ½º¼¼¼ ¾º¼¼¼ º¼¼¼ º º¼¼¼ º¼¼¼ y ÙÑÑÖÝ Ýµ ÅÒº ½ Ø ÉÙº ÅÒ ÅÒ Ö ÉÙº Åܺ ¾º¼¼¼ º¼¼¼ º¼¼¼ º¼¾ º¼¼¼ ½¾º¼¼¼ ØÐ ݵ Ý ¾ ½¼ ½½ ½¾ ¾ ½¾¼ ½¾ ½ ½ ½¼ ¾ Programlinjerne indskrives i et script og gemmes i en fil ***.R i en mappe f.eks. R1. Programmet fortolker en linje ad gangen. Curseren anbringes på første linje og kommandoen udføres ved at taste ctrl og R. Resultatet vises i R Console, hvilket gør det let at kontrollere om det var det ønskede. ecdf(y) Der kan eksperimenteres med f.eks. X X, X 1 X 2, X 1 X 2 X 3 X 4. Eks. 2. Sum af to terninger sandsynlighedsmodel
2 Ò ÝÒÐ ÑÓРܾ¹¾½¾ ܾ Ô¼¹½½½ Ô¼½½ ¹½ Ô¼¹Ô¼» Ô¼ ÔÐÓØ ܾ Ô¼ ÐÛ½¼ ÜÐÑÖÒ ½ ½ µ ØÝÔ ÓÐÐÙ ÑÒ ØÓÐÔ ÓÖ Ò ¼½µßÐÒ ¼º¼½µÐ ÔÐÓØ ܾ ÙÑ ÙÑ Ô¼µ ØÝÔ ÐÛ ÓÐÐÙ ÜÐÑÖÒ ½ ½ µµ ÓÖ Ò ¼½¼µßÐÒ ¼º½µÐ ÓÖ Ò ½½¾µßÐÒ ÚµÐ ÓÖ ÙÑ ØÓ ØÖÒÒÖµ stolpe for sum af to terninger p cumsum(p0) Teststørrelser og simulering Ved simulering antages hypotesen opfyldt og de indbyggede random funktioner giver passende variation i observationerne i overensstemmelse med forudsætningerne. F.eks. kan 600 terningkast simuleres med phyp = (p 1,..., p 6 ) = ( 1 6, 1 6, 1 6, 1 6, 1 6, 1 6 ) sample(6,600,replace=true,phyp) rmultinom(1,600,phyp)[1:6], rmultinom(n, size, phyp) 1 round(runif(600,0,6)0.)), ligefordeling, rykker lidt til højre, hvor obs. er normalfordelte om (1, 2, 3, 4,, 6). Med eks. nedenfor er lavet statisik på sand. for obs. 1. Ved at variere antal kast ses hvordan spredningen varierer. 1 R: A Language and Environment for Statistical Computing The rmultinom() algorithm draws binomials X j from Bin(n j ; P j ) sequentially, where n 1 = N (N := size), P 1 = π 1 (π is prob scaled to sum 1), and for j 2, recursively, n j = N ( j 1 k=1 X k and P j = π j / 1 ) j 1 k=1 π k. 2
3 ØØ Ø Ô ÙÐ Ó½¹ÖÔ ¼ ½¼¼¼µ ÔÝÔ¹ÖÔ ½» µ ÔÝÔ ÓÖ Ñ Ò ½½¼¼¼µß ܹØÐ ÑÔÐ ¼¼ ÖÔÐÌÊÍ ÔÝÔµµ Ó½Ñ ¹Ü½»¼¼Ð ÔÐÓØ Ó½µµ ÓÖ Ò ¼½¼µßÐÒ ¼º½µÐ ÓÖ Ò ½½¼µßÐÒ Ú¼º¼½ ¼º½¾µÐ ÙÑÑÖÝ Ó½µ ÚÖ Ó½µ Ó½µ ÙÑÑÖÝ Ó½µ ÅÒº ½ Ø ÉÙº ÅÒ ÅÒ Ö ÉÙº Åܺ ¼º½½¼ ¼º½¼ ¼º½ ¼º½ ¼º½ ¼º¾¾¼ ÚÖ Ó½µ ½ ¼º¼¼¼¾ ½¾½ Ó½µ ½ ¼º¼½¾¼ ecdf(o1) Ved simulationen bør middelværdien for p 1 være 1/6 og eks. giver mean=0.1663, og ved n = 600 er den forventede varians på hypotesens p 1 p 1 (1 p 1 )/n = 6 1(1 6 1 )/600 = /36/600 = og spredningen σ = = svarer til observeret sd(o1) = χ 2 - teststørrelsen eller Pearsonteststørrelsen beregnes som K() = (obs. antal forv. antal) 2 forv. antal og testsandsynligheden = ( 1 np 1 ) 2 np 1 ( m np m ) 2 np m, ǫ() 1 F χ 2 df (K()). Små værdier af K() svarer til nær den forventede. Simulationen giver indtryk af tæthed og fordeling af K() under hypotesen. Eks. 3. En terning, tæthed og fordeling af K() Kastes 60 gange med en alm. terning er forventet np = (,,,,, ). Ved 60 kast observeres f.eks. = ( 1,..., 6 ) = (16, 12, 9, 9, 7, 7). I eks. her er K() = (16 )2 (12 )2 (9 )2 (9 )2 (7 )2 (7 )2 De grønne/kraftige grafer er tæthed fra histogram og ecdf (empirisk cumuleret tæthed) fra observationerne og de blå/tynde er tæthed og fordeling for χ 2 -fordelingen med frihedsgrader. Af nederste fig. aflæses, at de % der ligger længst fra den forventede har K() større end 11, og de 2.% der ligger længst fra har K() større end 13. som i eks. her er - kan aflæses af nederste graf ǫ((16, 12, 9, 9, 7, 7)) 1 F χ 2 (K((16, 12, 9, 9, 7, 7))) = 1 F χ 2 (6) = 0.31, Med = (6, 16, 7, 16, 6, 9) er ǫ() = ǫ((6, 16, 7, 16, 6, 9)) 1 F χ 2 (K((6, 16, 7, 16, 6, 9))) = 1 F χ 2 (11.4) = = 6. 3
4 Man kan lave vilkårlige sandsynlighedsvektorer, f.eks. p = (1, 1, 1, 1, 1, 2) efterfulgt af normering p = (1, 1, 1, 1, 1, 2)/sum(p) og en mere skæv med p<-rep(1:6), p = (1, 2, 3, 4,, 6) efterfulgt af p<-p/sum(p). Det observeres at tæthed og fordeling for K() ikke ændres. Histogram of obsk ÔÝÔ¹ÖÔ ½» µ ÔÝÔ ÒØÐ Ø¹¼ ÓÖÚ¹ÒØÐ Ø ÔÝÔ ÓÖÚ ÙÑ ÓÖÚµ ùÙÒØÓÒ Üµß ÙÑ Ü¹ÓÖÚµ¾»ÓÖÚµÐ Ô ¹ÙÒØÓÒ Üµß½¹Ô Õ Ã Üµ µð ܽ ¹½Ü¾ ¹½¾Ü ¹Ü ¹Ü ¹Ü ¹ ܹØÐ ÑÔÐ ÒØÐ Ø ÖÔÐÌÊÍ ÔÝÔµµ ÚÖ ÝÔÔ ÓÖ ÐÐ ÓÖ Ñ Ò ½¾¼µß ܹØÐ ÑÔÐ ÒØÐ Ø ÖÔÐÌÊÍ ÔÝÔµµ ÝÔÔ Ü¹ÖÙÒ ÒØÐ Øµ ܹÖÓÙÒ ÒØÐ Ø Ü» ÙÑ Üµµ ܹØÐ ÖÓÙÒ ÖÙÒ ÒØÐ Ø ¼ µ ¼ºµµµ ܹÖÑÙÐØÒÓÑ ½ ÒØÐ Ø Ô½µ½ ÔÖÒØ ܵ ÔÖÒØ ÙÑ Üµµ ÔÖÒØ à ܵµÐ ÒØÐ ¹¼¼ Ó Ã¹ÖÔ ¼ ÒØÐ µ ÓÖ Ñ Ò ½ÒØÐ µ ß Ü¹ØÐ ÑÔÐ ÒØÐ Ø ÖÔÐÌÊÍ ÔÝÔµµ½ ܹÖÙÒ ÒØÐ Øµ ܹØÐ ÖÓÙÒ ÖÙÒ ÒØÐ Ø ¼ µ ¼ºµµ Ó ÃÑ ¹Ã ܵ Ð ÙÑÑÖÝ Ó Ãµ Ó Ã Ø Ó Ã ÖÕÄË Ö ¾¼ ÓÐÔÒµ ÐÒ Ò ØÝ Ó Ãµ ÐÛ ÓÐÖÒµ ܽ¹ Õ ¼ ¼ ݺ½µ ݽ¹ Õ Ü½ µ ØØ ÐÒ Ü½ ݽ ÐÛ ÓÐÐÙµ ÔÐÓØ Ó Ãµ ÓÐÖÒ ÐÛ½¼µ ÓÖ Ò ¼¾µßÐÒ ÚµÐ ÓÖ Ò ¼µßÐÒ Ú ÐÛ¾µÐ ÓÖ Ò ¼½¼µßÐÒ ¼º½µÐ ݽ¹Ô Õ Ü½ µ ÓÖÐÒ Ý½ ÐÒ Ü½ ݽ ÐÛ ÓÐÐÙµ ÐÒ ¼º ÓÐÖÓÛÒ ÐÛ¾µ ÐÒ ¼º ÓÐÖÓÛÒ ÐÛ¾µ ÐÒ Ú ÓÐÖÓÛÒ ÐÛ¾µ Density obsk ecdf(obsk) Eks. 4. Antalstabel Et kendt eks. på en 22 tabel. Er der uafhængighed mellem tøjkøb pr. md. og køn? Hvis det antages, at forbruget er uafhængigt af køn, må sandsynligheden for søjlerne være p = (p 1, p 2 ) = ( , ) = (0.44, 0.6), og de forventede antal kan beregnes og sammenlignes med de observerede antal. Indtastning af data og beregning af teststørrelse med de øverste fem linjer i R prog. nedenfor. Også her stemmer simulationer pænt med χ 2 -fordelingen med 1 frihedsgrad. De grønne/kraftige grafer er tæthed fra histogram og ecdf fra observationerne og de blå/tynde er tæthed og fordeling for χ 2 -fordelingen med 1 frihedsgrad. De % obs. med største K() værdier er større end 4. De opfylder også hypotesen, men anses for at være for ekstreme. Her beregnes K værdien med den mere overskuelige K1(data.table,forv.table) 4
5 observerede forventede tøjkøb kr. pr. md. mindre end 100 mere end 100 kvinder mænd kvinder = = mænd = = def. nedenfor. K kan beregnes som K(data.table) som det gøres i næste eks. Histogram of ok1 ecdf(ok1) Density ok1 0 1 [ ] 98 2 = data.table = 60 0 ([ ]) 98 2 K() = K 60 0 F χ 2 1 (4.8) kan aflæses af blå/tynde graf. = K1(data.table, forv.table) ([ ] [ ]) = K1, = 4.8, ([ ]) 98 2 ǫ() = ǫ 1 F 60 0 χ 2(4.8) = [ ] = data.table = ([ ]) K() = K = 3.4, ([ ]) ǫ() = ǫ 1 F χ 2(3.4) =
6 ecdf(ok) Man kan undersøge svar der er næsten vilkårlige, her vælges kun obs. større end seks. I fig. er den grønne graf K() og den røde kvotientteststørrelse 2 log(q()). K() værdierne er ret store, men ca. 18% af de næsten tilfældige svar har K()< R Script ÖÓÛ½¹ÖÔ ¼ ¾µ ÖÓÛ½¹ ½¼¾µ½¾ ÔÐÖ Ø ÚÖ ÚÖ ÖÖÓÖ Ô ÒÓÐ Ô ÖÓÛ¾¹ÖÔ ¼ ¾µ ÖÓÛ½½ ¹ ÖÓÛ½¾ ¹½¼¾ ÖÓÛ½ Ú Ö Ø Ö ÖÓÛ¾½ ¹¼ ÖÓÛ¾¾ ¹½¼¼ ÖÓÛ¾ Ú ÒÒ Ö ÖÒ ÖÓÛ½ ÖÓÛ¾µ¹ØºØÐ ØÐ Ñ ÐÐÖ ÑØÖÜ ØºØÐ Ú Ø ÒØ Ø ÑÓÐ Ñ Ò ØÒ ØÐÐ ÚÖ ÕºØ Ø ØºØÐµ ¹¹ÒÒ Ø Ø ØÖÖº ÖÓÛ½ ÑÒ Ø ÙÑ ¾¼¼ ÖÓÛ½½ ¹ ÑÔÐ ½ ½µ ÚÒØ ÓÖÐØ ÒÒ ÐÐÐ ÔÖÓÖÑ ØÙÑÔ ÐÚÖÖ Ö ÙÐØØØ ÑÒ Ø Ú Ö Ñ ÖÐ ÑØ Ò ÖÒÒ ÕºØ Ø Ñ ÓÖÚÒØØ ÖÓÛ½¾ ¹¾¼¼¹ÖÓÛ½½ ÓÊ½Ñ ¹ÖÓÛ½½ ØÐ ØØ ÓÊ¾Ñ ¹ÖÓÛ½¾ ØÐ ØØ Ô¹ ÖÓÛ½ ÖÓÛ¾µ» ÙÑ ØºØÐµ ÙÒÖ ÝÔÓØ ÖÓÛ¾ ÑÒ Ø ÙÑ ½¼ Ô ÖÓÛ¾½ ¹ ÑÔÐ ½ ½µ ÓÖÚ½¹ ÖÓÛ½ ÖÓÛ¾µ ÙÑ ÖÓÛ½µ» ÙÑ ØºØÐµ ÓÖÚÒØ ÖÓÛ¾¾ ¹½¼¹ÖÓÛ¾½ ÓÖÚ¾¹ ÖÓÛ½ ÖÓÛ¾µ ÙÑ ÖÓÛ¾µ» ÙÑ ØºØÐµ ÖÒ ÓÖÚ½ ÓÖÚ¾µ ¹ ÓÖÚºØÐ ÖÒ ÖÓÛ½ ÖÓÛ¾µ¹ØºØÐ ÓÖÚºØÐ ÒÓРغØÐµ ý¹ÙÒØÓÒ ØºØÐ ÓÖÚºØÐµß ÙÑ ØºØÐ¹ÓÖÚºØÐµ¾»ÓÖÚºØÐµÐ ý¹ÙÒØÓÒ Ü µß ÙÑ Ü¹µ¾»µÐ Ô ½¹ÙÒØÓÒ Üµß½¹Ô Õ Ü ½µÐ ý غØÐ ÓÖÚºØÐµ Ô ½ ý غØÐ ÓÖÚºØÐµµ ÑÙÐÖÒ ÙÒÖ ÝÔÓØ Ò Ô ÒØÐ½¼¼¼¼ Óý¹ÖÔ ¼ ÒØÐµ ÓÖ Ñ Ò ½ÒØÐµ ß ÖÓÛ½¹ÖÑÙÐØÒÓÑ ½ ¾¼¼ ÔÖÓÔµ½¾ ÖÓÛ¾¹ÖÑÙÐØÒÓÑ ½ ½¼ ÔÖÓÔµ½¾ ÖÒ ÖÓÛ½ ÖÓÛ¾µ ¹ غØÐ ÓÖÚ½¹ ÖÓÛ½ ÖÓÛ¾µ ÙÑ ÖÓÛ½µ» ÙÑ ØºØÐµ ÓÖÚ¾¹ ÖÓÛ½ ÖÓÛ¾µ ÙÑ ÖÓÛ¾µ» ÙÑ ØºØÐµ ÖÒ ÓÖÚ½ ÓÖÚ¾µ ¹ ÓÖÚºØÐ ÓÃ½Ñ ¹Ã½ غØÐ ÓÖÚºØÐµÐ Óý Ø Óý ÖÕÄË Ö ¾¼ ÓÐÔÒµ ÐÒ Ò ØÝ Óýµ ÐÛ¾ ÓÐÖÒµ ܽ¹ Õ ¼ ½¼ ݺ½µ ݽ¹ Õ Ü½ ½µ ØØ ÐÒ Ü½ ݽ ÐÛ¾ ÓÐÐÙµ ÔÐÓØ Óýµ ÓÐÖÒ ÐÛ½¼µ ݽ¹Ô Õ Ü½ ½µ ÓÖÐÒ ÐÒ Ü½ ݽ ÐÛ ÓÐÐÙµ ÓÖ Ò ¼½¼µßÐÒ ¼º½µÐ ÓÖ Ò ¼ ¼µßÐÒ ÚµÐ ÐÒ ¼º ÓÐÖÓÛÒ ÐÛ µ ÓÖÚÒØ ÒÖÓÛ ØºØÐµ ÖÒÒ Ã ØºØÐµ ùÙÒØÓÒ ØºØÐµß ÓÖÚºØÐ¹ØºØÐ ÔÝÔ¹ÓÐËÙÑ ØºØÐµ» ÙÑ ØºØÐµ ÓÖ Ñ Ò ½ÒÖÓÛ ØºØÐµµß ÓÖÚºØÐÑ ¹ÖÓÛËÙÑ ØºØÐµÑ ÔÝÔРù ÙÑ ØºØÐ¹ÓÖÚºØÐµ¾»ÓÖÚºØÐµ ÖØÙÖÒ ÃµÐ ÓÖÚÒØ ÖÓÛ Ã ØºØÐµ ÑÒ ÓÖÚºØÐµ ÑÒ Ø ÚÖ ÓÖÚÒØ Ð ÚÖ ØÖÖ Ò ÚÓØÒØØ Ø ØÖÖРɹÙÒØÓÒ ØºØÐµß ɹ½ ÓÖ Ñ Ò ½ÒÖÓÛ ØºØÐµµ ÖÖ ßÓÖ Ò Ò ½ÒÓРغØÐµµ ÐÖ ßÉ¹É ÖÓÛËÙÑ ØºØÐµÑ ÓÐËÙÑ ØºØÐµÒ» ÙÑ ØºØÐµ غØÐÑ Ò µµ غØÐÑ Ò µðð ÖØÙÖÒ ÉµÐ 6
ÁÒØÖÓ Ù Ø ÓÒØ Ð Ö Ó Ø Ò ÐÐÙ ØÖ Ø ÓÒ ÖÑ Å Ø ÈÓ Ø ÓÖ Ö Ã¹ÌÍ ÅÓÖØ ÒÀ Ö ½¾º ÔÖ Ð¾¼¼¼ ½ ÀÚ ÖÅ Ø ÈÓ Ø Å Ø ÈÓ Ø Ö ØÔÖÓ Ö ÑÑ Ö Ò ÔÖÓ ¹ Ö ØÔÅ Ø ÓÒØº ØÅ Ø ÈÓ Ø¹ÔÖÓ Ö Ñ Ö ÒÓÔ Ö ØØ Ð Ø Ò Ö Ö Ò ÐÐ Ö Ö ÙÖ Öº Å Ø ÈÓ
ÁÒ ØÖÙØ ÓÒ Ë Ø Ö Ø ØÙÖ ÁÒØÖÓ ÙØ ÓÒ ÁÒ ØÖÙØ ÓÒ Ë Ø ÁÒØ Ö ØÛ Ò Ó ØÛ Ö Ò Ö Û Ö Ú Ð ØÓ ÔÖÓ Ö ÑÑ Ö ËØ Ô ØÓ Ò ÁÒ ØÖÙØ ÓÒ Ë Ø ÓÖ Ú Ò Óѹ ÔÙØ Ö Û Ø Ø Ú Ð Ð ÐØ
ÁÒ ØÖÙØ ÓÒ Ë Ø Ö Ø ØÙÖ ÁÒØÖÓ ÙØ ÓÒ ÁÒ ØÖÙØ ÓÒ Ë Ø ÁÒØ Ö ØÛ Ò Ó ØÛ Ö Ò Ö Û Ö Ú Ð ØÓ ÔÖÓ Ö ÑÑ Ö ËØ Ô ØÓ Ò ÁÒ ØÖÙØ ÓÒ Ë Ø ÓÖ Ú Ò Óѹ ÔÙØ Ö Û Ø Ø Ú Ð Ð ÐØ ÖÒ Ø Ú Ò ØÓ ÐØ ÖÒ Ø Ú Ò ÕÙ ÒØ Ø Ú Ñ Ø Ó ÓÛ Ó Ø ÓÑÔ
deta = A = deta = a 11 deta 11 a 12 det A 12 + a 13 deta 13 deta = deta = 1(0 2) 5(0 0) + 0( 4 0) = 2 deta = a i,j deta i,j
Ä Ò Ò ØÖ Ø ÓÖ Ñ Ò ÓÔ Ú Ö Ä Ú Ø ÓÖÑ Ð Ø Ö Ó Ì ÓÑ Â Ò Ò ÓÒØ ÒØ ½ Ø ÖÑ Ò ÒØ Ö ½º½ Í Ú Ð Ò º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º ½º½º½ ÑÔ Ð Í Ú Ð Ò Ø ÓÖ
ÓÖÓÖ ØØ ÔÖÓ Ø Ö Ö ÙÐØ Ø Ø Ø Ñ Ö Ñ ÈÓ Ø ÒÑ Ö ÓÑ Ø ÐÓ ¹ Ð Ö Ò ÔÖÓ Ð Ñ ÓÖ Ô ÒØÖ ÆÓÖ ÐÐ Ò º Î Ð Ø Ø Ù Ö ÚÓÖ Ñ Ò ÔÖÓ Ø Ñ Ö Ñ Ò Ú Ö ÓÑ Ö ÓÖ ÚÓÖ Ú ÓÑÑ Ò ÚÖ Ø
ÅÙÐØ Ñ ØÓ ÓÐÓ Ø ÐÓ Ð Ö Ò ÔÖÓ Ð Ñ ¹ ØÖÙ ØÙÖ Ö Ò Ó ÓÔØ Ñ Ö Ò À ÒÒ Ä Ñ ÒÒ È Ø Ö Ò ½¼¾½ Ë Ö Ö Ã Ñ Ë ÙÐ Ð ½¼ Ä Æ ÂÍÆÁ ¾¼¼ ÃË Å ÆËÈÊÇ ÃÌ ÆÊº IMM ÓÖÓÖ ØØ ÔÖÓ Ø Ö Ö ÙÐØ Ø Ø Ø Ñ Ö Ñ ÈÓ Ø ÒÑ Ö ÓÑ Ø ÐÓ ¹ Ð Ö Ò ÔÖÓ
Susanne Ditlevsen Institut for Matematiske Fag susanne
Statistik og Sandsynlighedsregning 1 Repetition MS kapitel 1 3 Susanne Ditlevsen Institut for Matematiske Fag Email: [email protected] http://math.ku.dk/ susanne Hvad er sandsynlighed? - beskriver systemer
ÓÖÑ Ð Ô Ø ÓÒ Ò ÔÖÓÓ ÓÖ Ø ØÓÔÓÐÓ Ý Ò Ð Ø ÓÒ Ó ÓÑ Ò ØÓÖ Ð ÙÖ Ö ØÓÔ Ð Ò Ö Ò Â Ò¹ Ö ÒÓ Ù ÓÙÖ Ä ÓÖ ØÓ Ö Á Í ÍÒ Ú Ö Ø ËØÖ ÓÙÖ ÆÊË ÈÐ ³ÁÒÒÓÚ Ø ÓÒ Ì ÒÓÐÓ ÕÙ Ó
ÓÖÑ Ð Ô Ø ÓÒ Ò ÔÖÓÓ ÓÖ Ø ØÓÔÓÐÓ Ý Ò Ð Ø ÓÒ Ó ÓÑ Ò ØÓÖ Ð ÙÖ Ö ØÓÔ Ð Ò Ö Ò Â Ò¹ Ö ÒÓ Ù ÓÙÖ Ä ÓÖ ØÓ Ö Á Í ÍÒ Ú Ö Ø ËØÖ ÓÙÖ ÆÊË ÈÐ ³ÁÒÒÓÚ Ø ÓÒ Ì ÒÓÐÓ ÕÙ ÓÙÐ Ú Ö Ëº Ö ÒØ Ƚ¼ ½ ¼¼ ÁÐÐ Ö Ö Ò Ñ Ð ÙÒ ØÖ º Ö Ö ØÓÔ
H Å N D B O G M A T E M A T I K 2. U D G A V E
H Å N D B O G M A T E M A T I K C 2. U D G A V E ÁÒ ÓÐ Indhold 1 1 Procentregning 3 1.1 Delingsprocent.............................. 3 1.2 Vækstprocent.............................. 4 1.3 Renteformlen..............................
Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo
Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte
Note om Monte Carlo metoden
Note om Monte Carlo metoden Kasper K. Berthelsen Version 1.2 25. marts 2014 1 Introduktion Betegnelsen Monte Carlo dækker over en lang række metoder. Fælles for disse metoder er, at de anvendes til at
Produkt og marked - matematiske og statistiske metoder
Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 19, 2016 1/26 Kursusindhold: Sandsynlighedsregning og lagerstyring
(b) [x, [y, z]] + [y, [z, x]] + [z, [x, y]] = 0 ÓÖ ÐÐ x, y, z L
Ð ÓÖ ØÙ Ö Å Ø Ñ Ø ¹ ÓÒÓÑ Ó ËØ Ø Ø ½ º Ö Ò ÒÖº ÙÒ ¾¼¼ 2 4¹Ð Ó¹ ÐÓ Ò º ½ º À Ö Ò Ò Ö Ø ÚÖ Ø Ð Ø Ð Ñ Ò Ö Ø Ú Ø Ø Ó Ñ Ø Ò Ó Ú Ø ÒÐ Ò Ò Ø Ð Ñ Ø Ñ Ø Ô ÙÐ Ø ÓÒ Öº Ò Ð ÐÐ ÖÙÔÔ Ñ Ø Ñ Ø Ö Ö À Ö Ò Ø Ö ÓÖ Ø Ø Ö Ö
2 -test. Fordelingen er særdeles kompleks at beskrive med matematiske formler. 2 -test blev opfundet af Pearson omkring år 1900.
2 -fordeling og 2 -test Generelt om 2 -fordelingen 2 -fordelingen er en kontinuert fordeling, modsat binomialfordelingen som er en diskret fordeling. Fordelingen er særdeles kompleks at beskrive med matematiske
Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.
Tema Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. (Fx. x. µ) Hypotese og test. Teststørrelse. (Fx. H 0 : µ = µ 0 ) konfidensintervaller
χ 2 -test i GeoGebra Jens Sveistrup, Gammel Hellerup Gymnasium
χ 2 -test i GeoGebra Jens Sveistrup, Gammel Hellerup Gymnasium Man kan nemt lave χ 2 -test i GeoGebra både goodness-of-fit-test og uafhængighedstest. Den følgende vejledning bygger på GeoGebra version
Matematiklærerdag 2008
Matematiklærerdag 2008 Klaus Thomsen Institut for Matematiske Fag Det Naturvidenskabelige Fakultet Aarhus Universitet March 27, 2008 Matematik og kemi. Matematik og kemi. Intelligente tællemetoder - frit
Værktøjshjælp for TI-Nspire CAS Struktur for appendiks:
Værktøjshjælp for TI-Nspire CAS Struktur for appendiks: Til hvert af de gennemgåede værktøjer findes der 5 afsnit. De enkelte afsnit kan læses uafhængigt af hinanden. Der forudsættes et elementært kendskab
Løsning til eksamen d.27 Maj 2010
DTU informatic 02402 Introduktion til Statistik Løsning til eksamen d.27 Maj 2010 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th edition]. Opgave I.1
Løsning eksamen d. 15. december 2008
Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th
Statistik Lektion 2. Betinget sandsynlighed Bayes regel Diskrete stokastiske variable Middelværdi og varians for diskret SV Binomialfordelingen
Statistik Lektion etinget sandsynlighed ayes regel Diskrete stokastiske variable Middelværdi og varians for diskret SV inomialfordelingen Repetition Udfaldsrum S Hændelse S Simpel hændelse O i 1, 3 4,
Institut for Matematiske Fag Sandsynlighedsregning og Statistik 2. R opgaver
Institut for Matematiske Fag Sandsynlighedsregning og Statistik 2 Københavns Universitet Susanne Ditlevsen og Helle Sørensen R opgaver Det er en god ide at vænne sig til at skrive kommandoerne i en editor
MATEMATIK A-NIVEAU. Anders Jørgensen & Mark Kddafi. Vejledende eksempler på eksamensopgaver og eksamensopgaver i matematik, 2012
MATEMATIK A-NIVEAU Vejledende eksempler på eksamensopgaver og eksamensopgaver i matematik, 2012 Kapitel 4 Statistik & sandsynlighedsregning 2016 MATEMATIK A-NIVEAU Vejledende eksempler på eksamensopgaver
Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/
Program: 1. Repetition af vigtige sandsynlighedsfordelinger: binomial, (Poisson,) normal (og χ 2 ). 2. Populationer og stikprøver 3. Opsummering af data vha. deskriptive størrelser og grafer. 1/29 Binomial
Analyse af en lineær regression med lav R 2 -værdi
Analyse af en lineær regression med lav R 2 -værdi Denne gennemgang omhandler figur 13 i Regn med biologi. Man kan sagtens lave beregninger på egne data. Forsøgsmæssigt kræver det bare en tommestok tapet
Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18
Program 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18 Fordeling af X Stikprøve X 1,X 2,...,X n stokastisk X stokastisk. Ex (normalfordelt stikprøve)
3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve
Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader
Stikprøver og stikprøve fordelinger Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader Statistik Statistisk Inferens: Prediktere og forekaste værdier af
Tema. Dagens tema: Indfør centrale statistiske begreber.
Tema Dagens tema: Indfør centrale statistiske begreber. Model og modelkontrol Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. konfidensintervaller Vi tager udgangspunkt i Ex. 3.1 i
Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19
Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 For test med signifikansniveau α: p < α forkast H 0 2/19 p-værdi Betragt tilfældet med test for H 0 : µ = µ 0 (σ kendt). Idé: jo større
Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele
Anvendt Statistik Lektion 5 Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Motiverende eksempel Antal minutter brugt på rengøring/madlavning: Rengøring/Madlavning
Statistik II 1. Lektion. Sandsynlighedsregning Analyse af kontingenstabeller
Statistik II 1. Lektion Sandsynlighedsregning Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller
Uge 10 Teoretisk Statistik 1. marts 2004
1 Uge 10 Teoretisk Statistik 1. marts 004 1. u-fordelingen. Normalfordelingen 3. Middelværdi og varians 4. Mere normalfordelingsteori 5. Grafisk kontrol af normalfordelingsantagelse 6. Eksempler 7. Oversigt
Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]
Anvendt Statistik Lektion 6 Kontingenstabeller χ 2- test [ki-i-anden-test] Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination af
Indhold Grupperede observationer... 1 Ugrupperede observationer... 3 Analyse af normalfordelt observationssæt... 4
BH Test for normalfordeling i WordMat Indhold Grupperede observationer... 1 Ugrupperede observationer... 3 Analyse af normalfordelt observationssæt... 4 Grupperede observationer Vi tager udgangspunkt i
Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese
Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik Bygning 305/324 Danmarks Tekniske Universitet
Matematik A. Studentereksamen. Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet
Matematik A Studentereksamen Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet stx11-matn/a-080501 Tirsdag den 8. maj 01 Forberedelsesmateriale til stx A Net MATEMATIK Der
Kvantitative Metoder 1 - Forår 2007
Dagens program Kapitel 8.7, 8.8 og 8.10 Momenter af gennemsnit og andele kap. 8.7 Eksempel med simulationer Den centrale grænseværdisætning (Central Limit Theorem) kap. 8.8 Simulationer Normalfordelte
Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele
Anvendt Statistik Lektion 5 Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Motiverende eksempel Antal minutter brugt på rengøring/madlavning: Rengøring/Madlavning
Preben Blæsild og Jens Ledet Jensen
χ 2 Test Preben Blæsild og Jens Ledet Jensen Institut for Matematisk Fag Aarhus Universitet Egå Gymnasium, December 2010 Program 8.15-10.00 Forelæsning 10.15-12.00 Statlab: I arbejder, vi cirkler rundt
