Schweynoch, Se eventuelt

Størrelse: px
Starte visningen fra side:

Download "Schweynoch, 2003. Se eventuelt http://www.mathematik.uni-kassel.de/~fathom/projekt.htm."

Transkript

1 Projekt 8.5 Hypotesetest med anvendelse af t-test (Dette materiale har været anvendt som forberedelsesmateriale til den skriftlige prøve 01 for netforsøget) Indhold Indledning... 1 χ -test... Numeriske data og hypotesetest... Middelværdi, varians og spredning... 3 Stokastiske variable og empiriske størrelser... 4 Normalfordelte observationer... 5 Hypotesetest med et datasæt (en variabel)... 7 Anvendelse af t-test for et datasæt (en variabel) i Muffins... 9 Fordeling af t-teststørrelsen...10 Hypotesetest med to datasæt (to variable)...1 Anvendelse af t-test for to datasæt (to variable) i Muffins...14 Kilder...16 Indledning I statistik opstilles hypoteser for variable i en stikprøve. Dette forberedelsesmateriale omhandler to tests, som kan bruges, når du skal vurdere om en hypotese skal forkastes eller accepteres. Det ene test er c - testet, som du allerede kender, og det andet test er t -testet. Materialet indeholder to dele. I første del genopfrisker vi centrale dele ved c -testet, mens vi i anden del introducerer t -testet og anvender dette til at besvare spørgsmål, som kan være interessante at stille, når vi betragter et datamateriale. Datamaterialet som bruges i denne sammenhæng kaldes Muffins 1. Det indeholder en stor mængde rådata, som stammer fra en spørgeskemaundersøgelse blandt 539 unge tyskere. Vi anvender et større udklip herfra, som findes i den vedlagte fil: MuffinsUdklip.xls. Når man skal håndtere store datasæt, er det vigtigt at kunne sortere datamaterialet, således at de sammenhænge, man ønsker at undersøge, træder tydeligt frem, og data bliver tilgængeligt i den rigtige form. Fx kunne det i nogle tilfælde være interessant at sortere datamaterialet efter køn, således at pigernes svar er adskilt fra drengenes svar. En sådan sortering vil være aktuel, når man skal undersøge sammenhængen mellem køn og en anden kategorisk variabel. Man optæller så blot pigernes og drengenes svar i relation til den anden kategoriske variabel. Denne optælling kan foretages automatisk i et værktøjsprogram. Tilsvarende vil det være hensigtsmæssigt i behandling af datamaterialet at kunne opstille en krydstabel automatisk i et værktøjsprogram. Datamaterialet samt din bearbejdning af dette skal medbringes til eksamen. Du skal under prøven kunne importere data fra et regneark af samme slags som MuffinsUdklip.xls og bearbejde disse i dit værktøjsprogram. Opgaver indenfor c -test hører under kernestoffet og er derfor en naturlig del af den skriftlige prøves. delprøve. Derudover vil den skriftlige prøves. delprøve indeholder opgaver, der handler om anvendelse af t-test. 1 Medien- und Freizeitgestaltung für interessanten Stochastikunterricht af Rolf Biehler, Klaus Kombrink, Stefan Schweynoch, 003. Se eventuelt 1

2 χ -test I forbindelse med χ -test har du arbejdet med datasæt og krydstabeller fx fra en spørgeskemaundersøgelse med to eller flere kategoriske variable. Vi genopfrisker i følgende eksempel sammensat af en række øvelser anvendelsen af χ -uafhængighedstestet, hvor vi samtidigt får et indblik i data fra Muffins. Åben MuffinsUdklip.xls, og åben fanebladet Udklip1 heri. I Udklip1 er der to kategoriske variable: Køn og Hvor ofte man går i kirke. Øvelse 1: Sortering Hvor mange piger og drenge er der i udklippet? Sorter data efter køn og tæl op automatisk i dit værktøjsprogram. Øvelse : Krydstabel Nedenfor ses en krydstabel for de to nævnte variable fra Øvelse 1 (her vist i Excel): Opstil nu selv med udgangspunkt i Udklip1 krydstabellen ovenfor vha. dit værktøjsprogram. Øvelse 3: Stikprøve & population Gør rede for, hvilken af betegnelserne stikprøve og population der kan anvendes om datasættet i Udklip1. Øvelse 4: Nulhypotese Vi ønsker at undersøge, om der er sammenhæng mellem køn og hvor ofte man går i kirke (kaldes for overskuelighedens skyld nu kirkegang). Opstil en nulhypotese, som kan anvendes til at undersøge, om der er sammenhæng mellem køn og kirkegang. Øvelse 5: Forventede værdier Bestem vha. dit værktøjsprogram de forventede værdier under forudsætning af at din nulhypotese er sand, og opstil dem i en krydstabel svarende til krydstabellen for de observerede værdier. Øvelse 6: Kritisk værdi og p-værdi i χ -testet Beregn χ -teststørrelsen, og benyt dit værktøjsprogram til at bestemme den kritiske værdi svarende til et 5% signifikansniveau. Gør rede for, om nulhypotesen skal forkastes eller accepteres på baggrund af χ -teststørrelsen og den kritiske værdi. Gør rede for, at p-værdien sammenlignet med signifikansniveauet giver samme resultat. Bemærk: Nogle værktøjsprogrammer kan udføre dette χ -test automatisk ud fra de observerede værdier i krydstabellen. Numeriske data og hypotesetest Et datasæt kan også indeholde numeriske data, og disse skal behandles på en anden måde end de kategoriske. Hver søjle i et numerisk datasæt (tabellen med alle observationer) repræsenterer i den sammenhæng målinger af en variabel og i datasættet Muffins kan dette for eksempel være respondenternes højde. Kategoriske og numeriske variable Når vi analyserer et datasæt bestående af kategoriske data, sammenligner vi antallet af observationer i hver kategori på tværs af de variable. Når vi analyserer et datasæt bestående af numeriske data, tager vi udgangspunkt i de

3 såkaldte empiriske størrelser: middelværdi og varians, og sammenligner hver af disse på tværs af de variable. For at illustrere forskellene på numeriske og kategoriske data betragter vi to forskellige datasæt. I afsnittet ovenfor om χ -testet, så vi på kategoriske data, hvor vi optalte antal piger og drenge efter hvor ofte de går i kirke. I Tabel 1 nedenfor har vi målt højden af en række piger og drenge og altså ikke optalt, antallet af drenge og piger med en bestemt højde. Tabel 1: Køn og Højde fra Udklip, som består af datasættene for de to variable fra Udklip1. I både afsnittet ovenfor og i Tabel 1 er der imidlertid tale om stikprøver. Vi har udtaget et forhåbentligt repræsentativt udsnit af den population, som vi ønsker at vide noget om, og ud fra behandling af disse udtaler vi os om bestemte egenskaber ved hele populationen. Øvelse 7: Diagrammer skaber overblik Konstruer relevante diagrammer for data fra både eksemplet med kategoriske data og fra Tabel 1 med numeriske data, og diskuter, hvad diagrammerne viser om de variable, der indgår. Data svarende til Tabel 1 finder du i MuffinsUdklip.xls under fanebladet Udklip. Du kan vælge boksplot, søjlediagrammer, prikplot, histogrammer eller andre relevante figurer evt. opdelt efter køn. Middelværdi, varians og spredning I Tabel 1 kan vi ikke sammenligne kønnene med de redskaber, vi har fra χ -testet, da søjlerne indeholder numeriske data. Vi får brug for en anden metode, og her anvender vi som nævnt størrelserne middelværdi og varians. Eller rettere sagt: De bedste bud vi ud fra Tabel 1 kan give på middelværdi og varians for højdemålingerne i stikprøven. Disse bedste bud kaldes de empiriske størrelser for middelværdi og varians, og de betegnes med de to matematiske symboler: x (empirisk middelværdi) og s (empirisk varians). Empirisk middelværdi, varians og spredning De empiriske størrelser x og s kan beregnes med formlerne: 1 x1+ x + x3+ x xn x = åxi = n i n og 1 s = å ( xi -x), n-1 i 3

4 hvor x1, x, x3, x4,..., x n betegner observationerne, dvs. de værdier som variablen antager. Ud fra variansen kan vi også bestemme spredningen, som er kvadratroden af variansen: s = s. Vi har indført sumtegnet å her for at forenkle opskrivningen, men de fleste værktøjsprogrammer kan bestemme de empiriske størrelser direkte ud fra observationerne. I Tabel 1 svarer x1, x, x3, x4,..., x n til de observerede højdemålinger, hvor indiceringen angiver målingens nummer i datasættet. n angiver det samlede antal målinger, som er henholdsvis 13 for drengene, og 49 for pigerne. Øvelse 8: Middelværdi, varians og spredning Benyt dit værktøjsprogram til at bestemme de empiriske størrelser for hhv. drengenes og pigernes højde i Tabel 1. Data finder du som tidligere nævnt i Udklip. Stokastiske variable og empiriske størrelser Forskellen på den empirisk middelværdi og den værdi, som vi i det følgende vil kalde den sande middelværdi, kan illustreres ved at betragte datasættet i Tabel nedenfor, som viser højdemålingerne for 5 drenge fra Udklip. Tabel : Uddrag af højdemålinger for 5 drenge i Muffins. Betragter vi for eksempel højdemålingen 1,9 meter, kan man gøre sig følgende overvejelse: Hvor præcist blev denne højde målt? Forestiller vi os, at fem personer en af gangen måler denne drengs højde, vil de fem personers målinger efter al sandsynlighed variere en smule. En vil måske måle højden til 1,895 m, en anden 1,900 m osv. Pointen her er, at denne variation ikke giver os mulighed for at udtale os om, hvad drengens sande højde er. Vi accepterer dog, at vi har et rimeligt godt bud på den sande højde. Når vi beregner middelværdi og spredning som ovenfor, så giver vi et empirisk bud på middelværdien for højden af henholdsvis piger og drenge i Udklip som jo ikke nødvendigvis er fuldstændigt entydigt korrekt. Derfor skelner vi mellem begreberne empiriske og sande størrelser, hvor de empiriske er knyttet til de faktiske observationer, mens de sande er teoretiske værdier. Stokastisk variabel I statistikkens verden kaldes de empiriske størrelser repræsentationer for de enkelte højdemålinger. Man indfører begrebet stokastisk variabel, som repræsentant for observationerne. Den stokastiske variabel betegnes X. I relation til Tabel 1 og taler man om den stokastiske variabel X i som repræsentant for højdemålingen x i. Der forekommer som nævnt en (tilfældig) variation i det konkrete udfald x, men med den stokastiske variabel kan vi beskrive disse variationer. i De værdier, som vi ovenfor har kaldt de sande værdier, betegnes matematisk som følger: 4

5 Den sande middelværdi: m. Den sande varians: s. Den sande spredning: s = s. Normalfordelte observationer For at vi kan komme nærmere en behandling og vurdering af middelværdien for højdemålingerne bag udsnittet i Tabel, kræves det, at højdemålinger følger en kendt fordeling. Dette krav indebærer, at der er en bestemt systematik i observationerne og at den stokastiske variabel, der ligger bag målingerne, kan beskrives systematisk med en matematisk model her normalfordelingen. Når man undersøger om et datasæt er normalfordelt gør man det grafisk med et fraktildiagram. I et fraktildiagram plotter man datasættets målinger på førsteaksen og de forventede værdier, under forudsætning af at datasættet er normalfordelt, på andenaksen. Hvis datasættet rent faktisk er normalfordelt, så vil alle målingerne derfor ligge præcist på en ret linje. Disse forventede værdier beregnes ved at anvende den omvendte funktion til standardnormalfordelingens tæthedsfunktion på i, hvor i betegner observationens nummer på den sorterede liste (her sorteret efter n stigende højde), og n betegner det samlede antal observationer i datasættet. Øvelse 9: Standardnormalfordelingen Hvad kendetegner standardnormalfordelingen? Søg fx oplysningerne på internettet. Øvelse 10: Fraktildiagram Sorter drengenes højde efter størrelse (stigende) i Udklip ved hjælp af dit værktøjsprogram. Opret to nye kolonner, som skal indeholde henholdsvis observationsnummer og den forventede værdi for hver af observationerne. De forventede værdier for højdemålingerne beregnes med værktøjsprogrammets indbyggede facilitet dertil. Her er det vist i Excel, hvor i = 1og n = 13, og hvor 0 og 1 er henholdsvis middelværdi og spredning i standardnormalfordelingen. Resultat: i Fortsættes beregningerne for i =, i = 3 osv. dvs. for n = 13, i 3 = osv., så bliver de første 6 n 13 punkter i fraktildiagrammet som følger: 1,65; -.60, 1,65; -,35, 1,65; -,19, 1,68; -,08, 1,68; -1,99, 1,69; - 1,91. ( ) ( ) ( ) ( ) ( ) ( ) Plot nu fraktildiagrammet med højdemålingerne på førsteaksen og de forventede værdier på andenaksen. Plot også den bedste rette linje (regressionslinjen) gennem punkterne. Hvis punkterne ligger tilnærmelsesvist på en ret linje, så kan vi opfatte højdemålingerne som normalfordelte. Hvis punkterne derimod afviger systematisk fra en ret linje, så må man lede efter en anden model for fordelingen. Typisk gælder det, at jo flere målinger, des mindre variation omkring en ret linje vil man forvente, og punkterne i et fraktildiagram må gerne sno sig omkring linjen. For drengene ser det ud som på Figur 1 nedenfor. I mange værktøjsprogrammer kaldes denne omvendte normalfordelingstæthedsfunktion for norminv( ) eller invnorm( ). 5

6 Figur 1: Fraktildiagram for fordelingen af drengenes højdemålinger, som angivet i Tabel 1. De fleste værktøjsprogrammer kan dog lave fraktildiagrammer direkte, uden at du behøver at udregne de forventede værdier. Fraktildiagram Plot af punkter (observeret værdi, forventet værdi) for et datasæt, hvor den forventede værdi er baseret på standardnormalfordelingen. Hvis punkterne tilnærmelsesvist ligger på en ret linje, kan datasættet betragtes som værende normalfordelt. En mindre præcis måde at vurdere på om et datasæt er normalfordelt, er ved at gruppere data og konstruere et søjlediagram. Er datasættet normalfordelt, vil man forvente at observationerne fordeler sig symmetrisk omkring den empiriske middelværdi, og at der er flest observationer tæt på middelværdien, mens der er færrest længst væk fra middelværdien. Fordelingen af observationerne siges at være klokkeformet. For alle højdemålingerne for drengene, som ligger bag udklippet i Tabel, ser den grupperede grafiske fremstilling (med intervalbredde 5 cm) ud som i Figur : Figur. Søjlediagram for fordelingen af alle højdemålingerne for drengene angivet i Tabel 1. Fraktildiagrammet og søjlediagrammet i Figur 1 og, giver god grund til tro, at drengenes højder er normalfordelte, og vi kan derfor gå ud fra, at fordelingen af højdemålingerne kan beskrives ved en normalfordeling. Vi siger også, at den stokastiske variabel X, der ligger bag data er normalfordelt, og vi skriver med matematisk notation: X : N ( ms, ). Med denne notationen fortæller vi samtidigt, at fordelingen er bestemt ud fra de to parametre, m og s. Det er jo disse parametre, vi estimerer, og vi vil i næste afsnit undersøge dem nærmere. 6

7 Øvelse 11: Fraktildiagram og søjlediagram Sortér pigernes højdemålinger i Udklip efter størrelse, og undersøg vha. et fraktildiagram og et søjlediagram, om pigernes højder kan antages at være normalfordelte. Der vil til den skriftlige prøve ikke blive stillet krav om fremstilling af fraktildiagrammer. Hypotesetest med et datasæt (en variabel) Hvis vi ønsker at undersøge, om de empiriske størrelser knyttet til et datasæt stemmer overens med andre undersøgelsers bestemmelse af samme (oplyst værdi), kan vi gøre dette med et t -test. Som i χ -test opstilles og undersøges en nulhypotese, som typisk formuleres som følger: Middelværdi i datasæt og den oplyste værdi er ens. Antag, at danske drenge i alderen år i gennemsnit er 1,8 m høje. Hvis vi fx ønsker at undersøge, om gennemsnitshøjden for de tyske drenge i Muffins er den samme som de danske drenges gennemsnitshøjde, opstiller vi nulhypotesen: De tyske drenges gennemsnitshøjde er 1,8 m Intuitivt kan man undersøge nulhypotesen ved at betragte forskellen mellem den empiriske middelværdi, x =1,84 (som du fandt i Øvelse 8), og de danske drenges højde m 0 = 1,8 m. Men vi må også tage datasættets spredning i betragtning. Hvis spredningen i datasættet er stor, så vil man acceptere en større margin på forskellen mellem de to middelværdier x og m 0. Er spredningen derimod lille, så vil kun en mindre margin blive accepteret. Man kan vise at den empiriske middelværdi, x, er normalfordelt med spredning, og det er den værdi, n vi skal dividere forskellen mellem middelværdierne med, således at spredningen tages i betragtning: s t-teststørrelse for et datasæt Den generelle formel til beregning af t-teststørrelsen er: x - m0 t = s n Da x er normalfordelt, kan man vise at t-teststørrelsen er: t-fordelt med f = n- 1 frihedsgrader og vi skriver: t : tn - 1 Nulhypotesen kan nu formuleres som: H 0 : Middelværdien for de tyske drenges højde er 1,8 m, dvs. m 0 = 1,8. t-teststørrelsen kan på baggrund af udregningerne fra Øvelse 8 og bemærkningen ovenfor beregnes til: 0,941 Vi har nu brug for at vurdere om teststørrelsen 0,941 er kritisk i forhold til vores nulhypotese. t-fordelingen har et meget nært slægtskab med normalfordelingen. Vi får brug at kunne vurdere teststørrelsen i forhold til en kritisk værdi, der kan fortælle, om vi skal forkaste nulhypotesen på et givet signifikansniveau. Som ved χ -testet bruger vi den funktion, som teststørrelsen er knyttet til, her t- fordelingen med n -1 frihedsgrader, til at bestemme den sandsynlighed, der svarer til teststørrelsen. Den sandsynlighed er ligesom i χ -testet netop et udtryk for, hvor svært/let det er, at frembringe en teststørrelse, der er mindst lige så stor som den observerede altså p-værdien! Grafisk set er p-værdien ligesom ved χ -testet med stor tilnærmelse givet ved arealet af det område, som grafen for fordelingens tæthedsfunktion afgrænser sammen med førsteaksen i intervallet afgrænset af teststørrelsen. t-testet er i modsætning til χ -testet dog to-sidet, dvs. området er to-delt en del til højre for den positive værdi af teststørrelsen og en del til venstre for den negative værdi af teststørrelsen (se Figur 3 nedenfor). 7

8 Vi kan også vælge at sammenligne teststørrelsen direkte med den kritiske værdi, ligesom i forbindelse med χ -testet. De kritiske værdier kan beregnes med et værktøjsprogram. På Figur 3 nedenfor ses grafen for tæthedsfunktionen for t-fordeling med f = 13-1 = 1 frihedsgrader. På figuren til venstre ses også plot af teststørrelsen 0,941 og den kritiske værdi 1,97 svarende til et signifikansniveau på 5% (dvs. der afskæres,5% i hver side). På figuren til højre ser vi, at arealet af det skraverede (gule) område afgrænset af grafen og førsteaksen hhv. til venstre for den negative værdi og til højre for den positive værdi af teststørrelsen er 34,8%, hvilket netop svarer til p-værdien. Figur 3: t-fordelingen, med 1 frihedsgrader. Til venstre ses teststørrelsen t = 0,941 og den kristiske værdi 1,97. Til højre ses den grafiske beregning af p-værdien. Det giver os, under forudsætning af at nulhypotesen er sand, anledning til, ikke at forkaste nulhypotesen på signifikansniveau 5%, da p-værdien er 0,348, dvs. sandsynligheden for at finde en teststørrelse, der er mindst lige så stor som den observerede er 34,8%. Vi kan naturligvis også beregne p-værdien (her vist i Excel): Resultat: Vi kan også beregne den kritiske værdi for t-testet på et 5% signifikansniveau med 1 frihedsgrader (her vist i Excel): Resultat: dvs. en kritisk værdi på 1,971, altså er vores teststørrelse på 0,941 mindre end den kritiske værdi, og vi kan således konkludere, at vi ikke kan forkaste nulhypotesen om, at gennemsnittet af de tyske drenges højde er 1,8 m. p-værdi og kritisk værdi Hvis p-værdien er mindre end signifikansniveauet, forkastes nulhypotesen. Hvis t-teststørrelsen er positiv og er større end den kritiske værdi ved det valgte signifikansniveau, så forkastes nulhypotesen. Hvis t-teststørrelsen er negativ og er mindre end den negative kritiske værdi ved det valgte signifikansniveau, så forkastes nulhypotesen. 8

9 Anvendelse af t-test for et datasæt (en variabel) i Muffins I et udklippet Udklip1 finder vi også andre variable, som vist i Tabel 3 nedenfor. Tabel 3. Uddrag af observationer for flere variable fra Udklip1. Vi vil nu undersøge, om gennemsnitshøjden for pigerne i stikprøven er 1,685 m, som oplyst på folkesundhed.dk. Vores nulhypotese bliver da: H : Middelværdien for de tyske pigers højde er 1,685 m, dvs. m højdepiger = 1,685 0 Vi bruger datasættet Udklip og bestemmer først deskriptorerne for datasættet her vist i Excel ved hjælp af Dataanalyse 3 : Herfra får vi den empiriske middelværdi, empiriske varians samt antal (alle indrammet ovenfor). Vi har dermed de størrelser, vi skal bruge til at teste nulhypotesen, og vi får teststørrelsen: Den kritiske værdi for t-fordelingen med signifikansniveau 5% og med 48 frihedsgrader kan bestemmes til: Resultat: Dvs. vores teststørrelse er større end den kritiske værdi, og vi må derfor forkaste vores nulhypotese på et 5% signifikansniveau, under forudsætning af at nulhypotesen er sand, dvs. gennemsnitshøjden for pigerne i 3 Installation af Dataanalyse i Excel sker under Indstillinger > Tilføjelsesprogrammer. En vejledning hertil kan findes flere steder på internettet. 9

10 stikprøven er ikke 1,685 m. p-værdien kan beregnes til 0,017 dvs. der er kun 1,7% sandsynlighed for at få en lige så stor værdi, som den fra folkesundhed.dk, hvilket jo giver samme konklusion. Bemærk: Nogle værktøjsprogrammer kan udføre dette t-test automatisk ud fra fx de observerede værdier i tabellen. Øvelse 1: t-test gennemsnitshøjde for drenge Undersøg med udgangspunkt i stikprøven Udklip1, om der er belæg for, at drengenes gennemsnitshøjde er 1,810 m. Du vælger selv signifikansniveau. Øvelse 13: t-test gennemsnitsvægt Undersøg med udgangspunkt i stikprøven Udklip1, om disse respondenter har en gennemsnitsvægt på 60 kg. Du vælger selv signifikansniveau. Fordeling af t-teststørrelsen Vi vil i det følgende undersøge t-teststørrelsen vha. simulering. Vi opfatter nu vores stikprøve med højderne for de 46 piger og drenge som vores population. Fra populationen udtager vi stikprøver af forskellig størrelse rigtig mange gange for at se, hvordan de mange teststørrelser for hver af disse stikprøver fordeler sig. Stikprøve på 7 personer Vi vælger at tage 76 stikprøver på hver 7 tilfældige personer blandt de 46. På figuren nedenfor ses et prikplot og et søjlediagram over fordelingen af de 76 teststørrelser: Figur 4. Prikdiagram og søjlediagram for 76 værdier af teststørrelsen. Prikplottet viser de 76 værdier af teststørrelsen, og vi ser, at teststørrelserne er både positive og negative. Mange af teststørrelserne samler sig omkring 0 og færre længere væk fra 0, og vi ser også en vis grad af symmetri omkring 0. Histogrammet viser, at de 76 teststørrelser fordeler sig med tilnærmelse til grafen for tæthedsfunktionen for en t-fordeling med 6 frihedsgrader, og vi skriver t teststørrelse : t 6. Udvider vi fra 76 til 1000 stikprøver og tegner et prikplot med de 1000 teststørrelser, så får vi: 10

11 Figur 5. Prikdiagram og søjlediagram for 1000 værdier af teststørrelsen. Konstruerer vi et histogram over fordelingen af de 1000 teststørrelser, finder vi, at histogrammet i endnu højere grad end med de 76 stikprøver følger grafen for tæthedsfunktionen for en t-fordeling med 6 frihedsgrader. Øvelse 14: Frihedsgrader Tegn grafen for tæthedsfunktionen for t-fordelingen (benyt den indbyggede tæthedsfunktion i dit værktøjsprogram) med 1,, 3, 100 og 1000 frihedsgrader (brug evt. et skyderelement). Hvad minder grafens form dig om? På hvilken måde ændrer grafen udseende, når antal frihedsgrader øges? Øvelse 15: Kritiske værdier Bestem og indtegn de kritiske værdier på signifikans niveau 5% sammen med graferne i Øvelse 15 husk, at t-testet er to-sidet, dvs. p-værdien svarende til den positive kritiske værdi er,5%. Stikprøve på 11 personer Vi udvider nu stikprøvestørrelsen til 11 personer. På samme vis som før, så tager vi tilfældigt henholdsvis 76 og 1000 stikprøver med hver 11 personer fra de 46 personer. Prikplottene ser nu ud som vist på Figur 6 nedenfor. Figur 6. Prikdiagram for 76 (venstre) og 1000 (højre) værdier af teststørrelsen. På Figur 7 ses søjlediagrammer for fordelingen af teststørrelserne både i tilfældet med 76 stikprøver og 1000 stikprøver. 11

12 Figur 7. Søjlediagram for 76 (venstre) og 1000 (højre) værdier af teststørrelsen. Igen ser vi, at søjlediagrammet følger grafen for tæthedsfunktionen for t-fordelingen med 10 frihedsgrader bedre des flere stikprøver, vi udtager. Der gælder følgende sammenhæng mellem stikprøvens størrelse og antallet af frihedsgrader i den aktuelle t-fordeling: Antal observationer og frihedsgrader Antallet af frihedsgrader er én mindre end antallet af observationer ved et t-test. Hypotesetest med to datasæt (to variable) Arbejdet med t-testet i forrige afsnit efterlader et billede af, at noget lignende kan gøres for to datasæt eksempelvis med data for drengene og pigerne i Tabel 1. Her har vi målinger for to variable, som hver kan betragtes som udfald af stokastiske variable, hhv. i 1 X og X i. Øvelse 16: Boksplot til sammenligning Bestem kvartilsæt samt middelværdi og konstruer et boksplot for hver af de to variable højde og vægt for hhv. alle piger og alle drenge i Udklip1. Sammenlign herefter med udgangspunkt i boksplot opdelt efter køn pigernes og drengenes vægt. Sammenlign på samme måde pigernes og drengenes højde. Hvis vi vil sammenligne datasættene, er det oplagt at undersøge, om drengenes og pigernes højde er ens. I stedet for at sammenligne et datasæt med en tabelværdi, som vi gjorde før, vil vi her sammenligne middelværdierne for de to køns højdemålinger. Som ved testet på ét datasæt, tager vi udgangspunkt i de empiriske størrelser og undersøger nulhypotesen: Pigernes gennemsnitshøjde er den samme som drengenes gennemsnitshøjde Først må vi dog undersøge, om de to datasæt hver for sig er normalfordelte. Vi ved allerede at drengenes højdemålinger er normalfordelte. I Figur 8 nedenfor ser vi fraktildiagrammet samt søjlediagrammet for fordelingen af pigernes højde (jf. Øvelse 11). 1

13 Figur 8: Fraktildiagram og søjlediagram for fordelingen af pigernes højdemålinger. Fraktildiagrammet giver os god grund til at tro på, at pigernes højder er normalfordelte. Dvs. vi kan gå ud fra, at fordelingen af højdemålingerne for både piger og drenge kan beskrives ved en normalfordeling. Vi siger også, at den stokastiske variabel X, der ligger bag de kønsopdelte data er normalfordelt, og vi skriver med matematisk notation: X ij i j N( mj, s j ) :, hvor j et betyder, at de to datasæt har forskellige parametre. Vi skal så nu undersøge om disse parametre kan antages at være ens, dvs. om pigerne og drengene er gennemsnitligt lige høje. For at kunne sammenligne middelværdierne for hhv. pigernes og drengenes højde, dvs. vurdere forskellen mellem de empiriske middelværdier, må vi også her tage hvert af datasættenes spredning i betragtning. Derfor får vi brug for en størrelse, der beskriver den fælles varians, Fælles varians for de to datasæt Den fælles varians for de to datasæt kan beregnes ved f + d sd f p sp sf = f + f d p hvor f d betegner frihedsgrader, og s d betegner spredningen i relation til drengenes højde tilsvarende for f p og s p for pigernes højde. s : f Øvelse 17: Fælles varians Benyt dit værktøjsprogram til at bestemme Vi vil ikke diskutere s f for de to datasæt i Tabel 1. s f dybere, men blot konstatere at s f indeholder bidrag fra begge datasæt, og at der er et krav til variationen internt i begge disse, for at vi kan bruge s : Der må ikke være signifikant forskel på de to variationer. Det vil sige, at pigernes højdemålinger skal variere ligeså meget (eller lidt) som drengenes højdemålinger, for at vi kan sammenligne de to middelværdier. Hvordan man vurderer om dette er tilfældet, er ikke helt ligetil, men fx kan et boksplot give os et godt billede af om variationerne følger samme mønster: f Figur 9. Boksplot for højdemålingerne for drengene og pigerne fra Tabel 1. Af Figur 9 fremgår det, at variationsbredden og kvartilbredden i hvert af de to boksplot er nogenlunde ens, og vi har derfor grund til at tro, at der ikke er signifikant forskel på variationen i de to variable 4. Bemærk, at det kun er variansen, vi forholder os til her og ikke middelværdien. 4 Det er også muligt at teste om forskellen mellem de to varianser er signifikant, i dette tilfælde bruges et F-test. 13

14 På baggrund af overvejelserne ovenfor opstiller vi nulhypotesen og udregner teststørrelsen for sammenligningen af de to datasæts middelværdier: H : Middelværdien for pigernes højde og drengenes højde er ens, dvs. md = mp 0 Generelt gælder der om t-teststørrelsen i denne sammenhæng: t-test for to datasæt med ens varians Den generelle formel til beregning af t-teststørrelsen for to datasæt (her dog eksemplificeret ved datasæt for piger og drenge) er: xd -xp t = æ 1 1 ö sf + ç ènd np ø hvor xd og x p betegner de empiriske middelværdier for hhv. drenge og piger, den fælles varians for piger og drenge, mens n d og s f betegner npbetegner antallet af observationer for hhv. drengenes højde og pigernes højde. Teststørrelsen er t-fordelt med f = nd + np - frihedsgrader, og vi skriver: t : t n + n - d p Ved indsættelse af de kendte værdier i formlen bliver t-teststørrelsen således her: Vi undersøger om denne teststørrelse er kritisk i forhold til nulhypotesen på et 5% signifikansniveau. Da begge datasæt er normalfordelte, finder man, at teststørrelsen er t-fordelt med f = n + n - = = 460 frihedsgrader. d p Den kritiske værdi bestemmes (her beregnet i Excel): Resultat: Dvs. vores teststørrelse er større end den kritiske værdi, og vi må således forkaste nulhypotesen på et 5% signifikansniveau. Dvs. højderne er ikke ens for de to køn. Vi kan tilsvarende udregne, at p-værdien bliver meget lille, nemlig 4, , og at konklusionen ud fra p- værdien derfor som ventet er den samme. Bemærk: I det følgende og tilsvarende i de opgaver, der stilles til den skriftlige prøve, vil vi forudsætte, at variansen for de aktuelle variable er ens. Anvendelse af t-test for to datasæt (to variable) i Muffins I Udklip3 i MuffinsUdklip.xls har vi følgende datasæt: 14

15 Tabel 4. Udklip3 med både kategoriske og numeriske variable. Øvelse 18: Numeriske og kategoriske variable Hvilke variable indgår i udklippet? Hvilke af disse variable er numeriske henholdsvis kategoriske? Øvelse 19: Boksplot til sammenligning Bestem kvartilsæt samt middelværdi, og konstruer boksplot for de tre variable Fritid, Fjernsynstid og Læsetid for hhv. alle piger og alle drenge. Kommenter fordelingen af data for de tre variable. Med udgangspunkt i denne stikprøve kan vi undersøge forskellige hypoteser, hvor de fire variable indgår. Vi vil undersøge om gennemsnittet af fritidstimer på en uge for piger er den samme som gennemsnittet af fritidstimer på en uge for drenge. Vi antager, at variansen for piger og drenges fritidstimer er ens. Vores nulhypotese bliver da: H : m = m 0 fritidpiger fritiddrenge Vi sorterer først data, således at vi først har pigernes data og derefter drengenes data. På den måde får vi opdelt vores stikprøve i to mindre stikprøver. Vi tester nulhypotesen med et t-test og får (her vist i Excel): 15

16 Da p-værdien er meget lille, kan vi klart afvise nulhypotesen på et 5% signifikansniveau under forudsætning af, at der er ens varians. Dvs. gennemsnittet af fritidstimer på en uge er forskellig for piger og drenge. Øvelse 0: Køn og fjernsyn I Udklip3 finder du observationer fra Muffins for de to variable Køn og Fjernsynstid, hvor variablen Fjernsynstid indeholder respondenternes svar på, hvor mange timer de ser tv pr. uge. Bestem kvartilsættene, og tegn for hvert køn et boksplot, der viser fordelingen af fjernsynstid for begge køn. Det oplyses, at variansen af pigernes og drengenes fjernsynstid kan antages at være ens. Overvej, hvordan dette kommer til udtryk i boksplottene. Opstil en nulhypotese, der kan anvendes til at undersøge om middelværdien for pigers og drenges fjernsynstid er ens, og undersøg om nulhypotesen kan forkastes på et 5% signifikansniveau. Øvelse 1: Køn og vægt I Udklip1 finder du observationer fra Muffins for de to variable Køn og Vægt. Bestem kvartilsættene, og tegn for hvert køn et boksplot, der viser vægtfordelingen for begge køn. Det oplyses, at variansen af pigernes og drengenes vægt kan antages at være ens. Overvej, hvordan dette kommer til udtryk i boksplottene. Opstil en nulhypotese, der kan anvendes til at undersøge om middelværdien for pigers og drenges vægt er ens, og undersøg om nulhypotesen kan forkastes på et 5% signifikans-niveau. Kilder 1. Muffins databasen: Statistik, Thomas Bendsen, VIA University College Bioanalytikeruddannelsen, : 3. Statistik i løb, Preben Blæsild og Lars Bo Kristensen, LMFK, 005, kan købes her: under bogsalg. 4. Idrætsstatistik, Preben Blæsild og Jørgen Granfeldt, Institut for Matematiske Fag AU, 001: 5. Danskernes højde ifølge Folkesundhed.dk: a) 16

Matematik A. Studentereksamen. Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet

Matematik A. Studentereksamen. Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet Matematik A Studentereksamen Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet stx11-matn/a-080501 Tirsdag den 8. maj 01 Forberedelsesmateriale til stx A Net MATEMATIK Der

Læs mere

Tema. Dagens tema: Indfør centrale statistiske begreber.

Tema. Dagens tema: Indfør centrale statistiske begreber. Tema Dagens tema: Indfør centrale statistiske begreber. Model og modelkontrol Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. konfidensintervaller Vi tager udgangspunkt i Ex. 3.1 i

Læs mere

Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ 2 -test og Goodness of Fit test.

Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ 2 -test og Goodness of Fit test. Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ -test og Goodness of Fit test. Anvendelser af statistik Statistik er et levende og fascinerende emne, men at læse om det er alt

Læs mere

Kapitel 7 Forskelle mellem centraltendenser

Kapitel 7 Forskelle mellem centraltendenser Kapitel 7 Forskelle mellem centraltendenser Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 29 Indledning 1. z-test for ukorrelerede data 2. t-test for ukorrelerede data med ens

Læs mere

Konfidensintervaller og Hypotesetest

Konfidensintervaller og Hypotesetest Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller

Læs mere

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven. PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve

Læs mere

Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen

Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen Microsoft Excel har en del standard anvendelsesmuligheder i forhold til den beskrivende statistik og statistisk

Læs mere

Statistik med TI-Nspire CAS version 3.2. Bjørn Felsager September 2012. [Fjerde udgave]

Statistik med TI-Nspire CAS version 3.2. Bjørn Felsager September 2012. [Fjerde udgave] Statistik med TI-Nspire CAS version 3.2 Bjørn Felsager September 2012 [Fjerde udgave] Indholdsfortegnelse Forord Beskrivende statistik 1 Grundlæggende TI-Nspire CAS-teknikker... 4 1.2 Lister og regneark...

Læs mere

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0 Hypotesetest Hypotesetest generelt Ingredienserne i en hypotesetest: Statistisk model, f.eks. X 1,,X n uafhængige fra bestemt fordeling. Parameter med estimat. Nulhypotese, f.eks. at antager en bestemt

Læs mere

2 -test. Fordelingen er særdeles kompleks at beskrive med matematiske formler. 2 -test blev opfundet af Pearson omkring år 1900.

2 -test. Fordelingen er særdeles kompleks at beskrive med matematiske formler. 2 -test blev opfundet af Pearson omkring år 1900. 2 -fordeling og 2 -test Generelt om 2 -fordelingen 2 -fordelingen er en kontinuert fordeling, modsat binomialfordelingen som er en diskret fordeling. Fordelingen er særdeles kompleks at beskrive med matematiske

Læs mere

for gymnasiet og hf 2017 Karsten Juul

for gymnasiet og hf 2017 Karsten Juul for gymnasiet og hf 75 50 5 017 Karsten Juul Statistik for gymnasiet og hf 017 Karsten Juul 5/11-017 Nyeste version af dette hæfte kan downloades fra http://mat1.dk/noter.htm Hæftet må benyttes i undervisningen

Læs mere

Matematik A. Studentereksamen. Digital eksamensopgave med adgang til internettet

Matematik A. Studentereksamen. Digital eksamensopgave med adgang til internettet Matematik A Studentereksamen Digital eksamensopgave med adgang til internettet 2stx121-MATn/A-31052012 Torsdag den 31. maj 2012 kl. 09.00-14.00 Side 1 af 7 sider Opgavesættet er delt i to dele: Delprøve

Læs mere

Personlig stemmeafgivning

Personlig stemmeafgivning Ib Michelsen X 2 -test 1 Personlig stemmeafgivning Efter valget i 2005 1 har man udspurgt en mindre del af de deltagende, om de har stemt personligt. Man har svar fra 1131 mænd (hvoraf 54 % har stemt personligt

Læs mere

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele Anvendt Statistik Lektion 4 Hypotesetest generelt Test for middelværdi Test for andele Hypoteser og Test Hypotese I statistik er en hypotese en påstand om en populationsparameter. Typisk en påstand om

Læs mere

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05 Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

Vejledende besvarelser til opgaver i kapitel 14

Vejledende besvarelser til opgaver i kapitel 14 Vejledende besvarelser til opgaver i kapitel 14 Opgave 1 a) Det første trin i opstillingen af en hypotesetest er at formulere to hypoteser, hvoraf den ene støtter den teori vi vil teste, mens den anden

Læs mere

Kapitel 12 Variansanalyse

Kapitel 12 Variansanalyse Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 / 43 Indledning Sammenligning af middelværdien i to grupper indenfor en stikprøve kan

Læs mere

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2- test [ki-i-anden-test] Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination af

Læs mere

Et matematikeksperiment: Bjørn Felsager, Haslev Gymnasium & HF

Et matematikeksperiment: Bjørn Felsager, Haslev Gymnasium & HF Sammenligning af to måleserier En af de mest grundlæggende problemstillinger i statistik består i at undersøge om to forskellige måleserier er signifikant forskellige eller om forskellen på de to serier

Læs mere

Værktøjshjælp for TI-Nspire CAS Struktur for appendiks:

Værktøjshjælp for TI-Nspire CAS Struktur for appendiks: Værktøjshjælp for TI-Nspire CAS Struktur for appendiks: Til hvert af de gennemgåede værktøjer findes der 5 afsnit. De enkelte afsnit kan læses uafhængigt af hinanden. Der forudsættes et elementært kendskab

Læs mere

MATEMATIK A-NIVEAU. Anders Jørgensen & Mark Kddafi. Vejledende eksempler på eksamensopgaver og eksamensopgaver i matematik, 2012

MATEMATIK A-NIVEAU. Anders Jørgensen & Mark Kddafi. Vejledende eksempler på eksamensopgaver og eksamensopgaver i matematik, 2012 MATEMATIK A-NIVEAU Vejledende eksempler på eksamensopgaver og eksamensopgaver i matematik, 2012 Kapitel 4 Statistik & sandsynlighedsregning 2016 MATEMATIK A-NIVEAU Vejledende eksempler på eksamensopgaver

Læs mere

Kursus 02402 Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff

Kursus 02402 Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks

Læs mere

Kapitel 12 Variansanalyse

Kapitel 12 Variansanalyse Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 Indledning 2 Ensidet variansanalyse 3 Blokforsøg 4 Vekselvirkning 1 Indledning 2 Ensidet

Læs mere

Kapitel 8 Chi-i-anden (χ 2 ) prøven

Kapitel 8 Chi-i-anden (χ 2 ) prøven Kapitel 8 Chi-i-anden (χ 2 ) prøven Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 19 Indledning Forskelle mellem stikprøver undersøges med z-test eller t-test for data målt på

Læs mere

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. Tema Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. (Fx. x. µ) Hypotese og test. Teststørrelse. (Fx. H 0 : µ = µ 0 ) konfidensintervaller

Læs mere

Projekt 8.3 Hvordan undersøges om et talmateriale normalfordelt?

Projekt 8.3 Hvordan undersøges om et talmateriale normalfordelt? Projekt 8.3 Hvordan undersøges om et talmateriale normalfordelt? Projektet drejer sig om at udvikle en metode, til at undersøge om et givet talmateriale med rimelighed kan siges at være normalfordelt.

Læs mere

Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 136

Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 136 Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 36 Det er besværligt at regne med binomialfordelingen, og man vælger derfor ofte at bruge en approksimation med normalfordeling. Man

Læs mere

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test Statistik Lektion 0 Ikkeparametriske metoder Repetition KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,

Læs mere

CMU PROJEKT HYPOTESETEST OG SIMULERING MICHAEL AGERMOSE JENSEN CHRISTIANSHAVNS GYMNASIUM

CMU PROJEKT HYPOTESETEST OG SIMULERING MICHAEL AGERMOSE JENSEN CHRISTIANSHAVNS GYMNASIUM CMU PROJEKT HYPOTESETEST OG SIMULERING MICHAEL AGERMOSE JENSEN CHRISTIANSHAVNS GYMNASIUM FORMÅL - BEKENDTGØRELSEN STX MATEMATIK A Kompetencer anvende simple statistiske eller sandsynlighedsteoretiske modeller

Læs mere

Mikro-kursus i statistik 1. del. 24-11-2002 Mikrokursus i biostatistik 1

Mikro-kursus i statistik 1. del. 24-11-2002 Mikrokursus i biostatistik 1 Mikro-kursus i statistik 1. del 24-11-2002 Mikrokursus i biostatistik 1 Hvad er statistik? Det systematiske studium af tilfældighedernes spil!dyrkes af biostatistikere Anvendes som redskab til vurdering

Læs mere

Dig og din puls Lærervejleding

Dig og din puls Lærervejleding Dig og din puls Lærervejleding Indledning I det efterfølgende materiale beskrives et forløb til matematik C, hvori eleverne skal måle hvilepuls og arbejdspuls og beskrive observationerne matematisk. Materialet

Læs mere

Opgaver til kapitel 3

Opgaver til kapitel 3 Opgaver til kapitel 3 3.1 En løber er interesseret i at undersøge om hendes løbeur er kalibreret korrekt. Hun udmåler derfor en strækning på præcis 1000 m og løber den 16 gange. For hver løbetur noterer

Læs mere

Gennemsnit og normalfordeling illustreret med terningkast, simulering og SLUMP()

Gennemsnit og normalfordeling illustreret med terningkast, simulering og SLUMP() Gennemsnit og normalfordeling illustreret med terningkast, simulering og SLUMP() John Andersen, Læreruddannelsen i Aarhus, VIA Et kast med 10 terninger gav følgende udfald Fig. 1 Result of rolling 10 dices

Læs mere

Forelæsning 9: Inferens for andele (kapitel 10)

Forelæsning 9: Inferens for andele (kapitel 10) Kursus 02402 Introduktion til Statistik Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

5.11 Middelværdi og varians Kugler Ydelse for byg [Obligatorisk opgave 2, 2005]... 14

5.11 Middelværdi og varians Kugler Ydelse for byg [Obligatorisk opgave 2, 2005]... 14 Module 5: Exercises 5.1 ph i blod.......................... 1 5.2 Medikamenters effektivitet............... 2 5.3 Reaktionstid........................ 3 5.4 Alkohol i blodet...................... 3 5.5

Læs mere

Modelkontrol i Faktor Modeller

Modelkontrol i Faktor Modeller Modelkontrol i Faktor Modeller Julie Lyng Forman Københavns Universitet Afdeling for Anvendt Matematik og Statistik Statistik for Biokemikere 2003 For at konklusionerne på en ensidet, flersidet eller hierarkisk

Læs mere

Normalfordelingen og Stikprøvefordelinger

Normalfordelingen og Stikprøvefordelinger Normalfordelingen og Stikprøvefordelinger Normalfordelingen Standard Normal Fordelingen Sandsynligheder for Normalfordelingen Transformation af Normalfordelte Stok.Var. Stikprøver og Stikprøvefordelinger

Læs mere

Afsnit E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse

Afsnit E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse Afsnit 8.3 - E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse Først skal normalfordelingen lige defineres i Maple, så vi kan benytte den i vores udregninger. Dette gøres

Læs mere

Fagligt samspil mellem Ma-B og SA-A Lisbeth Basballe, Mariagerfjord Gymnasium og Marianne Kesselhahn, Egedal Gymnasium og HF

Fagligt samspil mellem Ma-B og SA-A Lisbeth Basballe, Mariagerfjord Gymnasium og Marianne Kesselhahn, Egedal Gymnasium og HF Fagligt samspil mellem Ma-B og SA-A Lisbeth Basballe, Mariagerfjord Gymnasium og Marianne Kesselhahn, Egedal Gymnasium og HF Vi ønskede at planlægge og afprøve et undervisningsforløb, hvor anvendelse af

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2 -test [ki-i-anden-test] 1 Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination

Læs mere

Note om Monte Carlo metoden

Note om Monte Carlo metoden Note om Monte Carlo metoden Kasper K. Berthelsen Version 1.2 25. marts 2014 1 Introduktion Betegnelsen Monte Carlo dækker over en lang række metoder. Fælles for disse metoder er, at de anvendes til at

Læs mere

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Normalfordelingen. Statistik og Sandsynlighedsregning 2 Normalfordelingen Statistik og Sandsynlighedsregning 2 Repetition og eksamen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange variable, blandt andet tilfældige fejl på

Læs mere

for gymnasiet og hf 2016 Karsten Juul

for gymnasiet og hf 2016 Karsten Juul for gymnasiet og hf 75 50 5 016 Karsten Juul Statistik for gymnasiet og hf Ä 016 Karsten Juul 4/1-016 Nyeste version af dette håfte kan downloades fra http://mat1.dk/noter.htm HÅftet mç benyttes i undervisningen

Læs mere

Eksamen i Statistik for biokemikere. Blok

Eksamen i Statistik for biokemikere. Blok Eksamen i Statistik for biokemikere. Blok 2 2007. Vejledende besvarelse 22-01-2007, Niels Richard Hansen Bemærkning: Flere steder er der givet en argumentation (f.eks. baseret på konfidensintervaller)

Læs mere

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte

Læs mere

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220

Læs mere

Løsning til opgave 7, 9, 10 og 11C Matematik B Sommer 2014

Løsning til opgave 7, 9, 10 og 11C Matematik B Sommer 2014 Vejledning til udvalgte opgave fra Matematik B, sommer 2014 Opgave 7 Størrelsen og udbudsprisen på 100 fritidshuse på Rømø er indsamlet via boligsiden.dk. a) Grafisk præsentation, der beskriver fordelingen

Læs mere

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test Ikkeparametriske metoder Repetition Wilcoxon SignedRank Test KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,

Læs mere

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik Bygning 305/324 Danmarks Tekniske Universitet

Læs mere

Statistik i GeoGebra

Statistik i GeoGebra Statistik i GeoGebra Peter Harremoës 13. maj 2015 Jeg vil her beskrive hvordan man kan lave forskellige statistiske analyser ved hjælp af GeoGebra 4.2.60.0. De statistiske analyser svarer til pensum Matematik

Læs mere

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte

Læs mere

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau Hvad skal vi lave? 1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ. Teststatistik P-værdi Signifikansniveau 2 t-test for middelværdi Tosidet t-test for middelværdi Ensidet t-test for middelværdi

Læs mere

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Introduktion Kursusholder: Kasper K. Berthelsen Opbygning: Kurset består af 5 blokke En blok består af: To normale

Læs mere

Kapitel 4 Sandsynlighed og statistiske modeller

Kapitel 4 Sandsynlighed og statistiske modeller Kapitel 4 Sandsynlighed og statistiske modeller Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 Indledning 2 Sandsynlighed i binomialfordelingen 3 Normalfordelingen 4 Modelkontrol

Læs mere

Note til styrkefunktionen

Note til styrkefunktionen Teoretisk Statistik. årsprøve Note til styrkefunktionen Først er det vigtigt at gøre sig klart, at når man laver statistiske test, så kan man begå to forskellige typer af fejl: Type fejl: At forkaste H

Læs mere

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke. Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke. 1/23 Opsummering af fordelinger X 1. Kendt σ: Z = X µ σ/ n N(0,1)

Læs mere

Vejledende besvarelse af eksamen i Statistik for biokemikere, blok

Vejledende besvarelse af eksamen i Statistik for biokemikere, blok Opgave 1 Vejledende besvarelse af eksamen i Statistik for biokemikere, blok 2 2006 Inge Henningsen og Niels Richard Hansen Analysevariablen i denne opgave er variablen forskel, der for hver af 10 kvinder

Læs mere

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6 Institut for Matematiske Fag Matematisk Modellering 1 Aarhus Universitet Eva B. Vedel Jensen 25. februar 2008 UGESEDDEL 6 Forelæsningerne torsdag den 21. februar og tirsdag den 26. februar. Jeg har gennemgået

Læs mere

Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1)

Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1) Kursus 02402: Besvarelser til øvelsesopgaver i uge 9 Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1) Som model benyttes en binomialfordeling, som beskriver antallet, X, blandt

Læs mere

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007 Rettevejledning til eksamen i Kvantitative metoder 1,. årsprøve. januar 007 I rettevejledningen henvises der til Berry and Lindgren "Statistics Theory and methods"(b&l) hvis ikke andet er nævnt. Opgave

Læs mere

Dagens Emner. Likelihood teori. Lineær regression (intro) p. 1/22

Dagens Emner. Likelihood teori. Lineær regression (intro) p. 1/22 Dagens Emner Likelihood teori Lineær regression (intro) p. 1/22 Likelihood-metoden M : X i N(µ,σ 2 ) hvor µ og σ 2 er ukendte Vi har, at L(µ,σ 2 ) = ( 1 2πσ 2)n/2 e 1 2σ 2 P n (x i µ) 2 er tætheden som

Læs mere

Produkt og marked - matematiske og statistiske metoder

Produkt og marked - matematiske og statistiske metoder Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 19, 2016 1/26 Kursusindhold: Sandsynlighedsregning og lagerstyring

Læs mere

Spørgeskemaundersøgelser og databehandling

Spørgeskemaundersøgelser og databehandling DASG. Nye veje i statistik og sandsynlighedsregning. side 1 af 12 Spørgeskemaundersøgelser og databehandling Disse noter er udarbejdet i forbindelse med et tværfagligt samarbejde mellem matematik og samfundsfag

Læs mere

University of Copenhagen. Notat om statistisk inferens Larsen, Martin Vinæs. Publication date: Document Version Peer-review version

University of Copenhagen. Notat om statistisk inferens Larsen, Martin Vinæs. Publication date: Document Version Peer-review version university of copenhagen University of Copenhagen Notat om statistisk inferens Larsen, Martin Vinæs Publication date: 2014 Document Version Peer-review version Citation for published version (APA): Larsen,

Læs mere

χ 2 -test i GeoGebra Jens Sveistrup, Gammel Hellerup Gymnasium

χ 2 -test i GeoGebra Jens Sveistrup, Gammel Hellerup Gymnasium χ 2 -test i GeoGebra Jens Sveistrup, Gammel Hellerup Gymnasium Man kan nemt lave χ 2 -test i GeoGebra både goodness-of-fit-test og uafhængighedstest. Den følgende vejledning bygger på GeoGebra version

Læs mere

Preben Blæsild og Jens Ledet Jensen

Preben Blæsild og Jens Ledet Jensen χ 2 Test Preben Blæsild og Jens Ledet Jensen Institut for Matematisk Fag Aarhus Universitet Egå Gymnasium, December 2010 Program 8.15-10.00 Forelæsning 10.15-12.00 Statlab: I arbejder, vi cirkler rundt

Læs mere

LØNSPREDNINGSOPGØRELSER NU TILGÆNGELIG I LOPAKS

LØNSPREDNINGSOPGØRELSER NU TILGÆNGELIG I LOPAKS LØNSPREDNINGSOPGØRELSER NU TILGÆNGELIG I LOPAKS INDHOLD 2 Formål 2 LOPAKS 3 Begreber 6 Eksempler 6. december 2010 LOPAKS er nu udvidet med en ny tabel, der giver mulighed for at opgøre lønspredning på

Læs mere

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet

Læs mere

Statistik. Peter Sørensen: Statistik og sandsynlighed Side 1

Statistik. Peter Sørensen: Statistik og sandsynlighed Side 1 Statistik Formålet... 1 Mindsteværdi... 1 Størsteværdi... 1 Ikke grupperede observationer... 2 Median og kvartiler defineres ved ikke grupperede observationer således:... 2 Middeltal defineres ved ikke

Læs mere

Statistik. Deskriptiv statistik, normalfordeling og test. Karsten Juul

Statistik. Deskriptiv statistik, normalfordeling og test. Karsten Juul Statistik Deskriptiv statistik, normalfordeling og test Karsten Juul Intervalhyppigheder En elevgruppe på et gymnasium har spurgt 100 tilfældigt valgte elever på gymnasiet om hvor lang tid det tager dem

Læs mere

Velkommen til Flemmings store Maplekursus 1. lektion. Skift mellem tekst- og matematikmode

Velkommen til Flemmings store Maplekursus 1. lektion. Skift mellem tekst- og matematikmode Velkommen til Flemmings store Maplekursus 1. lektion. Skift mellem tekst- og matematikmode Man kan skifte mellem tekst- og matemamatikmode ved at trykke på F5. I øjeblikket er jeg i tekstmode.. 2. lektion.

Læs mere

Løsning til eksaminen d. 14. december 2009

Løsning til eksaminen d. 14. december 2009 DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,

Læs mere

Statistik II 1. Lektion. Analyse af kontingenstabeller

Statistik II 1. Lektion. Analyse af kontingenstabeller Statistik II 1. Lektion Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller Logistisk regression

Læs mere

Deskriptiv statistik for hf-matc

Deskriptiv statistik for hf-matc Deskriptiv statistik for hf-matc 75 50 25 2018 Karsten Juul Deskriptiv statistik for hf-matc Hvad er deskriptiv statistik? 1.1 Hvad er deskriptiv statistik?... 1 1.2 Hvad er grupperede og ugrupperede data?...

Læs mere

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se Epidemiologi og biostatistik. Uge, torsdag 5. februar 00 Morten Frydenberg, Institut for Biostatistik. Type og type fejl Statistisk styrke Nogle speciale metoder: Normalfordelte data : t-test eksakte sikkerhedsintervaller

Læs mere

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Deskriptiv statistik. Version 2.1. Noterne er et supplement til Vejen til matematik AB1. Henrik S. Hansen, Sct. Knuds Gymnasium

Deskriptiv statistik. Version 2.1. Noterne er et supplement til Vejen til matematik AB1. Henrik S. Hansen, Sct. Knuds Gymnasium Deskriptiv (beskrivende) statistik er den disciplin, der trækker de væsentligste oplysninger ud af et ofte uoverskueligt materiale. Det sker f.eks. ved at konstruere forskellige deskriptorer, d.v.s. regnestørrelser,

Læs mere

Projekt 1 Spørgeskemaanalyse af Bedst på Nettet

Projekt 1 Spørgeskemaanalyse af Bedst på Nettet Projekt 1 Spørgeskemaanalyse af Bedst på Nettet D.29/2 2012 Udarbejdet af: Katrine Ahle Warming Nielsen Jannie Jeppesen Schmøde Sara Lorenzen A) Kritik af spørgeskema Set ud fra en kritisk vinkel af spørgeskemaet

Læs mere

Lineære sammenhænge, residualplot og regression

Lineære sammenhænge, residualplot og regression Lineære sammenhænge, residualplot og regression Opgave 1: Er der en bagvedliggende lineær sammenhæng? I mange sammenhænge indsamler man data som man ønsker at undersøge og afdække eventuelle sammenhænge

Læs mere

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala 3 5% 5% 5% 0 3 4 5 6 7 8 9 0 Statistik for biologer 005-6, modul 5: Normalfordelingen opstår når mange forskellige faktorer uafhængigt af hinanden bidrager med additiv variation til. F.eks. Højde af rekrutter

Læs mere

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter Program Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Øvelse: effekt af diæter. Repetition fra sidst... Parrede og ikke-parrede

Læs mere

Dagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at

Dagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at Likelihood teori Lineær regression (intro) Dagens Emner Likelihood-metoden M : X i N(µ,σ 2 ) hvor µ og σ 2 er ukendte Vi har, at L(µ,σ 2 1 ) = ( 2πσ 2)n/2 e 1 2 P n (xi µ)2 er tætheden som funktion af

Læs mere

Løsning eksamen d. 15. december 2008

Løsning eksamen d. 15. december 2008 Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

MPH specialmodul Epidemiologi og Biostatistik

MPH specialmodul Epidemiologi og Biostatistik MPH specialmodul Epidemiologi og Biostatistik Kvantitative udfaldsvariable 23. maj 2011 www.biostat.ku.dk/~sr/mphspec11 Susanne Rosthøj (Per Kragh Andersen) 1 Kapitelhenvisninger Andersen & Skovgaard:

Læs mere

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau... Indhold 1 Statistisk inferens: Hypotese og test 2 1.1 Nulhypotese - alternativ.................................. 2 1.2 Teststatistik........................................ 3 1.3 P-værdi..........................................

Læs mere

Vejledende eksamensopgaver vedr. hypotesetest (stx B og stx A)

Vejledende eksamensopgaver vedr. hypotesetest (stx B og stx A) Vejledende eksamensopgaver vedr. hypotesetest (stx B og stx A) Opgave 1 I nedenstående tabel ses resultaterne af samtlige hjerteklapoperationer i 007-08 ved Odense Universitetshospital (OUH) sammenlignet

Læs mere

Dig og din puls. 17-10-2004 Dig og din puls Side 1 af 17

Dig og din puls. 17-10-2004 Dig og din puls Side 1 af 17 Dig og din puls Jette Rygaard Poulsen, Frederikshavn Gymnasium og HF-kursus Hans Vestergaard, Frederikshavn Gymnasium og HF-kursus Søren Lundbye-Christensen, AAU 17-10-2004 Dig og din puls Side 1 af 17

Læs mere

C) Perspektiv jeres kommunes resultater vha. jeres svar på spørgsmål b1 og b2.

C) Perspektiv jeres kommunes resultater vha. jeres svar på spørgsmål b1 og b2. C) Perspektiv jeres kommunes resultater vha. jeres svar på spørgsmål b1 og b. 5.000 4.800 4.600 4.400 4.00 4.000 3.800 3.600 3.400 3.00 3.000 1.19% 14.9% 7.38% 40.48% 53.57% 66.67% 79.76% 9.86% 010 011

Læs mere

Torben Rønne. Statistik. med TI InterActive

Torben Rønne. Statistik. med TI InterActive Torben Rønne Statistik med TI InterActive Indholdsfortegnelse 1 Beskrivende statistik... 3 1.1 Middelværdi, kvartilsæt og boksplot... 3 1. Histogram og sumkurve... 5 1.3 Varians og spredning... 9 Normalfordelingen...

Læs mere

Skriv punkternes koordinater i regnearket, og brug værktøjet To variabel regressionsanalyse.

Skriv punkternes koordinater i regnearket, og brug værktøjet To variabel regressionsanalyse. Opdateret 28. maj 2014. MD Ofte brugte kommandoer i Geogebra. Generelle Punktet navngives A Geogebra navngiver punktet Funktionen navngives f Funktionen navngives af Geogebra Punktet på grafen for f med

Læs mere

Statistik II 4. Lektion. Logistisk regression

Statistik II 4. Lektion. Logistisk regression Statistik II 4. Lektion Logistisk regression Logistisk regression: Motivation Generelt setup: Dikotom(binær) afhængig variabel Kontinuerte og kategoriske forklarende variable (som i lineær reg.) Eksempel:

Læs mere

Forelæsning 8: Inferens for varianser (kap 9)

Forelæsning 8: Inferens for varianser (kap 9) Kursus 02402 Introduktion til Statistik Forelæsning 8: Inferens for varianser (kap 9) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby

Læs mere

PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006

PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006 PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006 I dag: To stikprøver fra en normalfordeling, ikke-parametriske metoder og beregning af stikprøvestørrelse Eksempel: Fiskeolie

Læs mere

for matematik pä B-niveau i hf

for matematik pä B-niveau i hf for matematik pä B-niveau i hf 014 Karsten Juul TEST 1 StikprÅver... 1 1.1 Hvad er populationen?... 1 1. Hvad er stikpråven?... 1 1.3 Systematiske fejl ved valg af stikpråven.... 1 1.4 TilfÇldige fejl

Læs mere

Statistiske modeller

Statistiske modeller Statistiske modeller Statistisk model Datamatrice Variabelmatrice Hændelse Sandsynligheder Data Statistiske modeller indeholder: Variable Hændelser defineret ved mulige variabel værdier Sandsynligheder

Læs mere

Billedbehandling og mønstergenkendelse: Lidt elementær statistik (version 1)

Billedbehandling og mønstergenkendelse: Lidt elementær statistik (version 1) ; C ED 6 > Billedbehandling og mønstergenkendelse Lidt elementær statistik (version 1) Klaus Hansen 24 september 2003 1 Elementære empiriske mål Hvis vi har observationer kan vi udregne gennemsnit og varians

Læs mere

c) For, er, hvorefter. Forklar.

c) For, er, hvorefter. Forklar. 1 af 13 MATEMATIK B hhx Udskriv siden FACITLISTE TIL KAPITEL 7 ØVELSER ØVELSE 1 c) ØVELSE 2 og. Forklar. c) For, er, hvorefter. Forklar. ØVELSE 3 c) ØVELSE 4 90 % konfidensinterval: 99 % konfidensinterval:

Læs mere

Ovenstående figur viser et (lidt formindsket billede) af 25 svampekolonier på en petriskål i et afgrænset felt på 10x10 cm.

Ovenstående figur viser et (lidt formindsket billede) af 25 svampekolonier på en petriskål i et afgrænset felt på 10x10 cm. Multiple choice opgaver Der gøres opmærksom på, at ideen med opgaverne er, at der er ét og kun ét rigtigt svar på de enkelte spørgsmål. Endvidere er det ikke givet, at alle de anførte alternative svarmuligheder

Læs mere