Opgaver til Kapitel 3

Størrelse: px
Starte visningen fra side:

Download "Opgaver til Kapitel 3"

Transkript

1 Opgaver til Kapitel 3 Hvis en opgave indeholder data, vil et sasprogram, der indlæser data være til rådighed i kataloget statbib/atskurser/stat1/opgaver/kapitel_03 For eksempel vil data til opgave 3.1 være på filen opgave_01a.sas, og et mere omfattende sasprogram vil være på filenopgave_01b.sas. Programmerne vil også være tilgængelige via en internetbrowser på adressen Opgave 3.1 Til kontrol af en løbende produktion af kobbertråd udtages med mellemrum 9 stykker tråd af ens længde. Vægten, angivet i gram, af sådanne 9 stykker findes nedenfor: ) Undersøg, om vægten kan anses for at være normaltfordelt. De følgende spørgsmål besvares under antagelse af normalitet. Standardberegningerne for de 9 observationer giver S = USS = ) Man tilstræber en standardproduktion svarende til en gennemsnitlig vægt på g. Giver målingerne anledning til indgreb i processen? 3) Angiv et 95% konfidensinterval for variansen på målingerne. 4) Kan variansen anses for at være ? Opgave 3.2 Man er interesseret i at sammenligne to metoder til at bestemme indholdet af CaO i klippestykker. Derfor er indholdet af CaO bestemt i ni klippestykker med begge metoder. Metode 1 Metode 2 differens

2 194 OPGAVER 1) Vis, at det kan antages, at differensen mellem bestemmelsen af CaO indholdet med de to metoder på samme klippestykke er normalfordelt. 2) Giver de to metoder samme bestemmelse af CaO indholdet? 3) Angiv et 95% konfidensinterval for differensernes middelværdi. I nedenstående tabel er givet nogle standardberegninger, som eventuelt kan bruges ved besvarelsen af opgaven. n S USS Metode Metode Differens Opgave 3.3 Det påstås ofte, at dobbeltmålinger af en fysisk størrelse udført af samme person viser en tendens til, at det første måleresultat påvirker det andet. For at undersøge dette, delte man på tilfældig måde 20 prøver af et pulver i to grupper på hver 10 prøver. Prøverne indeholdt en smule varierende mængde af et bestemt stof B. En laborant fik udleveret de første 10 prøver og blev bedt om at udføre dobbeltbestemmelser af procentindholdet af B. Resultaterne var: måling pr_1 pr_2 pr_3 pr_4 pr_5 pr_6 pr_7 pr_8 pr_9 pr_ Derefter blev hver prøve i den anden gruppe delt i to lige store portioner og de 20 prøver, der derved fremkom, blev givet til laboranten i tilfældig orden på en sådan måde, at han ikke var i stand til at identificere sammenhørende prøver. Resultaterne var nu: måling pr_1 pr_2 pr_3 pr_4 pr_5 pr_6 pr_7 pr_8 pr_9 pr_ Hvordan belyser disse målinger den anførte påstand? Angiv målemetodens usikkerhed. Opgave 3.4 Lad x 1,...,x n være en observationsrække fra Poissonfordelingen med parameter λ(> 0), det vil sige fra den diskrete fordeling, der har sandsynlighedsfunktionen po(x;λ) = e λ λ x x!, x = 0,1,2,.... 1) Angiv likelihood funktionen, log likelihood funktionen og likelihood ligningen. 2) Vis, at løsningen til likelihood ligningen er: x = 1 n n i=1 og vis, at løsningen maksimerer likelihood funktionen. x i,

3 OPGAVER 195 3) Angiv maksimum likelihood estimatoren for λ, og angiv sandsynligheden for, at maksimum likelihood estimatet eksisterer. 4) Betragt hypotesen H 0 : λ = λ 0 og vis, at likelihood ratio testoreren for H 0 er: Q(x) = (nλ 0 /x ) x exp( nλ 0 + x ). 5) Vis, at Q som funktion af x er strengt voksende for x nλ 0 og strengt aftagende for x nλ 0. 6) Antag, at n = 5,λ 0 = 3, og at x i = 20. Angiv de observationer der er mere eller ligeså kritiske for H 0 som x i = 20, og beregn testssandsynligheden. Opgave 3.5 Lad x være en observation fra en binomialfordeling med sandsynlighedsparameter π ( ]0,1[) og antalsparameter n ( N), det vil sige fra den diskrete fordeling, der har sandsynlighedsfunktionen ( ) n b(x;n,π) = π x (1 π) n x, x {0,1,...,n}. x 1) Angiv likelihood funktionen, log likelihood funktionen og likelihood ligningen. 2) Angiv maksimum likelihood estimatet for π og angiv sandsynligheden for at maksimum likelihood estimatet eksisterer. 3) Betragt hypotesen H 0 : π = π 0 = 1/2 og angiv likelihood ratio testoren for H 0. 4) Antag, at n = 10 og x = 1. Angiv de observationer der er mere end eller ligeså kritiske for H 0 som x = 1, og angiv testsandsynligheden. 5) Betragt dernæst hypotesen H 0 : π = π 0 = 1/4, og antag at n = 10 og x = 1. Angiv de observationer der er mere end eller ligeså kritiske for H 0 som x = 1, og angiv testsandsynligheden. Opgave 3.6 Betragt den kontinuerte fordeling på R 2 med tætheden f(x,y;θ) = 1 1 θ 2π exp(θxy x2 + y 2 ), 2 (x,y) R 2, (3.121) hvor θ er en ukendt parameter i intervallet ( 1,1). Lad (x 1,y 1 ),...,(x n,y n ) betegne realisationer af uafhængige og identisk fordelte stokastiske variable med en fordeling givet ved tætheden i (3.121). 1) Angiv likelihood funktionen, og vis at log likelihood funktionen er l(θ) = nlog(2π)+ n 2 log(1 θ 2 )+θ i y i i=1x 1 2 Vis dernæst, at likelihood ligningen er hvor SP xy = n i=1 x iy i. n θ 1 θ 2 = 1 n SP xy, n i=1x 2 i 1 2 n i=1 y 2 i.

4 196 OPGAVER 2) Vis, at maksimum likelihood estimatet er ˆθ = (SP xy /n) 2. 2SP xy /n 3) Man ønsker at teste hypotesen H 0 : θ = θ 0. Angiv likelihood ratio teststørrelsen Q for H 0. 4) Man interesserer sig nu specielt for θ 0 = 0, det vil sige H 0 : θ = 0. Man tager en stikprøve med n = 25 observationer, hvor SP xy = 11. Find ˆθ og test H 0. Opgave 3.7 Lad x 1,...,x n være en observationsrække fra N(µ,σ 2 ) fordelingen. 1) Vis, at likelihood ratio teststørrelsen Q(x) for hypotesen H 0 : σ 2 = σ 2 0 er hvor Q(x) = r n 2 e n 2 (r 1), r = ˆσ 2 /σ 2 0 = 1 n n i=1 (x i x ) 2 /σ ) Vis, at likelihood ratio testet forkaster for store og små værdier af r. I noterne side 68 baserer vi også testet for H 0 på r og beregner testsandsynligheden som ε(r) = 2F χ 2 ( f)/ f ( n n 1 r) for n n 1 r < χ2 0.5 ( f)/ f 2(1 F χ 2 ( f)/ f ( n 1 n n r)) for (3.122) n 1 r χ2 0.5 ( f)/ f, hvor f = n 1. Dette er ikke testsandsynligheden i likelihood ratio testet. 3) Find testsandsynligheden ved (3.122) og i likelihood ratio testet for H 0, når n = 10 og r = (Vink Q( ) = Q( )) 4) Samme spørgsmål som i 3) for n = 13 og r = 2. (Vink Q(2) = Q( )) Opgave 3.8 Betragt modellen med to uafhængige normalfordelte observationsrækker med samme varians.

5 OPGAVER 197 1) Vis påstandene side 93: Vi skal ikke i detaljer komme ind på, hvordan man finder estimaterne for parametrene, men kun nævne, at maksimum likelihood estimaterne for µ 1 og µ 2 er gennemsnittene i de to observationsrækker, altså henholdsvis x 1 og x 2, mens maksimum likelihood estimatet for σ 2 er.... ˆσ 2 = SSD 1 n = SSD (1) + SSD (2) n 1 + n 2. 2) Vis, at t testet side 94 for H 0µ : µ 1 = µ 2 er ækvivalent med likelihood ratio testet. Opgave 3.9 For at undersøge den atmosfæriske forurening er indholdet af SO 2 (i ppm) i luften bestemt i henholdsvis et kystområde og byområde. Analyser disse data: Kyst: By: Opgave 3.10 Med et halvt års mellemrum blev der foretaget to slamprøver på et rensningsanlæg. Kromindholdet (i mg Cr/kg tørstof) i de to prøver blev bestemt ved en række målinger, som er gengivet nedenfor sammen med antallet af målinger n, summen S og kvadratsummen USS af målingerne. prøve kromindhold (mg Cr/kg tørstof) n S USS I det følgende kan det antages, at for hver af prøverne kan målingerne af kromindholdet betragtes som en normalfordelt observationsrække. 1) Vis, at det kan antages, at variansen af kromindholdet er den samme i de to prøver. 2) Angiv estimat og 95% konfidensinterval for differensen mellem middelværdien af kromindholdet i de to prøver, og undersøg, om det kan antages, at middelværdien er den samme i de to prøver.

6 198 OPGAVER På samme tidpunkt, som den anden prøve blev foretaget, foretog man på et andet rensningsanlæg et række målinger på en slamprøve med følgende resultater (i mg Cr/kg tørstof) ) Undersøg om der er forskel på middelværdien af kromindholdet i de to prøver, der blev foretaget samtidigt på de to rensningsanlæg. Opgave 3.11 Institut for Idræt ved Københavns Universitet arrangerer hvert år et atletikstævne for de 1. års studerende. Atletiklærer Mikkel Sørensen har stillet nogle af resultaterne for årene 1998 og 1999 til rådighed. Det er af interesse at vide om resultaterne for de to år er forskellige eller ej. Resultaterne af pigernes længdespring er vist i tabellen nedenfor. år længde i m Standardberegninger findes i tabellen nedenfor. Analyser data. n S USS Opgave 3.12 Udled likelihood ratio testet for ens varianser i k uafhængige normalfordelte observationsrækker, det vil sige for reduktionen fra modellen til modellen I (3.48) er 2lnQ gengivet. M 0 : X i j N(µ i,σ 2 i ), M 1 : X i j N(µ i,σ 2 ), j = 1,...,n i, i = 1,...,k, j = 1,...,n i, i = 1,...,k Opgave 3.13 Vis, at F-testet side 153 for hypotesen H 02 : µ i = α + βt i i modellen M 1 : X i j N(µ i,σ 2 ) er ækvivalent med likelihood ratio testet. Opgave 3.14 Vis, at t-testet baseret på teststørrelsen t(x) = ˆβ β 0 s 2 02 /SSD t for hypotesen H 03 : β = β 0 i modellen M 2 : X i N(α + βt i,σ 2 ) er ækvivalent med likelihood ratio testet.

7 OPGAVER 199 Opgave 3.15 (Prediktionsintervaller) Når vi ud fra nogle data og en model for de pågældende data forsøger at udtale os om værdien af en ny observation kalder vi det prediktion. Vi forsøger ikke at angive en enkelt værdi, men derimod et interval, hvor observationen vil falde med en specificeret sandsynlighed, for eksempel et 95% prediktionsinterval. Betragt en normalfordelt observationsrække, X i N(µ,σ 2 ), i = 1,...,n, og lad Y betegne en stokastisk variabel, som er uafhængig af X 1,...,X n og N(µ,σ 2 ) fordelt. 1) Vis, at og dermed at uligheden Y X s(x) t(n 1), 1+1/n X t 1 α/2 (n 1)s(X) 1+1/n < Y < X +t 1 α/2 (n 1)s(X) 1+1/n (3.123) holder med sandsynlighed 1 α. Intervallet (3.123) med de observerede værdier fra stikprøven indsat er et 1 α prediktionsinterval. 2) Overvej hvilken betydning størrelsen n af den stikprøve, som bruges til estimation af modellens parametre har, og sammenlign med konfidensintervallet for middelværdien. 3) Betragt en lineær regressionsmodel som i Afsnit 3.3 og angiv et 1 α prediktionsinterval for en ny uafhængig observation med værdien t af den forklarende variabel. Opgave 3.16 (Middelværdi og varians af lineær transformation af vektor af stokastiske variable) Lad X = (X 1,...,X n ) være en n-dimensional søjlevektor af stokastiske variable. Vi vil benytte notationen X (µ,σ) (3.124) til at angive, at EX = µ og at Var X = Σ. Her er µ = (EX 1,...,EX n ) og Cov(X 1,X 1 ) Cov(X 1,X n ) Var X = Σ =... Cov(X n,x 1 ) Cov(X n,x n ) 1) Vis, at ξ + BX (ξ + Bµ,BΣB ), hvor ξ er en k-dimensional vektor og B er en k n matriks.

8 200 OPGAVER Opgave 3.17 (Multipel regression) Lad de stokastiske variable X i,i = 1,...,n, være indbyrdes uafhængige med fordeling: X i N(t i β,σ 2 ), hvor t i er en søjlevektor af k forklarende variable, og β er en søjlevektor af k ukendte parametre. Lad T være n k matricen, hvor i te række er t i t 1. T = t ị, og antag yderligere, at k < n og at T har fuld rang k. Man skriver kort modellen: t n X N(T β,σ 2 I n ), hvor notationen fra forrige opgave er suppleret med et N til at vise, at koordinaterne i X er normalfordelt. I det følgende betegner x den observerede værdi af den stokastiske vektor X. 1) Opskriv likelihood funktionen for modellen og vis, at likelihood ligningen for β er T T β = T x og at løsningen er ˆβ = (T T) 1 T x. 2) Vis, at den anden afledede af log likelihood funktionen med hensyn til β er T T 1 σ 2, som er negativ definit, så løsningen til likelihood ligningen er et maksimumspunkt for likelihood funktionen. 3) Bemærk, at vektoren af estimerede middelværdier (også kaldet predikterede værdier) er og at ˆx = T(T T) 1 T x ˆx N(T β,σ 2 T(T T) 1 T ) Matricen H = T(T T) 1 T kaldes hat matricen, fordi den sætter hat på x. Bemærk, at H er den ortogonale projektion på underrummet, som udspændes af søjlerne i T. 4) Vis, at maksimum likelihood estimatet for σ 2 er ˆσ 2 = 1 n x (I n T(T T) 1 T )x.

9 OPGAVER 201 5) Vis, at vektoren af residualer er r = x T ˆβ = (I n T(T T) 1 T )x, og at r N(0,σ 2 (I n T(T T) 1 T )). 6) Vis, at fordelingen for maksimum likelihood estimatet for β er ˆβ N(β,σ 2 (T T) 1 ). Opgave 3.18 (Konkrete eksempler på formulering af model som multipel regression.) Alle de modeller for normalfordelte data vi hidtil har betragtet kan skrives på formen fra Opgave ) Én observationsrække. Angiv T og fordelingen for residualer og ˆβ. Bemærk, at residualerne ikke er uafhængige. 2) k observationsrækker. Angiv T og fordelingen for residualer og ˆβ. Bemærk, at når der er forskelligt antal observationer i hver observationsrække, er residualerne ikke identisk fordelt. 3) Lineær regression. Angiv T og fordelingen for residualer og ˆβ. (I denne formulering indeholder β både afskæringen α og hældningskoefficienten, som vi tidligere har kaldt β.) Opgave 3.19 Data i opgaven stammer fra J.D. Forbes (1857). Further experiments and remarks on the measurement of heights by the boiling point water. Transactions of the Royal Society of Edinburgh, 21, , men vi benytter kun et udpluk på 31 observationer, som blev præsenteret i S. Weisberg (1985). Applied regression Analysis, 2. udgave, John Wiley and Sons. Data består af 31 sammenhørende værdier af atmosfærisk tryk og vands kogepunkt målt i Himalaya. Vi skal opfatte vands kogepunkt som forklarende variabel og trykket som respons. Data og et SAS program, der indlæser data, ligger på adressen sas Et SAS program, der laver relevante tegninger og beregninger ligger på adressen sas Beregninger og tegninger til denne opgave er så omfattende, at det kun er realistisk at løse den ved hjælp af SAS. 1) Tegn tryk op mod temperatur. 2) Afhænger trykket lineært af temperaturen?

10 202 OPGAVER 3) Er en kvadratisk sammenhæng bedre? 4) Lav en tegning af data og middelværdi i den valgte model, hvor også 95% konfidensinterval for middelværdien er angivet. 5) Lav en tegning af data og middelværdi i den valgte model, hvor også 95% prediktionsinterval for en ny observation er angivet. Opgave 3.20 Data i denne opgave stammer fra en større undersøgelse af caries hos skolebørn og angiver fordelingen af antal DMF-tænder (tænder med huller efter caries samt udtrukne og plomberede tænder) blandt 12-årige drenge fra 4 forskellige vandværksdistrikter. Samtidig med indsamlingen af disse data undersøgte man fluorindholdet i vandet fra de fire vandværker. De gennemsnitlige fluorionkoncentrationer er gengivet i sidste række i Tabel 3.13 som ppm F (mg fluorion pr. kg.). Tabellen viser fordelingen af antal DMF-tænder og kvadratroden af antal DMF-tænder blandt 12-årige drenge i fire vandværksdistrikter. Fluorindholdet i vandet fra de fire vandværker er ligeledes angivet. I tabellen er observationerne sorteret efter størrelse. Man har for eksempel i Vejen fundet 3 12-årige drenge, som havde 4 DMF-tænder, 4 drenge, som havde 6 DMF-tænder, og således videre. Formålet med undersøgelsen er at belyse, om drikkevandets fluorindhold påvirker antallet af DMF-tænder. Teoretiske overvejelser antyder, at man kan forvente, at kvadratroden af antal DMF-tænder er normalfordelt. 1) Undersøg ved hjælp af fraktildiagrammer, om kvadratroden af antal DMF-tænder hos 12-årige drenge i de fire vandværksdistrikter kan anses for at være normalfordelt. På baggrund af undersøgelsen i 1) kan man ikke afvise, at man kan anse kvadratroden af antal DMF-tænder for at være normalfordelt. I resten af opgaven skal man derfor analysere kvadratroden af antallet af DMF-tænder. I tabeller i slutningen af opgaven er angivet nogle beregnede størrelser, som kan benyttes ved besvarelsen. 2) Undersøg, om variansen på kvadratroden af antallet af DMF-tænder kan anses for at være den samme for de fire vandværksdistrikter. 3) Undersøg, om kvadratroden af antallet af DMF-tænder afhænger lineært af fluorindholdet i drikkevandet. 4) Undersøg, om kvadratroden af antal DMF-tænder er uafhængig af fluorindholdet i drikkevandet. Antal observationer, summer og kvadratsummer for kvadratroden af antal DMF-tænder for de fire vandværksdistrikter er givet i nedenstående tabel. i n S USS Sum

11 OPGAVER 203 Antal Kvadratroden Vejen Slagelse Næstved Næstved DMF- tænder af antal hjælpe- gamle DMF- tænder vandværk vandværk Fluorindholdet i drikkevandet ppm F Tabel 3.13 DMF-tænder hos 12 årige drenge i fire vandværksdistrikter. Standardberegninger til brug for regressionsanalyse er gengivet i nedenstående tabel. Kvadratroden af Fluorindholdet antal DMF-tænder i drikkevandet x t n 246 S U SS SP Opgave 3.21 Data til denne opgave stammer fra det et studie af Nobilis frøhvepsen, som er udført af Trine Iversen. Nobilis frøhvepsen er en knap én centimeter lang hveps, som om foråret lægger æg i Nobilis granens frø. Hver kogle indeholder frø, og i hvert frø kan der kun ligge ét æg. Ægget

12 204 OPGAVER udvikles til larve og larven æder alt, hvad der er i frøet. Larven bliver i frøet til om efteråret, hvor den udvikles til en voksen hveps, der klækker fra frøet. Et forår er et antal kogler indsamlet. For at få et skøn over, hvor mange af frøene, der indeholder en larve, tages et røngtenbillede af 100 frø fra hver kogle, og antallet af frø med larver tælles. Dette tal divideret med 100 kaldes infektionshyppigheden, p in f, af koglen. På baggrund af teoretiske overvejelser vil man forvente, at den transformerede infektionshyppighed x in f = sin 1 ( p in f ) er approksimativt normalfordelt med konstant varians. Det vil blive delvist kontrolleret i løbet af opgaven. Et af formålene med studiet var at undersøge, om der var sammenhæng mellem fysiske kendetegn ved koglerne og infektionshyppigheden. Vi skal her kun se på diameteren, som blev målt i millimeter med en nøjagtighed på 5 mm. På grund af den dårlige målenøjagtighed blev der kun målt fire forskellige diametre: 40 mm, 45 mm, 50 mm og 55 mm. 1) På baggrund af ovenstående spørgsmål, skal man opstille og kontrollere en model, som kan bruges til at besvare de følgende spørgsmål. I slutningen af opgaven er angivet nogle beregnede størrelser som kan benyttes til besvarelse af opgaven. 2) Vis, at det kan antages, at variansen på x in f ikke afhænger af diameteren. 3) Undersøg, om det kan antages, at middelværdien af x in f afhænger lineært af diameteren. 4) Angiv estimater og konfidensintervaller i slutmodellen. Diameter Antal observationer SSD (i) f (i) Variansskøn Ialt x in f Diameter S U SS SP Opgave 3.22 Data til denne opgave er en del af en større undersøgelse af forekomsten af svampe i hedejord, og specielt en gruppe, der vokser i tilknytning til lyngrødderne og benævnes Mykorrhiza.

13 OPGAVER 205 På et hedeareal vælges 5 punkter tilfældigt og en jordcylinder udtages med et jordbor. Rødderne udvaskes og svampe i rødderne kvantificeres i mikroskop og procentdelen af rodceller med svampe gøres op. For at undersøge en eventuel årstidsvariation er denne høst af rødder gentaget fire gange på et år. Høst 1 er udtaget i oktober 1992, høst 2 i februar 1993, høst 3 i maj 1993 og høst 4 i august Hedejorden består af to karakteristiske jordlag, mor og blegsand. Hele proceduren er udført to gange, så rødder er høstet både i morlaget og i blegsandslaget. I Tabel 3.14 er gengivet data fra morlaget og i Tabel 3.15 er gengivet data fra blegsandslaget. Mykorrhiza procent i morlaget Høst 1 Høst 2 Høst 3 Høst Tabel 3.14 Data fra morlaget. Mykorrhiza procent i blegsandslaget Høst 1 Høst 2 Høst 3 Høst Tabel 3.15 Data fra blegsandslaget. Nærmere undersøgelser viser, at det kan antages, at Mykorrhiza procenterne fra samme høsttidspunkt og samme jordlag er uafhængige observationer fra samme normalfordeling. I beregningerne må benyttes resultaterne af beregningsskemaerne, som er gengivet sidst i opgaven. I første omgang betragtes kun data fra morlaget og dermed kun beregningsskemaet i Tabel ) Vis, at det kan antages, at variansen på Mykorrhiza procenten ikke afhænger af høsttidspunktet. 2) Vis, at det kan antages, at middelværdien af Mykorrhiza procenten ikke afhænger af høsttidspunktet. En tilsvarende analyse for blegsandslaget leder frem til den samme model, nemlig at variansen på Mykorrhiza procenten ikke afhænger af høsttidspunktet, og at middelværdien af Mykorrhiza procenten ikke afhænger af høsttidspunktet.

14 206 OPGAVER Responsvariabel: Mykorrhiza procent Gruppevariabel: TID Beregningsskema: Estimeret Gennemi ni Si USSi Si2/ni SSDi fi varians snit ==================== Tabel 3.16 Standardberegninger for morlaget. Responsvariabel: Mykorrhiza procent Gruppevariabel: TID Beregningsskema: Estimeret Gennemi ni Si USSi Si2/ni SSDi fi varians snit =================== Tabel 3.17 Standardberegninger for blegsandslaget. 3) Undersøg, om variansen er den samme for Mykorrhiza procenten i morlaget og i blegsandslaget. 4) Undersøg, om middelværdien af Mykorrhiza procenten er den samme i morlaget og i blegsandslaget. Opgave 3.23 I en række tilfælde finder vi likelihood ligningen og angiver en løsning, som vi postulerer maksimerer likelihood funktionen. Det kræver dog altid en overvejelse, og i mange modeller er det langt fra trivielt at vise, at løsninger til likelihood ligningen er maksimum likelihood estimater. 1) Én normalfordelt observationsrække med kendt varians. Vis, at log likelihood funktionen (3.25) side 82 antager sit globale maksimum for µ = x. 2) Én normalfordelt observationsrække. Vis, at (µ,σ 2 ) = ( x, ˆσ 2 ), som er angivet side 83, er et punkt hvor log likelihood funktionen (3.26) antager sit globale maksimum.

15 OPGAVER 207 3) Lineær regression. Vis, at løsningerne, ( ˆα, ˆβ), til likelihood ligningerne (3.55) side 140 er et punkt, hvor likelihood funktionen (3.54) antager sit globale maksimum. (Vink: Det er en fordel at omparametrisere til parametrene (µ,β), hvor µ = α + β t.) Opgave 3.24 Antag, at X er en kontinuert stokastisk variabel (k = 1) med tæthedsfunktion og lad Y = h(x), hvor h er en (strengt) monoton og differentiabel reel funktion. Vis, at tæthedsfunktionen for Y er: Opgave 3.25 Vis følgende resultater: f Y (y) = h (h 1 (y)) 1 f X (h 1 (y)), y supp f Y. (3.125) 1) Vis, at funktionen γ( ; α, λ) i (3.92) er en tæthedsfunktion for α > 0 og λ > 0, og endvidere at funktionen er strengt aftagende for α 1, mens den er unimodal for α > 1 med maksimum i x = (α 1)/λ. 2) 3) 4) 5) X Γ(α,λ) og c > 0 cx Γ(α,λ/c) (3.126) X 1 Γ(α 1,λ) X 2 Γ(α 2,λ) X 1 + X 2 Γ(α 1 + α 2,λ) (3.127) X Γ(α,λ) EX = α/λ og VarX = α/λ 2 (3.128) σ 2 χ 2 ( f) = Γ( f/2,1/(2σ 2 )) og σ 2 χ 2 ( f)/ f = Γ( f/2, f/(2σ 2 )) 6) χ 2 (2) er eksponentialfordelingen med middelværdi 2. Opgave 3.26 Vis formel (3.98), det vil sige U N(0,1) U 2 χ 2 (1). Opgave 3.27 Udled tætheden for t-fordelingen med f frihedsgrader. Opgave 3.28 Udled tætheden for F-fordelingen med ( f 1, f 2 ) frihedsgrader. Opgave 3.29 Vis formel (3.115) (eller (3.116)). Opgave 3.30 Udled tætheden for fordelingen B(α 1,α 2 ).

Forelæsning 8: Inferens for varianser (kap 9)

Forelæsning 8: Inferens for varianser (kap 9) Kursus 02402 Introduktion til Statistik Forelæsning 8: Inferens for varianser (kap 9) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby

Læs mere

Modul 5: Test for én stikprøve

Modul 5: Test for én stikprøve Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 5: Test for én stikprøve 5.1 Test for middelværdi................................. 1 5.1.1 t-fordelingen.................................

Læs mere

Hypotese test. Repetition fra sidst Hypoteser Test af middelværdi Test af andel Test af varians Type 1 og type 2 fejl Signifikansniveau

Hypotese test. Repetition fra sidst Hypoteser Test af middelværdi Test af andel Test af varians Type 1 og type 2 fejl Signifikansniveau ypotese test Repetition fra sidst ypoteser Test af middelværdi Test af andel Test af varians Type 1 og type fejl Signifikansniveau Konfidens intervaller Et konfidens interval er et interval, der estimerer

Læs mere

Statistik og Sandsynlighedsregning 2

Statistik og Sandsynlighedsregning 2 Statistik og Sandsynlighedsregning 2 Den flerdimensionale normalfordeling, fordeling af ( X,SSD) Helle Sørensen Uge 9, mandag SaSt2 (Uge 9, mandag) Flerdim. N, ford. af ( X,SSD) 1 / 16 Program Resultaterne

Læs mere

Konfidensinterval for µ (σ kendt)

Konfidensinterval for µ (σ kendt) Program 1. Repetition: konfidens-intervaller. 2. Hypotese test 3. Type I og type II fejl, p-værdi 4. En og to-sidede tests 5. Test for middelværdi (kendt varians) 6. Test for middelværdi (ukendt varians)

Læs mere

Dagens Temaer. Test for lineær regression. Test for lineær regression - via proc glm. k normalfordelte obs. rækker i proc glm. p. 1/??

Dagens Temaer. Test for lineær regression. Test for lineær regression - via proc glm. k normalfordelte obs. rækker i proc glm. p. 1/?? Dagens Temaer k normalfordelte obs. rækker i proc glm. Test for lineær regression Test for lineær regression - via proc glm p. 1/?? Proc glm Vi indlæser data i datasættet stress, der har to variable: areal,

Læs mere

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Normalfordelingen. Statistik og Sandsynlighedsregning 2 Normalfordelingen Statistik og Sandsynlighedsregning 2 Repetition og eksamen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange variable, blandt andet tilfældige fejl på

Læs mere

Modul 7: Eksempler. 7.1 Beskrivende dataanalyse. 7.1.1 Diagrammer. Bent Jørgensen. Forskningsenheden for Statistik ST501: Science Statistik

Modul 7: Eksempler. 7.1 Beskrivende dataanalyse. 7.1.1 Diagrammer. Bent Jørgensen. Forskningsenheden for Statistik ST501: Science Statistik Forskningsenheden for Statistik ST501: Science Statistik Bent Jørgensen Modul 7: Eksempler 7.1 Beskrivende dataanalyse............................... 1 7.1.1 Diagrammer.................................

Læs mere

Note til styrkefunktionen

Note til styrkefunktionen Teoretisk Statistik. årsprøve Note til styrkefunktionen Først er det vigtigt at gøre sig klart, at når man laver statistiske test, så kan man begå to forskellige typer af fejl: Type fejl: At forkaste H

Læs mere

Program. 1. Repetition: konfidens-intervaller. 2. Hypotese test, type I og type II fejl, signifikansniveau, styrke, en- og to-sidede test.

Program. 1. Repetition: konfidens-intervaller. 2. Hypotese test, type I og type II fejl, signifikansniveau, styrke, en- og to-sidede test. Program 1. Repetition: konfidens-intervaller. 2. Hypotese test, type I og type II fejl, signifikansniveau, styrke, en- og to-sidede test. 1/19 Konfidensinterval for µ (σ kendt) Estimat ˆµ = X bedste bud

Læs mere

Module 12: Mere om variansanalyse

Module 12: Mere om variansanalyse Mathematical Statistics ST06: Linear Models Bent Jørgensen og Pia Larsen Module 2: Mere om variansanalyse 2. Parreded observationer................................ 2.2 Faktor med 2 niveauer (0- variabel)........................

Læs mere

Vi kalder nu antal prøverør blandt de 20, hvor der ikke ses vækst for X.

Vi kalder nu antal prøverør blandt de 20, hvor der ikke ses vækst for X. Opgave I I en undersøgelse af et potentielt antibiotikum har man dyrket en kultur af en bestemt mikroorganisme og tilført prøver af organismen til 20 prøverør med et vækstmedium og samtidig har man tilført

Læs mere

Multipel Lineær Regression. Polynomiel regression Ikke-lineære modeller og transformation Multi-kolinearitet Auto-korrelation og Durbin-Watson test

Multipel Lineær Regression. Polynomiel regression Ikke-lineære modeller og transformation Multi-kolinearitet Auto-korrelation og Durbin-Watson test Multipel Lineær Regression Polynomiel regression Ikke-lineære modeller og transformation Multi-kolinearitet Auto-korrelation og Durbin-Watson test Multipel lineær regression x,x,,x k uafhængige variable

Læs mere

Kvantitative Metoder 1 - Forår 2007

Kvantitative Metoder 1 - Forår 2007 Dagens program Afsnit 3.3-3.5 Varians Eksempel: Forventet nytte Kovarians og korrelation Middelværdi og varians af summer af stokastiske variabler Eksempel: Porteføljevalg 1 Beskrivelse af fordelinger

Læs mere

Kursus 02402 Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff

Kursus 02402 Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks

Læs mere

En Introduktion til SAS. Kapitel 6.

En Introduktion til SAS. Kapitel 6. En Introduktion til SAS. Kapitel 6. Inge Henningsen Afdeling for Statistik og Operationsanalyse Københavns Universitet Marts 2005 6. udgave Kapitel 6 Regressionsanalyse i SAS 6.1 Indledning Dette kapitel

Læs mere

da er X 1 + X 2 N(µ 1 + µ 2,σ1 2 + σ2) Hvis X 1,...,X n er uafhængige og X r N(µ,σ 2 ), da er X = 1 n (X 1 +... + X n ) N(µ, σ2

da er X 1 + X 2 N(µ 1 + µ 2,σ1 2 + σ2) Hvis X 1,...,X n er uafhængige og X r N(µ,σ 2 ), da er X = 1 n (X 1 +... + X n ) N(µ, σ2 Statistik og Sandsynlighedsregning IH kapitel Overheads til forelæsninger, onsdag 5. uge Resultater om normalfordeling X N(µ,σ ). N har tæthed ϕ µ,σ (x) = exp (x µ) πσ σ EX = µ, Var(X) = σ X µ N(0,) σ

Læs mere

Module 2: Beskrivende Statistik

Module 2: Beskrivende Statistik Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen og Hans Chr. Petersen Module 2: Beskrivende Statistik 2.1 Histogrammer og søjlediagrammer......................... 1 2.2 Sammenfatning

Læs mere

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220

Læs mere

a) Har måleresultaterne for de 2 laboranter samme varians? b) Tyder resultaterne på, at nogen af laboranterne måler med en systematisk fejl?

a) Har måleresultaterne for de 2 laboranter samme varians? b) Tyder resultaterne på, at nogen af laboranterne måler med en systematisk fejl? Module 6: Exercises 6.1 To laboranter....................... 2 6.2 Nicotamid i piller..................... 3 6.3 Karakterer......................... 5 6.4 Blodtryk hos kvinder................... 6 6.5

Læs mere

PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006

PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006 PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006 I dag: To stikprøver fra en normalfordeling, ikke-parametriske metoder og beregning af stikprøvestørrelse Eksempel: Fiskeolie

Læs mere

Kapitel 3 Centraltendens og spredning

Kapitel 3 Centraltendens og spredning Kapitel 3 Centraltendens og spredning Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 Indledning 2 Centraltendens 3 Spredning 4 Praktisk beregning 5 Fraktiler 6 Opsamling 1 Indledning

Læs mere

Modul 3: Kontinuerte stokastiske variable

Modul 3: Kontinuerte stokastiske variable Forskningsenheden for Statistik ST501: Science Statistik Bent Jørgensen Modul 3: Kontinuerte stokastiske variable 3.1 Kontinuerte stokastiske variable........................... 1 3.1.1 Tæthedsfunktion...............................

Læs mere

Uge 48 II Teoretisk Statistik 27. november 2003. Numerisk modelkontrol af diskrete fordelinger: intro

Uge 48 II Teoretisk Statistik 27. november 2003. Numerisk modelkontrol af diskrete fordelinger: intro Uge 48 II Teoretisk Statistik 7. november 003 Numerisk modelkontrol af diskrete fordelinger: intro Eksempel: kvalitetskontrol Goodness-of-fit test: generel teori Endeligt udfaldsrum Udfaldsrum uden øvre

Læs mere

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1 Matematisk Modellering 1 Side 1 I nærværende opgavesæt er der 16 spørgsmål fordelt på 4 opgaver. Ved bedømmelsen af besvarelsen vægtes alle spørgsmål lige. Endvidere lægges der vægt på, at det af besvarelsen

Læs mere

Funktionalligninger - løsningsstrategier og opgaver

Funktionalligninger - løsningsstrategier og opgaver Funktionalligninger - løsningsstrategier og opgaver Altså er f (f (1)) = 1. På den måde fortsætter vi med at samle oplysninger om f og kombinerer dem også med tidligere oplysninger. Hvis vi indsætter =

Læs mere

Basal statistik for sundhedsvidenskabelige forskere, forår 2015 Udleveret 3. marts, afleveres senest ved øvelserne i uge 13 (24.-25.

Basal statistik for sundhedsvidenskabelige forskere, forår 2015 Udleveret 3. marts, afleveres senest ved øvelserne i uge 13 (24.-25. Hjemmeopgave Basal statistik for sundhedsvidenskabelige forskere, forår 2015 Udleveret 3. marts, afleveres senest ved øvelserne i uge 13 (24.-25. marts) En stikprøve bestående af 65 mænd og 65 kvinder

Læs mere

Chi-i-anden Test. Repetition Goodness of Fit Uafhængighed i Kontingenstabeller

Chi-i-anden Test. Repetition Goodness of Fit Uafhængighed i Kontingenstabeller Chi-i-anden Test Repetition Goodness of Fit Uafhængighed i Kontingenstabeller Chi-i-anden Test Chi-i-anden test omhandler data, der har form af antal eller frekvenser. Antag, at n observationer kan inddeles

Læs mere

Økonometri 1. Inferens i den lineære regressionsmodel 25. september 2006. Oversigt: De næste forelæsninger

Økonometri 1. Inferens i den lineære regressionsmodel 25. september 2006. Oversigt: De næste forelæsninger Oversigt: De næste forelæsninger Økonometri Inferens i den lineære regressionsmodel 5. september 006 Statistisk inferens: hvorledes man med udgangspunkt i en statistisk model kan drage konklusioner på

Læs mere

Program. Simpel og multipel lineær regression. I tirsdags: model og estimation. I tirsdags: Prædikterede værdier og residualer

Program. Simpel og multipel lineær regression. I tirsdags: model og estimation. I tirsdags: Prædikterede værdier og residualer Program Simpel og multipel lineær regression Helle Sørensen E-mail: helle@math.ku.dk Simpel LR: repetition, konfidensintervaller, test, prædiktionsintervaller, mm. Multipel LR: estimation, valg af model,

Læs mere

Program. Ensidet variansanalyse Sammenligning af grupper. Statistisk model og hypotese. Eksempel: Aldersfordeling i hjertestudie

Program. Ensidet variansanalyse Sammenligning af grupper. Statistisk model og hypotese. Eksempel: Aldersfordeling i hjertestudie Program Ensidet variansanalyse Sammenligning af grupper Helle Sørensen E-mail: helle@math.ku.dk I dag: Sammenligning af middelværdier Sammenligning af spredninger Parvise sammenligninger To eksempler:

Læs mere

Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher

Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk

Læs mere

Variabel- sammenhænge

Variabel- sammenhænge Variabel- sammenhænge Udgave 2 2009 Karsten Juul Dette hæfte kan bruges som start på undervisningen i variabelsammenhænge for stx og hf. Hæftet er en introduktion til at kunne behandle to sammenhængende

Læs mere

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. Tema Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. (Fx. x. µ) Hypotese og test. Teststørrelse. (Fx. H 0 : µ = µ 0 ) konfidensintervaller

Læs mere

Oversigt. Course 02402/02323 Introducerende Statistik. Forelæsning 3: Kontinuerte fordelinger. Per Bruun Brockhoff

Oversigt. Course 02402/02323 Introducerende Statistik. Forelæsning 3: Kontinuerte fordelinger. Per Bruun Brockhoff Course 242/2323 Introducerende Statistik Forelæsning 3: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 22 Danmarks Tekniske Universitet 28 Lyngby Danmark

Læs mere

Ensidet variansanalyse

Ensidet variansanalyse Ensidet variansanalyse Sammenligning af grupper Helle Sørensen E-mail: helle@math.ku.dk StatBK (Uge 47, mandag) Ensidet ANOVA 1 / 18 Program I dag: Sammenligning af middelværdier Sammenligning af spredninger

Læs mere

02402 Løsning til testquiz02402f (Test VI)

02402 Løsning til testquiz02402f (Test VI) 02402 Løsning til testquiz02402f (Test VI) Spørgsmål 4. En ejendomsmægler ønsker at undersøge om hans kunder får mindre end hvad de har forlangt, når de sælger deres bolig. Han har regisreret følgende:

Læs mere

Statistik og Sandsynlighedsregning 2

Statistik og Sandsynlighedsregning 2 Statistik og Sandsynlighedsregning 2 Transformation af kontinuerte fordelinger på R, flerdimensionale kontinuerte fordelinger, mere om normalfordelingen Helle Sørensen Uge 7, onsdag SaSt2 (Uge 7, onsdag)

Læs mere

Matematik B. Højere handelseksamen

Matematik B. Højere handelseksamen Matematik B Højere handelseksamen hh121-mat/b-04062012 Mandag den 4. juni 2012 kl. 9.00-13.00 Prøven består af to delprøver. Delprøven uden hjælpemidler består af opgave 1 til 5 med i alt 5 spørgsmål.

Læs mere

Dagens Emner. Likelihood teori. Lineær regression (intro) p. 1/22

Dagens Emner. Likelihood teori. Lineær regression (intro) p. 1/22 Dagens Emner Likelihood teori Lineær regression (intro) p. 1/22 Likelihood-metoden M : X i N(µ,σ 2 ) hvor µ og σ 2 er ukendte Vi har, at L(µ,σ 2 ) = ( 1 2πσ 2)n/2 e 1 2σ 2 P n (x i µ) 2 er tætheden som

Læs mere

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6 Institut for Matematiske Fag Matematisk Modellering 1 Aarhus Universitet Eva B. Vedel Jensen 25. februar 2008 UGESEDDEL 6 Forelæsningerne torsdag den 21. februar og tirsdag den 26. februar. Jeg har gennemgået

Læs mere

Dagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at

Dagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at Likelihood teori Lineær regression (intro) Dagens Emner Likelihood-metoden M : X i N(µ,σ 2 ) hvor µ og σ 2 er ukendte Vi har, at L(µ,σ 2 1 ) = ( 2πσ 2)n/2 e 1 2 P n (xi µ)2 er tætheden som funktion af

Læs mere

Trivsel og fravær i folkeskolen

Trivsel og fravær i folkeskolen Trivsel og fravær i folkeskolen Sammenfatning De årlige trivselsmålinger i folkeskolen måler elevernes trivsel på fire forskellige områder: faglig trivsel, social trivsel, støtte og inspiration og ro og

Læs mere

Reminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model

Reminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model Reminder: Hypotesetest for én parameter Antag vi har model Økonometri: Lektion 4 F -test Justeret R 2 Aymptotiske resultater y = β 0 + β 1 x 2 + β 2 x 2 + + β k x k + u. Vi ønsker at teste hypotesen H

Læs mere

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved Matematisk Modellering 1 (reeksamen) Side 1 Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved { 1 hvis x {1, 2, 3}, p X (x) = 3 0 ellers,

Læs mere

En oversigt over udvalgte kontinuerte sandsynlighedsfordelinger

En oversigt over udvalgte kontinuerte sandsynlighedsfordelinger Institut for Økonomi Aarhus Universitet Statistik 1, Forår 2001 Allan Würtz 4. April, 2001 En oversigt over udvalgte kontinuerte sandsynlighedsfordelinger Uniform fordeling Benyttes som model for situationer,

Læs mere

Tema. Dagens tema: Indfør centrale statistiske begreber.

Tema. Dagens tema: Indfør centrale statistiske begreber. Tema Dagens tema: Indfør centrale statistiske begreber. Model og modelkontrol Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. konfidensintervaller Vi tager udgangspunkt i Ex. 3.1 i

Læs mere

Økonometri 1. Interne evalueringer af forelæsninger. Kvalitative variabler. Dagens program. Dummyvariabler 21. oktober 2004

Økonometri 1. Interne evalueringer af forelæsninger. Kvalitative variabler. Dagens program. Dummyvariabler 21. oktober 2004 Dagens program Økonometri 1 Dummyvariabler 21. oktober 2004 Emnet for denne forelæsning er kvalitative egenskaber i den multiple regressionsmodel (Wooldridge kap. 7.1-7.6) Kvalitative variabler generelt

Læs mere

Signifikanstestet. usædvanlig godt godt

Signifikanstestet. usædvanlig godt godt Signifikanstestet Fordeling af rygevaner som 45-årig og senere selvrapporteret helbred som 51-årig blandt tilfældigt udvalgte mænd i Københavns Amt i 1987. helbred som 51 årig rygevaner som 45 årig Total

Læs mere

Hvad skal vi lave i dag?

Hvad skal vi lave i dag? p. 1/2 Hvad skal vi lave i dag? Eksempler på stokastiske variable. Ventetid på krone ved møntkast. Antal plat ved n kast. Antal radioaktive henfald. Ventetiden på en flyulykke. Udtrækning af tal i et interval.

Læs mere

Om hvordan Google ordner websider

Om hvordan Google ordner websider Om hvordan Google ordner websider Hans Anton Salomonsen March 14, 2008 Man oplever ofte at man efter at have givet Google et par søgeord lynhurtigt får oplysning om at der er fundet et stort antal - måske

Læs mere

Nanostatistik: Middelværdi og varians

Nanostatistik: Middelværdi og varians Nanostatistik: Middelværdi og varians JLJ Nanostatistik: Middelværdi og varians p. 1/28 Repetition Stokastisk variabel: funktion fra udfaldsrum over i de hele tal eller over i de reelle tal Ex: Ω = alle

Læs mere

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET. NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET. Eksamen i Statistik 1 Tag-hjem prøve 1. juli 2010 24 timer Alle hjælpemidler er tilladt. Det er tilladt at skrive med blyant og benytte viskelæder,

Læs mere

Forslag til løsning af Opgaver til ligningsløsning (side172)

Forslag til løsning af Opgaver til ligningsløsning (side172) Forslag til løsning af Opgaver til ligningsløsning (side17) Opgave 1 Hvis sønnens alder er x år, så er faderens alder x år. Der går x år, før sønnen når op på x år. Om x år har faderen en alder på: x x

Læs mere

Løsning af præmie- og ekstraopgave

Løsning af præmie- og ekstraopgave 52 Læserbidrag Løsning af præmie- og ekstraopgave 23. årgang, nr. 1 Martin Wedel Jacobsen Både præmieopgaven og ekstraopgaven er specialtilfælde af en mere generel opgave: Hvor mange stykker kan en n-dimensionel

Læs mere

Produkt og marked - matematiske og statistiske metoder

Produkt og marked - matematiske og statistiske metoder Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 19, 2016 1/26 Kursusindhold: Sandsynlighedsregning og lagerstyring

Læs mere

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte

Læs mere

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET. NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET. Eksamen i Statistik 1TS Teoretisk statistik Den skriftlige prøve Sommer 2003 3 timer - alle hjælpemidler tilladt Det er tilladt at skrive

Læs mere

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte

Læs mere

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i.

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i. Repetition af vektor-regning Økonometri: Lektion 3 Matrix-formulering Fordelingsantagelse Hypotesetest Antag vi har to n-dimensionelle (søjle)vektorer a 1 b 1 a 2 a =. og b = b 2. a n b n Tænk på a og

Læs mere

LinAlg Skriftlig prøve 20. januar 2009, 9 12 Vejledende besvarelse

LinAlg Skriftlig prøve 20. januar 2009, 9 12 Vejledende besvarelse LinAlg Skriftlig prøve. januar 9, 9 Vejledende besvarelse Dette eksamenssæt løber over 5 sider, denne side inklusive. Sættet stilles til løsning over 3 timer med alle sædvanlige hjælpemidler, bortset fra

Læs mere

Matematik A. Studentereksamen. Digital eksamensopgave med adgang til internettet

Matematik A. Studentereksamen. Digital eksamensopgave med adgang til internettet Matematik A Studentereksamen Digital eksamensopgave med adgang til internettet 1stx131-MATn/A-405013 Fredag den 4. maj 013 kl. 09.00-14.00 Opgavesættet er delt i to dele. Delprøve 1: timer med autoriseret

Læs mere

Ligninger med reelle løsninger

Ligninger med reelle løsninger Ligninger med reelle løsninger, marts 2008, Kirsten Rosenkilde 1 Ligninger med reelle løsninger Når man løser ligninger, er der nogle standardmetoder som er vigtige at kende. Vurdering af antallet af løsninger

Læs mere

Temaopgave: Parameterkurver Form: 6 timer med vejledning Januar 2010

Temaopgave: Parameterkurver Form: 6 timer med vejledning Januar 2010 Temaopgave: Parameterkurver Form: 6 timer med vejledning Januar 1 Parameterkurver Vi har tidligere set på en linjes parameterfremstilling, feks af typen: 1 OP = t +, hvor t R, og hvor OP er stedvektor

Læs mere

Arealer under grafer

Arealer under grafer HJ/marts 2013 1 Arealer under grafer 1 Arealer og bestemt integral Som bekendt kan vi bruge integralregning til at beregne arealer under grafer. Helt præcist har vi denne sætning. Sætning 1 (Analysens

Læs mere

Statistik i basketball

Statistik i basketball En note til opgaveskrivning jerome@falconbasket.dk 4. marts 200 Indledning I Falcon og andre klubber er der en del gymnasieelever, der på et tidspunkt i løbet af deres gymnasietid skal skrive en større

Læs mere

Privatansatte mænd bliver desuden noget hurtigere chef end kvinderne og forholdsvis flere ender i en chefstilling.

Privatansatte mænd bliver desuden noget hurtigere chef end kvinderne og forholdsvis flere ender i en chefstilling. Sammenligning af privatansatte kvinder og mænds løn Privatansatte kvindelige djøfere i stillinger uden ledelsesansvar har en løn der udgør ca. 96 procent af den løn deres mandlige kolleger får. I sammenligningen

Læs mere

Overheads til forelæsninger, mandag 5. uge På E har vi en mængde af mulige sandsynlighedsfordelinger for X, (P θ ) θ Θ.

Overheads til forelæsninger, mandag 5. uge På E har vi en mængde af mulige sandsynlighedsfordelinger for X, (P θ ) θ Θ. Statistiske modeller (Definitioner) Statistik og Sandsynlighedsregning 2 IH kapitel 0 og En observation er en vektor af tal x (x,..., x n ) E, der repræsenterer udfaldet af et (eller flere) eksperimenter.

Læs mere

Læsevejledning til resultater på regionsplan

Læsevejledning til resultater på regionsplan Læsevejledning til resultater på regionsplan Indhold 1. Overblik... 2 2. Sammenligninger... 2 3. Hvad viser figuren?... 3 4. Hvad viser tabellerne?... 5 5. Eksempler på typiske spørgsmål til tabellerne...

Læs mere

4. september 2003. π B = Lungefunktions data fra tirsdags Gennemsnit l/min

4. september 2003. π B = Lungefunktions data fra tirsdags Gennemsnit l/min Epidemiologi og biostatistik Uge, torsdag 28. august 2003 Morten Frydenberg, Institut for Biostatistik. og hoste estimation sikkerhedsintervaller antagelr Normalfordelingen Prædiktion Statistisk test (udfra

Læs mere

Modul 12: Exercises. 12.1 Sukkersygepatienters vægt

Modul 12: Exercises. 12.1 Sukkersygepatienters vægt Modul 12: Exercises 12.1 Sukkersygepatienters vægt............... 1 12.2 Newfoundlandske kvinders blodtryk.......... 4 12.3 Korrelationskoefficient.................. 6 12.4 Højde og vægt......................

Læs mere

Matematik projekt 4. Eksponentiel udvikling. Casper Wandrup Andresen 2.F 16-01-2009. Underskrift:

Matematik projekt 4. Eksponentiel udvikling. Casper Wandrup Andresen 2.F 16-01-2009. Underskrift: Matematik projekt 4 Eksponentiel udvikling Casper Wandrup Andresen 2.F 16-01-2009 Underskrift: Teorien bag eksponentiel udvikling er som sådan meget enkel. Den har forskriften: B er vores begndelsesværdi

Læs mere

To samhørende variable

To samhørende variable To samhørende variable Statistik er tal brugt som argumenter. - Leonard Louis Levinsen Antagatviharn observationspar x 1, y 1,, x n,y n. Betragt de to tilsvarende variable x og y. Hvordan måles sammenhængen

Læs mere

DesignMat Uge 11 Vektorrum

DesignMat Uge 11 Vektorrum DesignMat Uge Vektorrum Preben Alsholm Forår 200 Vektorrum. Definition af vektorrum Definition af vektorrum Lad L betegne R eller C. Lad V være en ikke-tom mængde udstyret med en addition + og en multiplikation

Læs mere

k UAFHÆNGIGE grupper F-test Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen

k UAFHÆNGIGE grupper F-test Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen Introduktion til Statistik Forelæsning 10: Envejs variansanalyse, ANOVA Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 017 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk

Læs mere

Deskriptiv statistik. Version 2.1. Noterne er et supplement til Vejen til matematik AB1. Henrik S. Hansen, Sct. Knuds Gymnasium

Deskriptiv statistik. Version 2.1. Noterne er et supplement til Vejen til matematik AB1. Henrik S. Hansen, Sct. Knuds Gymnasium Deskriptiv (beskrivende) statistik er den disciplin, der trækker de væsentligste oplysninger ud af et ofte uoverskueligt materiale. Det sker f.eks. ved at konstruere forskellige deskriptorer, d.v.s. regnestørrelser,

Læs mere

TALTEORI Wilsons sætning og Euler-Fermats sætning.

TALTEORI Wilsons sætning og Euler-Fermats sætning. Wilsons sætning og Euler-Fermats sætning, marts 2007, Kirsten Rosenkilde 1 TALTEORI Wilsons sætning og Euler-Fermats sætning. Disse noter forudsætter et grundlæggende kendskab til talteori som man kan

Læs mere

Statistikkompendium. Statistik

Statistikkompendium. Statistik Statistik INTRODUKTION TIL STATISTIK Statistik er analyse af indsamlet data. Det vil sige, at man bearbejder et datamateriale, som i matematik næsten altid er tal. Derved får man et samlet overblik over

Læs mere

DesignMat Egenværdier og Egenvektorer

DesignMat Egenværdier og Egenvektorer DesignMat Egenværdier og Egenvektorer Preben Alsholm September 008 1 Egenværdier og Egenvektorer 1.1 Definition og Eksempel 1 Definition og Eksempel 1 Lad V være et vektorrum over L (enten R eller C).

Læs mere

Matematisk Modellering 1 Hjælpeark

Matematisk Modellering 1 Hjælpeark Matematisk Modellerig Hjælpeark Kaare B. Mikkelse 2005090 3. september 2007 Idhold Formler 2 2 Aalyse af k ormalfordelte prøver 2 2. Modelcheck............................................ 2 2.2 Test af

Læs mere

VIGTIGT! Kurset består af: 1. Forelæsninger. 2. Øvelser. 3. Litteraturlæsning

VIGTIGT! Kurset består af: 1. Forelæsninger. 2. Øvelser. 3. Litteraturlæsning Intro til statistik Rasmus F. Brøndum, Institut 17 (Matematik) Hjemmeside: people.math.aau.dk/~froberg 22 forelæsninger (hvor af jeg afholder de første 13) + det samme antal øvelsesgange. Hjælpelærer:

Læs mere

9. Chi-i-anden test, case-control data, logistisk regression.

9. Chi-i-anden test, case-control data, logistisk regression. Biostatistik - Cand.Scient.San. 2. semester Karl Bang Christensen Biostatististisk afdeling, KU kach@biostat.ku.dk, 35327491 9. Chi-i-anden test, case-control data, logistisk regression. http://biostat.ku.dk/~kach/css2014/

Læs mere

Sandsynlighedsregning Oversigt over begreber og fordelinger

Sandsynlighedsregning Oversigt over begreber og fordelinger Tue Tjur Marts 2007 Sandsynlighedsregning Oversigt over begreber og fordelinger Stat. MØK 2. år Kapitel : Sandsynlighedsfordelinger og stokastiske variable En sandsynlighedsfunktion på en mængde E (udfaldsrummet)

Læs mere

Kvantitative Metoder 1 - Forår 2007. Dagens program

Kvantitative Metoder 1 - Forår 2007. Dagens program Dagens program Hypoteser: kap: 10.1-10.2 Eksempler på Maximum likelihood analyser kap 9.10 Test Hypoteser kap. 10.1 Testprocedure kap 10.2 Teststørrelsen Testsandsynlighed 1 Estimationsmetoder Kvantitative

Læs mere

Vejledende Matematik B

Vejledende Matematik B Vejledende Matematik B Prøvens varighed er 4 timer. Alle hjælpemidler er tilladt. Af opgaverne 8A, 8B, 8C og 8D skal kun to afleveres til bedømmelse. Hvis flere end to opgaver afleveres, bedømmes kun besvarelsen

Læs mere

Mat2SS Vejledende besvarelse uge 11

Mat2SS Vejledende besvarelse uge 11 MatSS Vejledende besvarelse uge Eksamen V99/00 opg. a Kønsfordelingen 996 den samme for de tre skoler Mænd Kvinder I alt København 5 = n x 56 = x 8 = n Odense 9 = n x 06 = x 5 = n Århus 0 = n x 40 = x

Læs mere

Løsning eksamen d. 15. december 2008

Løsning eksamen d. 15. december 2008 Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

LUP læsevejledning til regionsrapporter

LUP læsevejledning til regionsrapporter Indhold 1. Overblik... 2 2. Sammenligninger... 2 3. Hvad viser figuren?... 3 4. Hvad viser tabellerne?... 5 5. Eksempler på typiske spørgsmål til tabellerne... 6 Øvrigt materiale Baggrund og metode for

Læs mere

1 Start og afslutning. Help.

1 Start og afslutning. Help. Afdeling for Teoretisk Statistik STATISTIK 2 Institut for Matematiske Fag Jørgen Granfeldt Aarhus Universitet 24. september 2003 Hermed en udvidet udgave af Jens Ledet Jensens introduktion til R. 1 Start

Læs mere

Afstandsformlerne i Rummet

Afstandsformlerne i Rummet Afstandsformlerne i Rummet Frank Nasser 12. april 2011 c 2008-2011. Dette dokument må kun anvendes til undervisning i klasser som abonnerer på MatBog.dk. Se yderligere betingelser for brug her. Bemærk:

Læs mere

Middelværdi og varians. Kovarians. korrelation = 0.02 korrelation = 0.7 korrelation = 1.0

Middelværdi og varians. Kovarians. korrelation = 0.02 korrelation = 0.7 korrelation = 1.0 Middelværdi og varians Middelværdien af en diskret skalarfunktion f(x), for x = 0, N er: µ = N f(x) N x=0 For vektorfuktioner er middelværdivektoren tilsvarende: µ = N f(x) N x=0 Middelværdien er en af

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2 -test [ki-i-anden-test] 1 Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination

Læs mere

Reelle tal. Symbolbehandlingskompetencen er central gennem arbejdet med hele kapitlet i elevernes arbejde med tal og regneregler.

Reelle tal. Symbolbehandlingskompetencen er central gennem arbejdet med hele kapitlet i elevernes arbejde med tal og regneregler. Det første kapitel i grundbogen til Kolorit i 9. klasse handler om de reelle tal. Første halvdel af kapitlet har karakter af at være opsamlende i forhold til, hvad eleverne har arbejdet med på tidligere

Læs mere

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd I dag Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik SaSt) Helle Sørensen Først lidt om de sidste uger af SaSt. Derefter statistisk analyse af en enkelt

Læs mere

Statistik med GeoGebra

Statistik med GeoGebra Statistik med GeoGebra Hayati Balo, AAMS, marts 2012 1 Observationssæt Det talmateriale, som man gerne vil undersøge, kaldes et observationssæt. Det talsæt som fremgår i tabel 5.1 kan indsættes i GeoGebra

Læs mere

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning Introduktion Kasper K. Berthelsen, Inst f. Matematiske Fag Omfang: 8 Kursusgang I fremtiden

Læs mere

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som MLR antagelserne Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som y = β 0 + β 1 x 1 + β 2 x 2 + + β k x k + u, hvor β 0, β 1, β 2,...,β k er ukendte parametere,

Læs mere

DANMARKS TEKNISKE UNIVERSITET Side 1 af 17 sider. Skriftlig prøve, den: 19. december 2012 Kursus nr : 02405. (navn) (underskrift) (bord nr)

DANMARKS TEKNISKE UNIVERSITET Side 1 af 17 sider. Skriftlig prøve, den: 19. december 2012 Kursus nr : 02405. (navn) (underskrift) (bord nr) DANMARKS TEKNISKE UNIVERSITET Side af 7 sider Skriftlig prøve, den: 9. december 0 Kursus nr : 0405 Kursus navn: Sandsynlighedsregning Varighed : 4 timer Tilladte hjælpemidler: Alle Dette sæt er besvaret

Læs mere

Eksempel på logistisk vækst med TI-Nspire CAS

Eksempel på logistisk vækst med TI-Nspire CAS Eksempel på logistisk vækst med TI-Nspire CAS Tabellen herunder viser udviklingen af USA's befolkning fra 1850-1910 hvor befolkningstallet er angivet i millioner: Vi har tidligere redegjort for at antallet

Læs mere

SENIORKURSUS STATA OG BIOSTATISTIK

SENIORKURSUS STATA OG BIOSTATISTIK SENIORKURSUS STATA OG BIOSTATISTIK Aarhus Universitet juni 011 Genopfriskning af statistik Basale tankegange og begreber (i dag) Sammenligninger (i morgen) Sammenhænge (i overmorgen) Brug af programpakken

Læs mere