Opgaver til Kapitel 3
|
|
- Mathilde Østergaard
- 7 år siden
- Visninger:
Transkript
1 Opgaver til Kapitel 3 Hvis en opgave indeholder data, vil et sasprogram, der indlæser data være til rådighed i kataloget statbib/atskurser/stat1/opgaver/kapitel_03 For eksempel vil data til opgave 3.1 være på filen opgave_01a.sas, og et mere omfattende sasprogram vil være på filenopgave_01b.sas. Programmerne vil også være tilgængelige via en internetbrowser på adressen Opgave 3.1 Til kontrol af en løbende produktion af kobbertråd udtages med mellemrum 9 stykker tråd af ens længde. Vægten, angivet i gram, af sådanne 9 stykker findes nedenfor: ) Undersøg, om vægten kan anses for at være normaltfordelt. De følgende spørgsmål besvares under antagelse af normalitet. Standardberegningerne for de 9 observationer giver S = USS = ) Man tilstræber en standardproduktion svarende til en gennemsnitlig vægt på g. Giver målingerne anledning til indgreb i processen? 3) Angiv et 95% konfidensinterval for variansen på målingerne. 4) Kan variansen anses for at være ? Opgave 3.2 Man er interesseret i at sammenligne to metoder til at bestemme indholdet af CaO i klippestykker. Derfor er indholdet af CaO bestemt i ni klippestykker med begge metoder. Metode 1 Metode 2 differens
2 194 OPGAVER 1) Vis, at det kan antages, at differensen mellem bestemmelsen af CaO indholdet med de to metoder på samme klippestykke er normalfordelt. 2) Giver de to metoder samme bestemmelse af CaO indholdet? 3) Angiv et 95% konfidensinterval for differensernes middelværdi. I nedenstående tabel er givet nogle standardberegninger, som eventuelt kan bruges ved besvarelsen af opgaven. n S USS Metode Metode Differens Opgave 3.3 Det påstås ofte, at dobbeltmålinger af en fysisk størrelse udført af samme person viser en tendens til, at det første måleresultat påvirker det andet. For at undersøge dette, delte man på tilfældig måde 20 prøver af et pulver i to grupper på hver 10 prøver. Prøverne indeholdt en smule varierende mængde af et bestemt stof B. En laborant fik udleveret de første 10 prøver og blev bedt om at udføre dobbeltbestemmelser af procentindholdet af B. Resultaterne var: måling pr_1 pr_2 pr_3 pr_4 pr_5 pr_6 pr_7 pr_8 pr_9 pr_ Derefter blev hver prøve i den anden gruppe delt i to lige store portioner og de 20 prøver, der derved fremkom, blev givet til laboranten i tilfældig orden på en sådan måde, at han ikke var i stand til at identificere sammenhørende prøver. Resultaterne var nu: måling pr_1 pr_2 pr_3 pr_4 pr_5 pr_6 pr_7 pr_8 pr_9 pr_ Hvordan belyser disse målinger den anførte påstand? Angiv målemetodens usikkerhed. Opgave 3.4 Lad x 1,...,x n være en observationsrække fra Poissonfordelingen med parameter λ(> 0), det vil sige fra den diskrete fordeling, der har sandsynlighedsfunktionen po(x;λ) = e λ λ x x!, x = 0,1,2,.... 1) Angiv likelihood funktionen, log likelihood funktionen og likelihood ligningen. 2) Vis, at løsningen til likelihood ligningen er: x = 1 n n i=1 og vis, at løsningen maksimerer likelihood funktionen. x i,
3 OPGAVER 195 3) Angiv maksimum likelihood estimatoren for λ, og angiv sandsynligheden for, at maksimum likelihood estimatet eksisterer. 4) Betragt hypotesen H 0 : λ = λ 0 og vis, at likelihood ratio testoreren for H 0 er: Q(x) = (nλ 0 /x ) x exp( nλ 0 + x ). 5) Vis, at Q som funktion af x er strengt voksende for x nλ 0 og strengt aftagende for x nλ 0. 6) Antag, at n = 5,λ 0 = 3, og at x i = 20. Angiv de observationer der er mere eller ligeså kritiske for H 0 som x i = 20, og beregn testssandsynligheden. Opgave 3.5 Lad x være en observation fra en binomialfordeling med sandsynlighedsparameter π ( ]0,1[) og antalsparameter n ( N), det vil sige fra den diskrete fordeling, der har sandsynlighedsfunktionen ( ) n b(x;n,π) = π x (1 π) n x, x {0,1,...,n}. x 1) Angiv likelihood funktionen, log likelihood funktionen og likelihood ligningen. 2) Angiv maksimum likelihood estimatet for π og angiv sandsynligheden for at maksimum likelihood estimatet eksisterer. 3) Betragt hypotesen H 0 : π = π 0 = 1/2 og angiv likelihood ratio testoren for H 0. 4) Antag, at n = 10 og x = 1. Angiv de observationer der er mere end eller ligeså kritiske for H 0 som x = 1, og angiv testsandsynligheden. 5) Betragt dernæst hypotesen H 0 : π = π 0 = 1/4, og antag at n = 10 og x = 1. Angiv de observationer der er mere end eller ligeså kritiske for H 0 som x = 1, og angiv testsandsynligheden. Opgave 3.6 Betragt den kontinuerte fordeling på R 2 med tætheden f(x,y;θ) = 1 1 θ 2π exp(θxy x2 + y 2 ), 2 (x,y) R 2, (3.121) hvor θ er en ukendt parameter i intervallet ( 1,1). Lad (x 1,y 1 ),...,(x n,y n ) betegne realisationer af uafhængige og identisk fordelte stokastiske variable med en fordeling givet ved tætheden i (3.121). 1) Angiv likelihood funktionen, og vis at log likelihood funktionen er l(θ) = nlog(2π)+ n 2 log(1 θ 2 )+θ i y i i=1x 1 2 Vis dernæst, at likelihood ligningen er hvor SP xy = n i=1 x iy i. n θ 1 θ 2 = 1 n SP xy, n i=1x 2 i 1 2 n i=1 y 2 i.
4 196 OPGAVER 2) Vis, at maksimum likelihood estimatet er ˆθ = (SP xy /n) 2. 2SP xy /n 3) Man ønsker at teste hypotesen H 0 : θ = θ 0. Angiv likelihood ratio teststørrelsen Q for H 0. 4) Man interesserer sig nu specielt for θ 0 = 0, det vil sige H 0 : θ = 0. Man tager en stikprøve med n = 25 observationer, hvor SP xy = 11. Find ˆθ og test H 0. Opgave 3.7 Lad x 1,...,x n være en observationsrække fra N(µ,σ 2 ) fordelingen. 1) Vis, at likelihood ratio teststørrelsen Q(x) for hypotesen H 0 : σ 2 = σ 2 0 er hvor Q(x) = r n 2 e n 2 (r 1), r = ˆσ 2 /σ 2 0 = 1 n n i=1 (x i x ) 2 /σ ) Vis, at likelihood ratio testet forkaster for store og små værdier af r. I noterne side 68 baserer vi også testet for H 0 på r og beregner testsandsynligheden som ε(r) = 2F χ 2 ( f)/ f ( n n 1 r) for n n 1 r < χ2 0.5 ( f)/ f 2(1 F χ 2 ( f)/ f ( n 1 n n r)) for (3.122) n 1 r χ2 0.5 ( f)/ f, hvor f = n 1. Dette er ikke testsandsynligheden i likelihood ratio testet. 3) Find testsandsynligheden ved (3.122) og i likelihood ratio testet for H 0, når n = 10 og r = (Vink Q( ) = Q( )) 4) Samme spørgsmål som i 3) for n = 13 og r = 2. (Vink Q(2) = Q( )) Opgave 3.8 Betragt modellen med to uafhængige normalfordelte observationsrækker med samme varians.
5 OPGAVER 197 1) Vis påstandene side 93: Vi skal ikke i detaljer komme ind på, hvordan man finder estimaterne for parametrene, men kun nævne, at maksimum likelihood estimaterne for µ 1 og µ 2 er gennemsnittene i de to observationsrækker, altså henholdsvis x 1 og x 2, mens maksimum likelihood estimatet for σ 2 er.... ˆσ 2 = SSD 1 n = SSD (1) + SSD (2) n 1 + n 2. 2) Vis, at t testet side 94 for H 0µ : µ 1 = µ 2 er ækvivalent med likelihood ratio testet. Opgave 3.9 For at undersøge den atmosfæriske forurening er indholdet af SO 2 (i ppm) i luften bestemt i henholdsvis et kystområde og byområde. Analyser disse data: Kyst: By: Opgave 3.10 Med et halvt års mellemrum blev der foretaget to slamprøver på et rensningsanlæg. Kromindholdet (i mg Cr/kg tørstof) i de to prøver blev bestemt ved en række målinger, som er gengivet nedenfor sammen med antallet af målinger n, summen S og kvadratsummen USS af målingerne. prøve kromindhold (mg Cr/kg tørstof) n S USS I det følgende kan det antages, at for hver af prøverne kan målingerne af kromindholdet betragtes som en normalfordelt observationsrække. 1) Vis, at det kan antages, at variansen af kromindholdet er den samme i de to prøver. 2) Angiv estimat og 95% konfidensinterval for differensen mellem middelværdien af kromindholdet i de to prøver, og undersøg, om det kan antages, at middelværdien er den samme i de to prøver.
6 198 OPGAVER På samme tidpunkt, som den anden prøve blev foretaget, foretog man på et andet rensningsanlæg et række målinger på en slamprøve med følgende resultater (i mg Cr/kg tørstof) ) Undersøg om der er forskel på middelværdien af kromindholdet i de to prøver, der blev foretaget samtidigt på de to rensningsanlæg. Opgave 3.11 Institut for Idræt ved Københavns Universitet arrangerer hvert år et atletikstævne for de 1. års studerende. Atletiklærer Mikkel Sørensen har stillet nogle af resultaterne for årene 1998 og 1999 til rådighed. Det er af interesse at vide om resultaterne for de to år er forskellige eller ej. Resultaterne af pigernes længdespring er vist i tabellen nedenfor. år længde i m Standardberegninger findes i tabellen nedenfor. Analyser data. n S USS Opgave 3.12 Udled likelihood ratio testet for ens varianser i k uafhængige normalfordelte observationsrækker, det vil sige for reduktionen fra modellen til modellen I (3.48) er 2lnQ gengivet. M 0 : X i j N(µ i,σ 2 i ), M 1 : X i j N(µ i,σ 2 ), j = 1,...,n i, i = 1,...,k, j = 1,...,n i, i = 1,...,k Opgave 3.13 Vis, at F-testet side 153 for hypotesen H 02 : µ i = α + βt i i modellen M 1 : X i j N(µ i,σ 2 ) er ækvivalent med likelihood ratio testet. Opgave 3.14 Vis, at t-testet baseret på teststørrelsen t(x) = ˆβ β 0 s 2 02 /SSD t for hypotesen H 03 : β = β 0 i modellen M 2 : X i N(α + βt i,σ 2 ) er ækvivalent med likelihood ratio testet.
7 OPGAVER 199 Opgave 3.15 (Prediktionsintervaller) Når vi ud fra nogle data og en model for de pågældende data forsøger at udtale os om værdien af en ny observation kalder vi det prediktion. Vi forsøger ikke at angive en enkelt værdi, men derimod et interval, hvor observationen vil falde med en specificeret sandsynlighed, for eksempel et 95% prediktionsinterval. Betragt en normalfordelt observationsrække, X i N(µ,σ 2 ), i = 1,...,n, og lad Y betegne en stokastisk variabel, som er uafhængig af X 1,...,X n og N(µ,σ 2 ) fordelt. 1) Vis, at og dermed at uligheden Y X s(x) t(n 1), 1+1/n X t 1 α/2 (n 1)s(X) 1+1/n < Y < X +t 1 α/2 (n 1)s(X) 1+1/n (3.123) holder med sandsynlighed 1 α. Intervallet (3.123) med de observerede værdier fra stikprøven indsat er et 1 α prediktionsinterval. 2) Overvej hvilken betydning størrelsen n af den stikprøve, som bruges til estimation af modellens parametre har, og sammenlign med konfidensintervallet for middelværdien. 3) Betragt en lineær regressionsmodel som i Afsnit 3.3 og angiv et 1 α prediktionsinterval for en ny uafhængig observation med værdien t af den forklarende variabel. Opgave 3.16 (Middelværdi og varians af lineær transformation af vektor af stokastiske variable) Lad X = (X 1,...,X n ) være en n-dimensional søjlevektor af stokastiske variable. Vi vil benytte notationen X (µ,σ) (3.124) til at angive, at EX = µ og at Var X = Σ. Her er µ = (EX 1,...,EX n ) og Cov(X 1,X 1 ) Cov(X 1,X n ) Var X = Σ =... Cov(X n,x 1 ) Cov(X n,x n ) 1) Vis, at ξ + BX (ξ + Bµ,BΣB ), hvor ξ er en k-dimensional vektor og B er en k n matriks.
8 200 OPGAVER Opgave 3.17 (Multipel regression) Lad de stokastiske variable X i,i = 1,...,n, være indbyrdes uafhængige med fordeling: X i N(t i β,σ 2 ), hvor t i er en søjlevektor af k forklarende variable, og β er en søjlevektor af k ukendte parametre. Lad T være n k matricen, hvor i te række er t i t 1. T = t ị, og antag yderligere, at k < n og at T har fuld rang k. Man skriver kort modellen: t n X N(T β,σ 2 I n ), hvor notationen fra forrige opgave er suppleret med et N til at vise, at koordinaterne i X er normalfordelt. I det følgende betegner x den observerede værdi af den stokastiske vektor X. 1) Opskriv likelihood funktionen for modellen og vis, at likelihood ligningen for β er T T β = T x og at løsningen er ˆβ = (T T) 1 T x. 2) Vis, at den anden afledede af log likelihood funktionen med hensyn til β er T T 1 σ 2, som er negativ definit, så løsningen til likelihood ligningen er et maksimumspunkt for likelihood funktionen. 3) Bemærk, at vektoren af estimerede middelværdier (også kaldet predikterede værdier) er og at ˆx = T(T T) 1 T x ˆx N(T β,σ 2 T(T T) 1 T ) Matricen H = T(T T) 1 T kaldes hat matricen, fordi den sætter hat på x. Bemærk, at H er den ortogonale projektion på underrummet, som udspændes af søjlerne i T. 4) Vis, at maksimum likelihood estimatet for σ 2 er ˆσ 2 = 1 n x (I n T(T T) 1 T )x.
9 OPGAVER 201 5) Vis, at vektoren af residualer er r = x T ˆβ = (I n T(T T) 1 T )x, og at r N(0,σ 2 (I n T(T T) 1 T )). 6) Vis, at fordelingen for maksimum likelihood estimatet for β er ˆβ N(β,σ 2 (T T) 1 ). Opgave 3.18 (Konkrete eksempler på formulering af model som multipel regression.) Alle de modeller for normalfordelte data vi hidtil har betragtet kan skrives på formen fra Opgave ) Én observationsrække. Angiv T og fordelingen for residualer og ˆβ. Bemærk, at residualerne ikke er uafhængige. 2) k observationsrækker. Angiv T og fordelingen for residualer og ˆβ. Bemærk, at når der er forskelligt antal observationer i hver observationsrække, er residualerne ikke identisk fordelt. 3) Lineær regression. Angiv T og fordelingen for residualer og ˆβ. (I denne formulering indeholder β både afskæringen α og hældningskoefficienten, som vi tidligere har kaldt β.) Opgave 3.19 Data i opgaven stammer fra J.D. Forbes (1857). Further experiments and remarks on the measurement of heights by the boiling point water. Transactions of the Royal Society of Edinburgh, 21, , men vi benytter kun et udpluk på 31 observationer, som blev præsenteret i S. Weisberg (1985). Applied regression Analysis, 2. udgave, John Wiley and Sons. Data består af 31 sammenhørende værdier af atmosfærisk tryk og vands kogepunkt målt i Himalaya. Vi skal opfatte vands kogepunkt som forklarende variabel og trykket som respons. Data og et SAS program, der indlæser data, ligger på adressen sas Et SAS program, der laver relevante tegninger og beregninger ligger på adressen sas Beregninger og tegninger til denne opgave er så omfattende, at det kun er realistisk at løse den ved hjælp af SAS. 1) Tegn tryk op mod temperatur. 2) Afhænger trykket lineært af temperaturen?
10 202 OPGAVER 3) Er en kvadratisk sammenhæng bedre? 4) Lav en tegning af data og middelværdi i den valgte model, hvor også 95% konfidensinterval for middelværdien er angivet. 5) Lav en tegning af data og middelværdi i den valgte model, hvor også 95% prediktionsinterval for en ny observation er angivet. Opgave 3.20 Data i denne opgave stammer fra en større undersøgelse af caries hos skolebørn og angiver fordelingen af antal DMF-tænder (tænder med huller efter caries samt udtrukne og plomberede tænder) blandt 12-årige drenge fra 4 forskellige vandværksdistrikter. Samtidig med indsamlingen af disse data undersøgte man fluorindholdet i vandet fra de fire vandværker. De gennemsnitlige fluorionkoncentrationer er gengivet i sidste række i Tabel 3.13 som ppm F (mg fluorion pr. kg.). Tabellen viser fordelingen af antal DMF-tænder og kvadratroden af antal DMF-tænder blandt 12-årige drenge i fire vandværksdistrikter. Fluorindholdet i vandet fra de fire vandværker er ligeledes angivet. I tabellen er observationerne sorteret efter størrelse. Man har for eksempel i Vejen fundet 3 12-årige drenge, som havde 4 DMF-tænder, 4 drenge, som havde 6 DMF-tænder, og således videre. Formålet med undersøgelsen er at belyse, om drikkevandets fluorindhold påvirker antallet af DMF-tænder. Teoretiske overvejelser antyder, at man kan forvente, at kvadratroden af antal DMF-tænder er normalfordelt. 1) Undersøg ved hjælp af fraktildiagrammer, om kvadratroden af antal DMF-tænder hos 12-årige drenge i de fire vandværksdistrikter kan anses for at være normalfordelt. På baggrund af undersøgelsen i 1) kan man ikke afvise, at man kan anse kvadratroden af antal DMF-tænder for at være normalfordelt. I resten af opgaven skal man derfor analysere kvadratroden af antallet af DMF-tænder. I tabeller i slutningen af opgaven er angivet nogle beregnede størrelser, som kan benyttes ved besvarelsen. 2) Undersøg, om variansen på kvadratroden af antallet af DMF-tænder kan anses for at være den samme for de fire vandværksdistrikter. 3) Undersøg, om kvadratroden af antallet af DMF-tænder afhænger lineært af fluorindholdet i drikkevandet. 4) Undersøg, om kvadratroden af antal DMF-tænder er uafhængig af fluorindholdet i drikkevandet. Antal observationer, summer og kvadratsummer for kvadratroden af antal DMF-tænder for de fire vandværksdistrikter er givet i nedenstående tabel. i n S USS Sum
11 OPGAVER 203 Antal Kvadratroden Vejen Slagelse Næstved Næstved DMF- tænder af antal hjælpe- gamle DMF- tænder vandværk vandværk Fluorindholdet i drikkevandet ppm F Tabel 3.13 DMF-tænder hos 12 årige drenge i fire vandværksdistrikter. Standardberegninger til brug for regressionsanalyse er gengivet i nedenstående tabel. Kvadratroden af Fluorindholdet antal DMF-tænder i drikkevandet x t n 246 S U SS SP Opgave 3.21 Data til denne opgave stammer fra det et studie af Nobilis frøhvepsen, som er udført af Trine Iversen. Nobilis frøhvepsen er en knap én centimeter lang hveps, som om foråret lægger æg i Nobilis granens frø. Hver kogle indeholder frø, og i hvert frø kan der kun ligge ét æg. Ægget
12 204 OPGAVER udvikles til larve og larven æder alt, hvad der er i frøet. Larven bliver i frøet til om efteråret, hvor den udvikles til en voksen hveps, der klækker fra frøet. Et forår er et antal kogler indsamlet. For at få et skøn over, hvor mange af frøene, der indeholder en larve, tages et røngtenbillede af 100 frø fra hver kogle, og antallet af frø med larver tælles. Dette tal divideret med 100 kaldes infektionshyppigheden, p in f, af koglen. På baggrund af teoretiske overvejelser vil man forvente, at den transformerede infektionshyppighed x in f = sin 1 ( p in f ) er approksimativt normalfordelt med konstant varians. Det vil blive delvist kontrolleret i løbet af opgaven. Et af formålene med studiet var at undersøge, om der var sammenhæng mellem fysiske kendetegn ved koglerne og infektionshyppigheden. Vi skal her kun se på diameteren, som blev målt i millimeter med en nøjagtighed på 5 mm. På grund af den dårlige målenøjagtighed blev der kun målt fire forskellige diametre: 40 mm, 45 mm, 50 mm og 55 mm. 1) På baggrund af ovenstående spørgsmål, skal man opstille og kontrollere en model, som kan bruges til at besvare de følgende spørgsmål. I slutningen af opgaven er angivet nogle beregnede størrelser som kan benyttes til besvarelse af opgaven. 2) Vis, at det kan antages, at variansen på x in f ikke afhænger af diameteren. 3) Undersøg, om det kan antages, at middelværdien af x in f afhænger lineært af diameteren. 4) Angiv estimater og konfidensintervaller i slutmodellen. Diameter Antal observationer SSD (i) f (i) Variansskøn Ialt x in f Diameter S U SS SP Opgave 3.22 Data til denne opgave er en del af en større undersøgelse af forekomsten af svampe i hedejord, og specielt en gruppe, der vokser i tilknytning til lyngrødderne og benævnes Mykorrhiza.
13 OPGAVER 205 På et hedeareal vælges 5 punkter tilfældigt og en jordcylinder udtages med et jordbor. Rødderne udvaskes og svampe i rødderne kvantificeres i mikroskop og procentdelen af rodceller med svampe gøres op. For at undersøge en eventuel årstidsvariation er denne høst af rødder gentaget fire gange på et år. Høst 1 er udtaget i oktober 1992, høst 2 i februar 1993, høst 3 i maj 1993 og høst 4 i august Hedejorden består af to karakteristiske jordlag, mor og blegsand. Hele proceduren er udført to gange, så rødder er høstet både i morlaget og i blegsandslaget. I Tabel 3.14 er gengivet data fra morlaget og i Tabel 3.15 er gengivet data fra blegsandslaget. Mykorrhiza procent i morlaget Høst 1 Høst 2 Høst 3 Høst Tabel 3.14 Data fra morlaget. Mykorrhiza procent i blegsandslaget Høst 1 Høst 2 Høst 3 Høst Tabel 3.15 Data fra blegsandslaget. Nærmere undersøgelser viser, at det kan antages, at Mykorrhiza procenterne fra samme høsttidspunkt og samme jordlag er uafhængige observationer fra samme normalfordeling. I beregningerne må benyttes resultaterne af beregningsskemaerne, som er gengivet sidst i opgaven. I første omgang betragtes kun data fra morlaget og dermed kun beregningsskemaet i Tabel ) Vis, at det kan antages, at variansen på Mykorrhiza procenten ikke afhænger af høsttidspunktet. 2) Vis, at det kan antages, at middelværdien af Mykorrhiza procenten ikke afhænger af høsttidspunktet. En tilsvarende analyse for blegsandslaget leder frem til den samme model, nemlig at variansen på Mykorrhiza procenten ikke afhænger af høsttidspunktet, og at middelværdien af Mykorrhiza procenten ikke afhænger af høsttidspunktet.
14 206 OPGAVER Responsvariabel: Mykorrhiza procent Gruppevariabel: TID Beregningsskema: Estimeret Gennemi ni Si USSi Si2/ni SSDi fi varians snit ==================== Tabel 3.16 Standardberegninger for morlaget. Responsvariabel: Mykorrhiza procent Gruppevariabel: TID Beregningsskema: Estimeret Gennemi ni Si USSi Si2/ni SSDi fi varians snit =================== Tabel 3.17 Standardberegninger for blegsandslaget. 3) Undersøg, om variansen er den samme for Mykorrhiza procenten i morlaget og i blegsandslaget. 4) Undersøg, om middelværdien af Mykorrhiza procenten er den samme i morlaget og i blegsandslaget. Opgave 3.23 I en række tilfælde finder vi likelihood ligningen og angiver en løsning, som vi postulerer maksimerer likelihood funktionen. Det kræver dog altid en overvejelse, og i mange modeller er det langt fra trivielt at vise, at løsninger til likelihood ligningen er maksimum likelihood estimater. 1) Én normalfordelt observationsrække med kendt varians. Vis, at log likelihood funktionen (3.25) side 82 antager sit globale maksimum for µ = x. 2) Én normalfordelt observationsrække. Vis, at (µ,σ 2 ) = ( x, ˆσ 2 ), som er angivet side 83, er et punkt hvor log likelihood funktionen (3.26) antager sit globale maksimum.
15 OPGAVER 207 3) Lineær regression. Vis, at løsningerne, ( ˆα, ˆβ), til likelihood ligningerne (3.55) side 140 er et punkt, hvor likelihood funktionen (3.54) antager sit globale maksimum. (Vink: Det er en fordel at omparametrisere til parametrene (µ,β), hvor µ = α + β t.) Opgave 3.24 Antag, at X er en kontinuert stokastisk variabel (k = 1) med tæthedsfunktion og lad Y = h(x), hvor h er en (strengt) monoton og differentiabel reel funktion. Vis, at tæthedsfunktionen for Y er: Opgave 3.25 Vis følgende resultater: f Y (y) = h (h 1 (y)) 1 f X (h 1 (y)), y supp f Y. (3.125) 1) Vis, at funktionen γ( ; α, λ) i (3.92) er en tæthedsfunktion for α > 0 og λ > 0, og endvidere at funktionen er strengt aftagende for α 1, mens den er unimodal for α > 1 med maksimum i x = (α 1)/λ. 2) 3) 4) 5) X Γ(α,λ) og c > 0 cx Γ(α,λ/c) (3.126) X 1 Γ(α 1,λ) X 2 Γ(α 2,λ) X 1 + X 2 Γ(α 1 + α 2,λ) (3.127) X Γ(α,λ) EX = α/λ og VarX = α/λ 2 (3.128) σ 2 χ 2 ( f) = Γ( f/2,1/(2σ 2 )) og σ 2 χ 2 ( f)/ f = Γ( f/2, f/(2σ 2 )) 6) χ 2 (2) er eksponentialfordelingen med middelværdi 2. Opgave 3.26 Vis formel (3.98), det vil sige U N(0,1) U 2 χ 2 (1). Opgave 3.27 Udled tætheden for t-fordelingen med f frihedsgrader. Opgave 3.28 Udled tætheden for F-fordelingen med ( f 1, f 2 ) frihedsgrader. Opgave 3.29 Vis formel (3.115) (eller (3.116)). Opgave 3.30 Udled tætheden for fordelingen B(α 1,α 2 ).
Forelæsning 8: Inferens for varianser (kap 9)
Kursus 02402 Introduktion til Statistik Forelæsning 8: Inferens for varianser (kap 9) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby
Læs mereModul 5: Test for én stikprøve
Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 5: Test for én stikprøve 5.1 Test for middelværdi................................. 1 5.1.1 t-fordelingen.................................
Læs mereHypotese test. Repetition fra sidst Hypoteser Test af middelværdi Test af andel Test af varians Type 1 og type 2 fejl Signifikansniveau
ypotese test Repetition fra sidst ypoteser Test af middelværdi Test af andel Test af varians Type 1 og type fejl Signifikansniveau Konfidens intervaller Et konfidens interval er et interval, der estimerer
Læs mereStatistik og Sandsynlighedsregning 2
Statistik og Sandsynlighedsregning 2 Den flerdimensionale normalfordeling, fordeling af ( X,SSD) Helle Sørensen Uge 9, mandag SaSt2 (Uge 9, mandag) Flerdim. N, ford. af ( X,SSD) 1 / 16 Program Resultaterne
Læs mereKonfidensinterval for µ (σ kendt)
Program 1. Repetition: konfidens-intervaller. 2. Hypotese test 3. Type I og type II fejl, p-værdi 4. En og to-sidede tests 5. Test for middelværdi (kendt varians) 6. Test for middelværdi (ukendt varians)
Læs mereDagens Temaer. Test for lineær regression. Test for lineær regression - via proc glm. k normalfordelte obs. rækker i proc glm. p. 1/??
Dagens Temaer k normalfordelte obs. rækker i proc glm. Test for lineær regression Test for lineær regression - via proc glm p. 1/?? Proc glm Vi indlæser data i datasættet stress, der har to variable: areal,
Læs mereNormalfordelingen. Statistik og Sandsynlighedsregning 2
Normalfordelingen Statistik og Sandsynlighedsregning 2 Repetition og eksamen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange variable, blandt andet tilfældige fejl på
Læs mereModul 7: Eksempler. 7.1 Beskrivende dataanalyse. 7.1.1 Diagrammer. Bent Jørgensen. Forskningsenheden for Statistik ST501: Science Statistik
Forskningsenheden for Statistik ST501: Science Statistik Bent Jørgensen Modul 7: Eksempler 7.1 Beskrivende dataanalyse............................... 1 7.1.1 Diagrammer.................................
Læs mereNote til styrkefunktionen
Teoretisk Statistik. årsprøve Note til styrkefunktionen Først er det vigtigt at gøre sig klart, at når man laver statistiske test, så kan man begå to forskellige typer af fejl: Type fejl: At forkaste H
Læs mereProgram. 1. Repetition: konfidens-intervaller. 2. Hypotese test, type I og type II fejl, signifikansniveau, styrke, en- og to-sidede test.
Program 1. Repetition: konfidens-intervaller. 2. Hypotese test, type I og type II fejl, signifikansniveau, styrke, en- og to-sidede test. 1/19 Konfidensinterval for µ (σ kendt) Estimat ˆµ = X bedste bud
Læs mereModule 12: Mere om variansanalyse
Mathematical Statistics ST06: Linear Models Bent Jørgensen og Pia Larsen Module 2: Mere om variansanalyse 2. Parreded observationer................................ 2.2 Faktor med 2 niveauer (0- variabel)........................
Læs mereVi kalder nu antal prøverør blandt de 20, hvor der ikke ses vækst for X.
Opgave I I en undersøgelse af et potentielt antibiotikum har man dyrket en kultur af en bestemt mikroorganisme og tilført prøver af organismen til 20 prøverør med et vækstmedium og samtidig har man tilført
Læs mereMultipel Lineær Regression. Polynomiel regression Ikke-lineære modeller og transformation Multi-kolinearitet Auto-korrelation og Durbin-Watson test
Multipel Lineær Regression Polynomiel regression Ikke-lineære modeller og transformation Multi-kolinearitet Auto-korrelation og Durbin-Watson test Multipel lineær regression x,x,,x k uafhængige variable
Læs mereKvantitative Metoder 1 - Forår 2007
Dagens program Afsnit 3.3-3.5 Varians Eksempel: Forventet nytte Kovarians og korrelation Middelværdi og varians af summer af stokastiske variabler Eksempel: Porteføljevalg 1 Beskrivelse af fordelinger
Læs mereKursus 02402 Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff
Kursus 02402 Introduktion til Statistik Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks
Læs mereEn Introduktion til SAS. Kapitel 6.
En Introduktion til SAS. Kapitel 6. Inge Henningsen Afdeling for Statistik og Operationsanalyse Københavns Universitet Marts 2005 6. udgave Kapitel 6 Regressionsanalyse i SAS 6.1 Indledning Dette kapitel
Læs mereda er X 1 + X 2 N(µ 1 + µ 2,σ1 2 + σ2) Hvis X 1,...,X n er uafhængige og X r N(µ,σ 2 ), da er X = 1 n (X 1 +... + X n ) N(µ, σ2
Statistik og Sandsynlighedsregning IH kapitel Overheads til forelæsninger, onsdag 5. uge Resultater om normalfordeling X N(µ,σ ). N har tæthed ϕ µ,σ (x) = exp (x µ) πσ σ EX = µ, Var(X) = σ X µ N(0,) σ
Læs mereModule 2: Beskrivende Statistik
Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen og Hans Chr. Petersen Module 2: Beskrivende Statistik 2.1 Histogrammer og søjlediagrammer......................... 1 2.2 Sammenfatning
Læs mereForelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6
Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220
Læs merea) Har måleresultaterne for de 2 laboranter samme varians? b) Tyder resultaterne på, at nogen af laboranterne måler med en systematisk fejl?
Module 6: Exercises 6.1 To laboranter....................... 2 6.2 Nicotamid i piller..................... 3 6.3 Karakterer......................... 5 6.4 Blodtryk hos kvinder................... 6 6.5
Læs merePhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006 I dag: To stikprøver fra en normalfordeling, ikke-parametriske metoder og beregning af stikprøvestørrelse Eksempel: Fiskeolie
Læs mereKapitel 3 Centraltendens og spredning
Kapitel 3 Centraltendens og spredning Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 Indledning 2 Centraltendens 3 Spredning 4 Praktisk beregning 5 Fraktiler 6 Opsamling 1 Indledning
Læs mereModul 3: Kontinuerte stokastiske variable
Forskningsenheden for Statistik ST501: Science Statistik Bent Jørgensen Modul 3: Kontinuerte stokastiske variable 3.1 Kontinuerte stokastiske variable........................... 1 3.1.1 Tæthedsfunktion...............................
Læs mereUge 48 II Teoretisk Statistik 27. november 2003. Numerisk modelkontrol af diskrete fordelinger: intro
Uge 48 II Teoretisk Statistik 7. november 003 Numerisk modelkontrol af diskrete fordelinger: intro Eksempel: kvalitetskontrol Goodness-of-fit test: generel teori Endeligt udfaldsrum Udfaldsrum uden øvre
Læs mereNaturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1
Matematisk Modellering 1 Side 1 I nærværende opgavesæt er der 16 spørgsmål fordelt på 4 opgaver. Ved bedømmelsen af besvarelsen vægtes alle spørgsmål lige. Endvidere lægges der vægt på, at det af besvarelsen
Læs mereFunktionalligninger - løsningsstrategier og opgaver
Funktionalligninger - løsningsstrategier og opgaver Altså er f (f (1)) = 1. På den måde fortsætter vi med at samle oplysninger om f og kombinerer dem også med tidligere oplysninger. Hvis vi indsætter =
Læs mereBasal statistik for sundhedsvidenskabelige forskere, forår 2015 Udleveret 3. marts, afleveres senest ved øvelserne i uge 13 (24.-25.
Hjemmeopgave Basal statistik for sundhedsvidenskabelige forskere, forår 2015 Udleveret 3. marts, afleveres senest ved øvelserne i uge 13 (24.-25. marts) En stikprøve bestående af 65 mænd og 65 kvinder
Læs mereChi-i-anden Test. Repetition Goodness of Fit Uafhængighed i Kontingenstabeller
Chi-i-anden Test Repetition Goodness of Fit Uafhængighed i Kontingenstabeller Chi-i-anden Test Chi-i-anden test omhandler data, der har form af antal eller frekvenser. Antag, at n observationer kan inddeles
Læs mereØkonometri 1. Inferens i den lineære regressionsmodel 25. september 2006. Oversigt: De næste forelæsninger
Oversigt: De næste forelæsninger Økonometri Inferens i den lineære regressionsmodel 5. september 006 Statistisk inferens: hvorledes man med udgangspunkt i en statistisk model kan drage konklusioner på
Læs mereProgram. Simpel og multipel lineær regression. I tirsdags: model og estimation. I tirsdags: Prædikterede værdier og residualer
Program Simpel og multipel lineær regression Helle Sørensen E-mail: helle@math.ku.dk Simpel LR: repetition, konfidensintervaller, test, prædiktionsintervaller, mm. Multipel LR: estimation, valg af model,
Læs mereProgram. Ensidet variansanalyse Sammenligning af grupper. Statistisk model og hypotese. Eksempel: Aldersfordeling i hjertestudie
Program Ensidet variansanalyse Sammenligning af grupper Helle Sørensen E-mail: helle@math.ku.dk I dag: Sammenligning af middelværdier Sammenligning af spredninger Parvise sammenligninger To eksempler:
Læs mereIntroduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher
Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk
Læs mereVariabel- sammenhænge
Variabel- sammenhænge Udgave 2 2009 Karsten Juul Dette hæfte kan bruges som start på undervisningen i variabelsammenhænge for stx og hf. Hæftet er en introduktion til at kunne behandle to sammenhængende
Læs mereTema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.
Tema Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. (Fx. x. µ) Hypotese og test. Teststørrelse. (Fx. H 0 : µ = µ 0 ) konfidensintervaller
Læs mereOversigt. Course 02402/02323 Introducerende Statistik. Forelæsning 3: Kontinuerte fordelinger. Per Bruun Brockhoff
Course 242/2323 Introducerende Statistik Forelæsning 3: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 22 Danmarks Tekniske Universitet 28 Lyngby Danmark
Læs mereEnsidet variansanalyse
Ensidet variansanalyse Sammenligning af grupper Helle Sørensen E-mail: helle@math.ku.dk StatBK (Uge 47, mandag) Ensidet ANOVA 1 / 18 Program I dag: Sammenligning af middelværdier Sammenligning af spredninger
Læs mere02402 Løsning til testquiz02402f (Test VI)
02402 Løsning til testquiz02402f (Test VI) Spørgsmål 4. En ejendomsmægler ønsker at undersøge om hans kunder får mindre end hvad de har forlangt, når de sælger deres bolig. Han har regisreret følgende:
Læs mereStatistik og Sandsynlighedsregning 2
Statistik og Sandsynlighedsregning 2 Transformation af kontinuerte fordelinger på R, flerdimensionale kontinuerte fordelinger, mere om normalfordelingen Helle Sørensen Uge 7, onsdag SaSt2 (Uge 7, onsdag)
Læs mereMatematik B. Højere handelseksamen
Matematik B Højere handelseksamen hh121-mat/b-04062012 Mandag den 4. juni 2012 kl. 9.00-13.00 Prøven består af to delprøver. Delprøven uden hjælpemidler består af opgave 1 til 5 med i alt 5 spørgsmål.
Læs mereDagens Emner. Likelihood teori. Lineær regression (intro) p. 1/22
Dagens Emner Likelihood teori Lineær regression (intro) p. 1/22 Likelihood-metoden M : X i N(µ,σ 2 ) hvor µ og σ 2 er ukendte Vi har, at L(µ,σ 2 ) = ( 1 2πσ 2)n/2 e 1 2σ 2 P n (x i µ) 2 er tætheden som
Læs mereInstitut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6
Institut for Matematiske Fag Matematisk Modellering 1 Aarhus Universitet Eva B. Vedel Jensen 25. februar 2008 UGESEDDEL 6 Forelæsningerne torsdag den 21. februar og tirsdag den 26. februar. Jeg har gennemgået
Læs mereDagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at
Likelihood teori Lineær regression (intro) Dagens Emner Likelihood-metoden M : X i N(µ,σ 2 ) hvor µ og σ 2 er ukendte Vi har, at L(µ,σ 2 1 ) = ( 2πσ 2)n/2 e 1 2 P n (xi µ)2 er tætheden som funktion af
Læs mereTrivsel og fravær i folkeskolen
Trivsel og fravær i folkeskolen Sammenfatning De årlige trivselsmålinger i folkeskolen måler elevernes trivsel på fire forskellige områder: faglig trivsel, social trivsel, støtte og inspiration og ro og
Læs mereReminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model
Reminder: Hypotesetest for én parameter Antag vi har model Økonometri: Lektion 4 F -test Justeret R 2 Aymptotiske resultater y = β 0 + β 1 x 2 + β 2 x 2 + + β k x k + u. Vi ønsker at teste hypotesen H
Læs mereOpgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved
Matematisk Modellering 1 (reeksamen) Side 1 Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved { 1 hvis x {1, 2, 3}, p X (x) = 3 0 ellers,
Læs mereEn oversigt over udvalgte kontinuerte sandsynlighedsfordelinger
Institut for Økonomi Aarhus Universitet Statistik 1, Forår 2001 Allan Würtz 4. April, 2001 En oversigt over udvalgte kontinuerte sandsynlighedsfordelinger Uniform fordeling Benyttes som model for situationer,
Læs mereTema. Dagens tema: Indfør centrale statistiske begreber.
Tema Dagens tema: Indfør centrale statistiske begreber. Model og modelkontrol Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. konfidensintervaller Vi tager udgangspunkt i Ex. 3.1 i
Læs mereØkonometri 1. Interne evalueringer af forelæsninger. Kvalitative variabler. Dagens program. Dummyvariabler 21. oktober 2004
Dagens program Økonometri 1 Dummyvariabler 21. oktober 2004 Emnet for denne forelæsning er kvalitative egenskaber i den multiple regressionsmodel (Wooldridge kap. 7.1-7.6) Kvalitative variabler generelt
Læs mereSignifikanstestet. usædvanlig godt godt
Signifikanstestet Fordeling af rygevaner som 45-årig og senere selvrapporteret helbred som 51-årig blandt tilfældigt udvalgte mænd i Københavns Amt i 1987. helbred som 51 årig rygevaner som 45 årig Total
Læs mereHvad skal vi lave i dag?
p. 1/2 Hvad skal vi lave i dag? Eksempler på stokastiske variable. Ventetid på krone ved møntkast. Antal plat ved n kast. Antal radioaktive henfald. Ventetiden på en flyulykke. Udtrækning af tal i et interval.
Læs mereOm hvordan Google ordner websider
Om hvordan Google ordner websider Hans Anton Salomonsen March 14, 2008 Man oplever ofte at man efter at have givet Google et par søgeord lynhurtigt får oplysning om at der er fundet et stort antal - måske
Læs mereNanostatistik: Middelværdi og varians
Nanostatistik: Middelværdi og varians JLJ Nanostatistik: Middelværdi og varians p. 1/28 Repetition Stokastisk variabel: funktion fra udfaldsrum over i de hele tal eller over i de reelle tal Ex: Ω = alle
Læs mereNATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.
NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET. Eksamen i Statistik 1 Tag-hjem prøve 1. juli 2010 24 timer Alle hjælpemidler er tilladt. Det er tilladt at skrive med blyant og benytte viskelæder,
Læs mereForslag til løsning af Opgaver til ligningsløsning (side172)
Forslag til løsning af Opgaver til ligningsløsning (side17) Opgave 1 Hvis sønnens alder er x år, så er faderens alder x år. Der går x år, før sønnen når op på x år. Om x år har faderen en alder på: x x
Læs mereLøsning af præmie- og ekstraopgave
52 Læserbidrag Løsning af præmie- og ekstraopgave 23. årgang, nr. 1 Martin Wedel Jacobsen Både præmieopgaven og ekstraopgaven er specialtilfælde af en mere generel opgave: Hvor mange stykker kan en n-dimensionel
Læs mereProdukt og marked - matematiske og statistiske metoder
Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 19, 2016 1/26 Kursusindhold: Sandsynlighedsregning og lagerstyring
Læs mereKursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo
Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte
Læs mereNATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.
NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET. Eksamen i Statistik 1TS Teoretisk statistik Den skriftlige prøve Sommer 2003 3 timer - alle hjælpemidler tilladt Det er tilladt at skrive
Læs mereKursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo
Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte
Læs mereTænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i.
Repetition af vektor-regning Økonometri: Lektion 3 Matrix-formulering Fordelingsantagelse Hypotesetest Antag vi har to n-dimensionelle (søjle)vektorer a 1 b 1 a 2 a =. og b = b 2. a n b n Tænk på a og
Læs mereLinAlg Skriftlig prøve 20. januar 2009, 9 12 Vejledende besvarelse
LinAlg Skriftlig prøve. januar 9, 9 Vejledende besvarelse Dette eksamenssæt løber over 5 sider, denne side inklusive. Sættet stilles til løsning over 3 timer med alle sædvanlige hjælpemidler, bortset fra
Læs mereMatematik A. Studentereksamen. Digital eksamensopgave med adgang til internettet
Matematik A Studentereksamen Digital eksamensopgave med adgang til internettet 1stx131-MATn/A-405013 Fredag den 4. maj 013 kl. 09.00-14.00 Opgavesættet er delt i to dele. Delprøve 1: timer med autoriseret
Læs mereLigninger med reelle løsninger
Ligninger med reelle løsninger, marts 2008, Kirsten Rosenkilde 1 Ligninger med reelle løsninger Når man løser ligninger, er der nogle standardmetoder som er vigtige at kende. Vurdering af antallet af løsninger
Læs mereTemaopgave: Parameterkurver Form: 6 timer med vejledning Januar 2010
Temaopgave: Parameterkurver Form: 6 timer med vejledning Januar 1 Parameterkurver Vi har tidligere set på en linjes parameterfremstilling, feks af typen: 1 OP = t +, hvor t R, og hvor OP er stedvektor
Læs mereArealer under grafer
HJ/marts 2013 1 Arealer under grafer 1 Arealer og bestemt integral Som bekendt kan vi bruge integralregning til at beregne arealer under grafer. Helt præcist har vi denne sætning. Sætning 1 (Analysens
Læs mereStatistik i basketball
En note til opgaveskrivning jerome@falconbasket.dk 4. marts 200 Indledning I Falcon og andre klubber er der en del gymnasieelever, der på et tidspunkt i løbet af deres gymnasietid skal skrive en større
Læs merePrivatansatte mænd bliver desuden noget hurtigere chef end kvinderne og forholdsvis flere ender i en chefstilling.
Sammenligning af privatansatte kvinder og mænds løn Privatansatte kvindelige djøfere i stillinger uden ledelsesansvar har en løn der udgør ca. 96 procent af den løn deres mandlige kolleger får. I sammenligningen
Læs mereOverheads til forelæsninger, mandag 5. uge På E har vi en mængde af mulige sandsynlighedsfordelinger for X, (P θ ) θ Θ.
Statistiske modeller (Definitioner) Statistik og Sandsynlighedsregning 2 IH kapitel 0 og En observation er en vektor af tal x (x,..., x n ) E, der repræsenterer udfaldet af et (eller flere) eksperimenter.
Læs mereLæsevejledning til resultater på regionsplan
Læsevejledning til resultater på regionsplan Indhold 1. Overblik... 2 2. Sammenligninger... 2 3. Hvad viser figuren?... 3 4. Hvad viser tabellerne?... 5 5. Eksempler på typiske spørgsmål til tabellerne...
Læs mere4. september 2003. π B = Lungefunktions data fra tirsdags Gennemsnit l/min
Epidemiologi og biostatistik Uge, torsdag 28. august 2003 Morten Frydenberg, Institut for Biostatistik. og hoste estimation sikkerhedsintervaller antagelr Normalfordelingen Prædiktion Statistisk test (udfra
Læs mereModul 12: Exercises. 12.1 Sukkersygepatienters vægt
Modul 12: Exercises 12.1 Sukkersygepatienters vægt............... 1 12.2 Newfoundlandske kvinders blodtryk.......... 4 12.3 Korrelationskoefficient.................. 6 12.4 Højde og vægt......................
Læs mereMatematik projekt 4. Eksponentiel udvikling. Casper Wandrup Andresen 2.F 16-01-2009. Underskrift:
Matematik projekt 4 Eksponentiel udvikling Casper Wandrup Andresen 2.F 16-01-2009 Underskrift: Teorien bag eksponentiel udvikling er som sådan meget enkel. Den har forskriften: B er vores begndelsesværdi
Læs mereTo samhørende variable
To samhørende variable Statistik er tal brugt som argumenter. - Leonard Louis Levinsen Antagatviharn observationspar x 1, y 1,, x n,y n. Betragt de to tilsvarende variable x og y. Hvordan måles sammenhængen
Læs mereDesignMat Uge 11 Vektorrum
DesignMat Uge Vektorrum Preben Alsholm Forår 200 Vektorrum. Definition af vektorrum Definition af vektorrum Lad L betegne R eller C. Lad V være en ikke-tom mængde udstyret med en addition + og en multiplikation
Læs merek UAFHÆNGIGE grupper F-test Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen
Introduktion til Statistik Forelæsning 10: Envejs variansanalyse, ANOVA Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 017 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk
Læs mereDeskriptiv statistik. Version 2.1. Noterne er et supplement til Vejen til matematik AB1. Henrik S. Hansen, Sct. Knuds Gymnasium
Deskriptiv (beskrivende) statistik er den disciplin, der trækker de væsentligste oplysninger ud af et ofte uoverskueligt materiale. Det sker f.eks. ved at konstruere forskellige deskriptorer, d.v.s. regnestørrelser,
Læs mereTALTEORI Wilsons sætning og Euler-Fermats sætning.
Wilsons sætning og Euler-Fermats sætning, marts 2007, Kirsten Rosenkilde 1 TALTEORI Wilsons sætning og Euler-Fermats sætning. Disse noter forudsætter et grundlæggende kendskab til talteori som man kan
Læs mereStatistikkompendium. Statistik
Statistik INTRODUKTION TIL STATISTIK Statistik er analyse af indsamlet data. Det vil sige, at man bearbejder et datamateriale, som i matematik næsten altid er tal. Derved får man et samlet overblik over
Læs mereDesignMat Egenværdier og Egenvektorer
DesignMat Egenværdier og Egenvektorer Preben Alsholm September 008 1 Egenværdier og Egenvektorer 1.1 Definition og Eksempel 1 Definition og Eksempel 1 Lad V være et vektorrum over L (enten R eller C).
Læs mereMatematisk Modellering 1 Hjælpeark
Matematisk Modellerig Hjælpeark Kaare B. Mikkelse 2005090 3. september 2007 Idhold Formler 2 2 Aalyse af k ormalfordelte prøver 2 2. Modelcheck............................................ 2 2.2 Test af
Læs mereVIGTIGT! Kurset består af: 1. Forelæsninger. 2. Øvelser. 3. Litteraturlæsning
Intro til statistik Rasmus F. Brøndum, Institut 17 (Matematik) Hjemmeside: people.math.aau.dk/~froberg 22 forelæsninger (hvor af jeg afholder de første 13) + det samme antal øvelsesgange. Hjælpelærer:
Læs mere9. Chi-i-anden test, case-control data, logistisk regression.
Biostatistik - Cand.Scient.San. 2. semester Karl Bang Christensen Biostatististisk afdeling, KU kach@biostat.ku.dk, 35327491 9. Chi-i-anden test, case-control data, logistisk regression. http://biostat.ku.dk/~kach/css2014/
Læs mereSandsynlighedsregning Oversigt over begreber og fordelinger
Tue Tjur Marts 2007 Sandsynlighedsregning Oversigt over begreber og fordelinger Stat. MØK 2. år Kapitel : Sandsynlighedsfordelinger og stokastiske variable En sandsynlighedsfunktion på en mængde E (udfaldsrummet)
Læs mereKvantitative Metoder 1 - Forår 2007. Dagens program
Dagens program Hypoteser: kap: 10.1-10.2 Eksempler på Maximum likelihood analyser kap 9.10 Test Hypoteser kap. 10.1 Testprocedure kap 10.2 Teststørrelsen Testsandsynlighed 1 Estimationsmetoder Kvantitative
Læs mereVejledende Matematik B
Vejledende Matematik B Prøvens varighed er 4 timer. Alle hjælpemidler er tilladt. Af opgaverne 8A, 8B, 8C og 8D skal kun to afleveres til bedømmelse. Hvis flere end to opgaver afleveres, bedømmes kun besvarelsen
Læs mereMat2SS Vejledende besvarelse uge 11
MatSS Vejledende besvarelse uge Eksamen V99/00 opg. a Kønsfordelingen 996 den samme for de tre skoler Mænd Kvinder I alt København 5 = n x 56 = x 8 = n Odense 9 = n x 06 = x 5 = n Århus 0 = n x 40 = x
Læs mereLøsning eksamen d. 15. december 2008
Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th
Læs mereLUP læsevejledning til regionsrapporter
Indhold 1. Overblik... 2 2. Sammenligninger... 2 3. Hvad viser figuren?... 3 4. Hvad viser tabellerne?... 5 5. Eksempler på typiske spørgsmål til tabellerne... 6 Øvrigt materiale Baggrund og metode for
Læs mere1 Start og afslutning. Help.
Afdeling for Teoretisk Statistik STATISTIK 2 Institut for Matematiske Fag Jørgen Granfeldt Aarhus Universitet 24. september 2003 Hermed en udvidet udgave af Jens Ledet Jensens introduktion til R. 1 Start
Læs mereAfstandsformlerne i Rummet
Afstandsformlerne i Rummet Frank Nasser 12. april 2011 c 2008-2011. Dette dokument må kun anvendes til undervisning i klasser som abonnerer på MatBog.dk. Se yderligere betingelser for brug her. Bemærk:
Læs mereMiddelværdi og varians. Kovarians. korrelation = 0.02 korrelation = 0.7 korrelation = 1.0
Middelværdi og varians Middelværdien af en diskret skalarfunktion f(x), for x = 0, N er: µ = N f(x) N x=0 For vektorfuktioner er middelværdivektoren tilsvarende: µ = N f(x) N x=0 Middelværdien er en af
Læs mereAnvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]
Anvendt Statistik Lektion 6 Kontingenstabeller χ 2 -test [ki-i-anden-test] 1 Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination
Læs mereReelle tal. Symbolbehandlingskompetencen er central gennem arbejdet med hele kapitlet i elevernes arbejde med tal og regneregler.
Det første kapitel i grundbogen til Kolorit i 9. klasse handler om de reelle tal. Første halvdel af kapitlet har karakter af at være opsamlende i forhold til, hvad eleverne har arbejdet med på tidligere
Læs mereI dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd
I dag Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik SaSt) Helle Sørensen Først lidt om de sidste uger af SaSt. Derefter statistisk analyse af en enkelt
Læs mereStatistik med GeoGebra
Statistik med GeoGebra Hayati Balo, AAMS, marts 2012 1 Observationssæt Det talmateriale, som man gerne vil undersøge, kaldes et observationssæt. Det talsæt som fremgår i tabel 5.1 kan indsættes i GeoGebra
Læs mereStatistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning
Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning Introduktion Kasper K. Berthelsen, Inst f. Matematiske Fag Omfang: 8 Kursusgang I fremtiden
Læs mereMLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som
MLR antagelserne Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som y = β 0 + β 1 x 1 + β 2 x 2 + + β k x k + u, hvor β 0, β 1, β 2,...,β k er ukendte parametere,
Læs mereDANMARKS TEKNISKE UNIVERSITET Side 1 af 17 sider. Skriftlig prøve, den: 19. december 2012 Kursus nr : 02405. (navn) (underskrift) (bord nr)
DANMARKS TEKNISKE UNIVERSITET Side af 7 sider Skriftlig prøve, den: 9. december 0 Kursus nr : 0405 Kursus navn: Sandsynlighedsregning Varighed : 4 timer Tilladte hjælpemidler: Alle Dette sæt er besvaret
Læs mereEksempel på logistisk vækst med TI-Nspire CAS
Eksempel på logistisk vækst med TI-Nspire CAS Tabellen herunder viser udviklingen af USA's befolkning fra 1850-1910 hvor befolkningstallet er angivet i millioner: Vi har tidligere redegjort for at antallet
Læs mereSENIORKURSUS STATA OG BIOSTATISTIK
SENIORKURSUS STATA OG BIOSTATISTIK Aarhus Universitet juni 011 Genopfriskning af statistik Basale tankegange og begreber (i dag) Sammenligninger (i morgen) Sammenhænge (i overmorgen) Brug af programpakken
Læs mere