Normalfordeliger For at e stokastisk variabel X ka være ormalfordelt, skal X agive værdie af e eller ade målig, f.eks. tid, lægde, vægt, beløb osv. Notatioe er: Xi ~ N( μ, σ hvor i er observatiosummeret, som løber fra til stikprøvestørrelse, X i er de i te observatio, μ er middelværdie, og σ er variase. Normalfordelige er til forskel fra de hypergeometriske fordelig, biomial- og poissofordelige kotiuert, hvilket betyder, at observatioere ka atage alle værdier. De tre adre fordeliger kaldes diskrete, og de tæller alle tre et atal gage, oget idtræffer. Normalfordelige er e empirisk fordelig, dvs. de har ige forudsætiger. Ma ka blot vise, at mage observatioer følger dee fordelig. Dette vises ved at afbilde de ordede observatioer imod fraktiler fra de stadardiserede ormalfordelig. Dette kaldes et ormalfordeligsdiagram, fraktilplot eller et probitdiagram. Hvis puktere i diagrammet tilærmelsesvis følger e ret liie med e kocetratio af pukter omkrig midte af liie, har ma godtgjort, at det er rimeligt at atage, at observatioere stammer fra e ormalfordelig. Der fides e lieær sammehæg mellem to vilkårlige ormalfordeliger, hvilket betyder, at ma ku behøver at tabellægge é ormalfordelig. Ma kommer således ikke ud for, at skulle approksimere fra e ormalfordelig til oget adet. Ma har valgt at tabellægge ormalfordelige med middelværdi og varias. Dee kaldes de stadardiserede ormalfordelig, og fordeligsfuktioe fides i Erlag S på side og 3. Middelværdie μ kaldes også forvetige eller geemsittet (selvom det ikke er helt korrekt, og de fortæller oget om observatioeres værdi. Det er derfor ofte middelværdie, der bliver spurgt om, og som skal estimeres, testes osv. Spredige (eller stadardafvigelse σ eller variase σ fortæller oget om variatioe i data, altså hvor forskellige værdiere er. Dette er i virkelighede midst lige så iteressat, f.eks. ved kvalitetskotrol, hvor ma skal have e esartet produktio (dvs. lille varias og er ligeglad med iveauet (altså middelværdie. COMPLET A/S SIDE 7 OPGAVESAMLING I STATISTIK
E ormalfordelt stikprøve I et større vekselerfirma i Købehav har ma lavet e udersøgelse af forskellige ivesterigsobjekter. For forskellige aktier blev det procetvise udbytte i 995 registreret. Resultatet blev: 6,; 3,; 7,8; 9,8; 6,8;,9;,; 9,;,9;,; 5,; 6,7; 4,; 9,4; 7,; 6,; 9,;,4; 8,7 og, hvor Σaktieudbytte = 6,4 og Σaktieudbytte = 5,8 Grudlæggede spørgsmål. Opstil e model til beskrivelse af det foreliggede materiale, og kotrollér de.. Aflæs de grafiske estimater på modelles parametre, og beyt disse i de to efterfølgede spørgsmål. 3. Estimér sadsylighede for, at e tilfældigt udvalgt aktie giver et udbytte på midst 3%. 4. Estimér sadsylighede for, at e tilfældigt udvalgt aktie giver et udbytte mellem % og 5%. Middelsvære spørgsmål 5. Pukt- og itervalestimér modelles parametre. 6. E ivestor øsker at ivestere mio. kr., som hu skal låe i bake. Omkostigere i forbidelse med etablerige og forretige af lået i det første år skøes til.,- kr. Opstil et kofidesiterval for de forvetede fortjeeste det første år. 7. Udersøg, om det bedre kue betale sig at ivestere i obligatioer, der i samme periode havde et udbytte på %. 8. Udersøg, om usikkerhede ved udersøgelse (dvs. stadardafvigelse ka være 4. Svære spørgsmål 9. Bereg styrke til teste i spørgsmål 7 i %.. Fastlæg e y stikprøvestørrelse, hvis styrke skal være midst 97%. COMPLET A/S SIDE 7 OPGAVESAMLING I STATISTIK
Løsig til Grudlæggede spørgsmål Der er her tale om måliger, og ma ka se, at observatioere ikke er heltallige. Ma ka forestille sig, at der er e middelforretig, og at observatioere vil fordele sig symmetrisk omkrig dee. De adre spørgsmål omhadler middelværdi og varias (eller spredig, som jo etop er ormal-fordeliges parametre.. Lad X i være uafhægige stokastiske variable, der agiver forretige af aktie i. Da må der gælde: X i ~ N( μ, σ hvor i løber fra til. Ma ka opstille følgede skema, hvor observatioere er ordet efter størrelse, og der er udreget hjælpestørrelse (i-,5/. Vha. disse værdier ka ma ete slå u- fraktilere op ved at gå baglæs id i ormalfordelige eller bruge fuktioe stadardormiv i Excel på værdiere. Observatiosr. i Ordede observatioer (i-,5 u-fraktiler 6,,5 -,96 6,7,75 -,4395 3 7,,5 -,53 4 7,8,75 -,9346 5 8,7,5 -,7554 6 9,,75 -,5978 7 9,,35 -,4538 8 9,4,375 -,386 9 9,8,45 -,89,,475 -,67,9,55,67,9,575,89 3,,65,386 4,,675,4538 5,4,75,5978 6 3,,775,7554 7 4,,85,9346 8 5,,875,53 9 6,,95,4395 6,8,975,96 Afbilder ma så u-fraktilere mod de ordede observatioer, skal puktere gere fordele sig omkrig e ret liie. På grafe ligger puktere fit omkrig e ret liie, så ma ka atage, at observatioere stammer fra e ormalfordelig. COMPLET A/S SIDE 73 OPGAVESAMLING I STATISTIK
4 Normalfraktildiagram - 5 5 5-4 Udbytte. Det grafiske estimat på middelværdie μ ka aflæses, som x-værdie til skærigspuktet mellem de rette liie og x-akse. Ma ka aflæse estimatet til ca.,5. Det grafiske estimat på middelværdie μ plus spredige σ ka aflæses, som x- værdie til puktet med y-værdi. y = er idteget, og ma ka aflæse estimatet til ca. 4. Trækker ma herfra estimatet på middelværdie μ, som lige blev aflæst til,5, får ma 3,5, hvilket er estimatet på spredige σ. Variase σ estimeres så til ca.,5. Note om trasformatioer Hvis puktere i ormalfraktildiagrammet udviser e tydelig krum tedes (svarede til e højreskæv fordelig, som ka ses i et histogram, bør ma trasformere data vha. e logaritmefuktio. Normalfraktildiagram Histogram Logaritmefuktioer uderpresser store observatioer, hvilket vil få ormalfraktildiagrammet til at blive mere lieært og histogrammet mere symmetrisk. Højreskæve fordeliger ses ofte, f.eks. år ma betragter acieitet, alder og omsætig, da ige af disse størrelser ka blive egative. COMPLET A/S SIDE 74 OPGAVESAMLING I STATISTIK
3. Når ma skal berege sadsyligheder i e ormalfordelig, skal ma først trasformere si værdi og så slå op i de stadardiserede ormalfordelig. Dette gøres vha. regereglere for sadsyligheder på side Fejl! Ukedt argumet for parameter.: x μ P(X x = Φ( og σ x μ P(X x = Φ( σ Aderse m.fl. s., Newbold s., Løborg s. 5 Bemærk, at da ormalfordelige er kotiuert, skal ma ikke som i de adre fordeliger trække fra si værdi x. Ved idsættelse får ma: 3,5 P (X 3 = Φ( = Φ(,743 = -,765 =,3885 3,5 Dvs. ca. 4% af aktiere giver et udbytte på midst 3%. 4. På ligede måde fider ma: P(x X x x μ x μ = Φ( Φ( σ σ Aderse m.fl. s., Newbold s., Løborg s. 5 Ved idsættelse får ma: 5,5,5 P( X 5 = Φ( Φ( = Φ(,857 - Φ( -,49 3,5 3,5,947 -,44433 =,4574 Dvs. kap 46% af aktiere giver et udbytte mellem % og 5%. = COMPLET A/S SIDE 75 OPGAVESAMLING I STATISTIK
Løsig til Middelsvære spørgsmål 5. I dette spørgsmål skal ma fide de umeriske estimater, og altså ikke aflæse værdiere på ormalfordeligsdiagrammet. Estimatere bereges ved: μ ˆ = x = x i og i= Aderse m.fl. s. 67, Newbold s. 7, Løborg s. 44 σ ˆ = s = i= (x i x = ( i= Aderse m.fl. s. 68, Newbold s. 44, Løborg s. 45 x i x = ( i= x i ( i= x i x kaldes geemsittet, og s kaldes de empiriske varias. Ved idsættelse får ma: μ ˆ = x = 6,4 =,8 og σ ˆ = s = 6,4 (5,8 = 9,469 (--itervalestimat (eller kofidesiterval for μ med =,5: μˆ ± u σ hvis de sade varias σ er kedt, hvad de sjældet er. Aderse m.fl. s., Newbold s. 78, Løborg s. 58 Husk, at Newbold kalder u-fraktilere for z. Dette kofidesiterval ka også bereges ved at vælge fuktioe kofidesiterval i Excel. Når de sade varias σ ikke er kedt og derfor estimeret vha. de empiriske varias s, skal ma i stedet beytte følgede formel: μˆ ± t ( s hvor t ( er e fraktil i t-fordelige. Aderse m.fl. s. 4, Newbold s. 86, Løborg s. 58 COMPLET A/S SIDE 76 OPGAVESAMLING I STATISTIK
Ved idsættelse får ma: μ ˆ ± t ( s,8 ±,4354 = =,8 ± t,5 [ 9,3846;,554] ( 9,469 =,8 ±,93,6858 = hvor ( = t (9 =, 93 er aflæst i tabelle på side 54 i Erlag S. t,5, 975 Itervallet agiver, at middelforretige med 95% sikkerhed vil være mellem ca. 9,4% og ca.,3%. Hvis det er store stikprøver (dvs. >, bliver det midre og midre vigtigt at skele mellem de to typer kofidesitervaller for middelværdie. (--itervalestimat (eller kofidesiterval for σ med =,5: ( s ( s ; hvor χ ( χ ( χ ( Newbold s. 98, Løborg s. 9 er e fraktil i χ -fordelige. Ved idsættelse får ma: ( s ( s ( 9,469 ; ( ( = χ χ,5 ( χ 78,73 78,73 ; = [ 5,448;,596] 3,85 8,9 ; ( 9,469 78,73 78,73 = ; = χ,5 ( χ,975 (9 χ,5 (9 hvor χ -fraktilere er fudet på side 38 og 39 i Erlag S. Itervallet agiver, at variase på forretige med 95% sikkerhed ligger mellem ca. 5,4% og ca.,%. Ehedere for variase skal være opløftet i ade potes, da ma har kvadreret observatioere. Tager ma kvadratrode til disse tal fider ma kofidesitervallet for spredige eller stadardafvigelse σ: ( s χ ( ; ( s χ ( COMPLET A/S SIDE 77 OPGAVESAMLING I STATISTIK
Ved idsættelse får ma: [ 5,448 ;,596] = [,336; 4,4788] dvs. med 95% sikkerhed ligger spredige på forretige mellem ca.,3% og ca. 4,5%. 6. Lad Y være e y stokastisk variabel, der agiver fortjeeste det første år. Der må da gælde: Y =.. X%. Dette er e lieær trasformatio, og for disse gælder: E(Y =.. E(X%. Aderse m.fl. s. 97, Newbold s. 88 Når ma så skal fide kofidesitervallet for de forvetede fortjeeste E(Y, ka ma i oveståede formel idsætte edre og øvre kofidesgræse for de forvetede forretig E(X. Ved idsættelse får ma: [.. 9,3846%.;..,554%.] = [ 838.46;.5.54] dvs. med 95% sikkerhed vil de forvetede fortjeeste det første år være mellem ca. 84.,- kr. og ca..3.,- kr. 7. Ma skal her afgøre e påstad om, at det bedre ka betale sig at ivestere i obligatioer. Ma skal altså teste e hypotese: Hypotese: H : μ = H : μ < Aktier og obligatioer er lige gode. Det ka bedre betale sig at ivestere i obligatioer. Bemærk, at μ er middeludbyttet for aktiere. Teststørrelse: Ligesom ved kofidesitervallet har ma også to teststørrelser for middelværdie afhægig af, om de sade varias er kedt eller ukedt og derfor estimeret. Som regel er de sade varias ukedt, og de empiriske varias er udreget. COMPLET A/S SIDE 78 OPGAVESAMLING I STATISTIK
X μ X μ U = = σ σ N(, hvis de sade varias er kedt Aderse m.fl. s. 83, Newbold s. 33 X μ X μ T = = s s t( hvis de sade varias σ er ukedt. Aderse m.fl. s. 87, Newbold s. 339, Løborg s. 54 Observeret værdi: Da de sade varias er ukedt, beyttes T-teststørrelse. t = x μ s =,8 9,469 =,76 Kritisk værdi: t ( hvis H er ekeltsidet t ( hvis H er dobbeltsidet Da H er ekeltsidet, og med =,5, får ma ved tabelopslag på side 54 i Erlag S: t ( = t,5 ( = t, 95 (9 =,79 t-fordelige er symmetrisk lige som ormalfordelige, så dee værdi skal forstås både positivt og egativt. COMPLET A/S SIDE 79 OPGAVESAMLING I STATISTIK
t-fordelige Observeret værdi -,7-6 -4-4 6 Kritisk værdi Kritisk værdi Koklusio: Da de umeriske værdi af de observerede værdi af teststørrelse er midre ed de kritiske værdi for teststørrelse, ka ma ikke forkaste hypotese, dvs. obligatioere er ikke sigifikat bedre at ivestere i. Det skal dog bemærkes, at de observerede værdi og de kritiske værdi æste er idetiske, og derfor er koklusioe meget iveaufølsom. Det betyder, at med et adet iveau havde ma ok fået e ade koklusio. De samlede koklusio må derfor være, at ma ikke rigtigt ka kokludere oget. Hvis ma hellere vil berege sigifikassadsylighede, får ma et problem pga. tabelles opbygig. I e t-fordelig ka ma ikke umiddelbart fide sadsyligheder, me ku fraktiler. Vha. disse ka ma så tilærmelsesvis bestemme sigifikas-sadsylighede. Alterativt ka ma berege sigifikassadsylighede i Excel vha. fuktioe tfordelig. Sigifikassadsylighed: p = P(T t hvis H : μ < μ p = P(T t hvis H : μ > μ p = P(T t hvis H : μ μ Aderse m.fl. s. 88, Newbold s. 339, Løborg s. 68 Alle T-teststørrelser behadles på samme måde. Her skal ma beytte de første: p = P(T t COMPLET A/S SIDE 8 OPGAVESAMLING I STATISTIK
Ved idsættelse får ma: p = P(T,7 T ~ t( I tabelle på side 54 i Erlag S uder 9 frihedsgrader ka ma aflæse, at,7 ligger mellem 9%-fraktile (=,38 og 95%-fraktile (=,79. Da t-fordelige er symmetrisk, må det betyde, at sigifikassadsylighede ligger mellem - 95% = 5% og -9% = %. I Excel skal ma idsætte fuktioe tfordelig, agive x-værdie til,76, at der er 9 frihedsgrader, og at sadsylighede skal bereges e-sidet. Herved får ma værdie,58, som viser, hvor iveaufølsom koklusioe er. Da sigifikassadsylighede p er større ed iveauet, bliver koklusioe stadig, at obligatioere ikke er sigifikat bedre at ivestere i ed aktiere. 8. På samme måde som før rummer spørgsmålet e påstad. Dee gag om stadard-afvigelse ka være 4. Ma skal altså teste e hypotese: Hypotese: H : σ = 4 Stadardafvigelse ka godt være 4. H : σ 4 Stadardafvigelse er sigifikat forskellig fra 4. Teststørrelse: ( s Q = σ χ ( Aderse m.fl. s. 9, Newbold s. 344, Løborg s. 85 Observeret værdi: ( 9,469 78,73 q = = =,77 4 6 Kritisk værdi: χ ( hvis H : σ < σ χ ( hvis H : σ > σ χ ( og χ ( hvis H : σ σ Newbold s. 345, Løborg s. 88 Da hypotese er dobbeltsidet, og χ -fordelige ikke er symmetrisk, skal ma både fide e edre og e øvre kritisk værdi som i de tredje formel. Med =,5 får ma ved tabelopslag på side 38 i Erlag S: COMPLET A/S SIDE 8 OPGAVESAMLING I STATISTIK
Nedre værdi: ( = χ ( = 8, 9 χ χ,5 Øvre værdi: ( = χ ( = 3, 85,975 Chi -fordelig med 9 frihedsgrader Observeret værdi,7 3 4 5 Kritisk værdi Kritisk værdi Koklusio: Da de observerede værdi af teststørrelse ligger mellem de edre og de øvre kritiske værdi for teststørrelse, ka ma ikke forkaste hypotese, dvs. stadardafvigelse er ikke sigifikat forskellig fra 4. Det skal dog bemærkes, at de observerede værdi og de edre kritiske værdi er sammeligelige og derfor er der måske baggrud for at hævde, at koklusioe er iveaufølsom. Dee koklusio er i øvrigt i overesstemmelse med kofidesitervallet for variase eller stadardafvigelse fudet i spørgsmål 5. Hvis ma hellere vil berege sigifikassadsylighede, får ma ige et problem pga. tabelles opbygig. I e χ -fordelig ka ma ikke umiddelbart fide sadsyligheder, me ku fraktiler. Vha. disse ka ma så tilærmelsesvis bestemme sigifikassadsylighede. Alterativt ka ma berege sigifikassadsylighede i Excel vha. fuktioe chifordelig. Sigifikassadsylighed: p = P(Q q hvis H : σ < σ p = P(Q q hvis H : σ > σ p = mi{p(q q;p(q q} hvis H : σ σ Aderse m.fl. s. 9, Løborg s. 9 Da hypotese er dobbeltsidet, skal ma beytte de tredje formel. Her er det e fordel først at overveje, hvilke sadsylighed, der er midst. På figure med χ -fordelige, de kritiske værdier og de observerede værdi ka ma se, at det må være P(Q q, der er de midste. COMPLET A/S SIDE 8 OPGAVESAMLING I STATISTIK
Ved idsættelse får ma: p = P(Q,77 Q ~ χ ( I tabelle på side 38 i Erlag S uder 9 frihedsgrader ka ma aflæse, at,77 ligger mellem 5%-fraktile (=, og %-fraktile (=,65. Dette må betyde, at sigifikassadsylighede ligger mellem 5% = % og % = %. I Excel skal ma agive x-værdie til,77, og at der er 9 frihedsgrader. Herved får ma værdie,98, som agiver P(Q q. Dee værdi skal så trækkes fra og gages med. Hermed får ma sigifikassadsylighede til,64. Koklusioe er selvfølgelig de samme, at ma ikke ka forkaste H, me at ma ka se, at de ikke er særlig iveaufølsom. Løsig til Svære spørgsmål 9. Dette spørgsmål skal forstås i sammehæg med spørgsmål 7. Styrke er sadsylighede for at afvise, at middelværdie er, hvis de faktisk er. Styrke i μ = ka bereges vha. følgede formel: μ μ η( μ = Φ u hvis H s : μ < μ eller μ > μ μ μ μ μ η( μ + Φ = Φ u u hvis H s s : μ μ Aderse m.fl. s. 95, Newbold s. 369 Da hypotese er ekeltsidet, skal ma beytte første formel. Ved idsættelse får ma: η ( = Φ(,645 = Φ(,7 =,89796 9,469 Dvs. med ca. 9% sadsylighed ville ma kue afvise, at middelværdie er, hvis de faktisk ku er.. Hvis ma vil have e større styrke, må ma have e større stikprøvestørrelse, som ka bereges vha. følgede formel: (uη ( μ + u μ s hvis H : μ < μ eller μ > μ COMPLET A/S SIDE 83 OPGAVESAMLING I STATISTIK
(u + u η ( μ μ Aderse m.fl. s. 96 s hvis H : μ μ Da hypotese er ekeltsidet, skal ma beytte første formel. Ved idsættelse får ma: (u,97 + u,5 ( 9,469 = (,885 +,645 4 9,469 = 9,3 hvor u,97 er aflæst baglæs i tabelle på side 3 i Erlag S. Da stikprøvestørrelse skal være heltallig, ruder ma op til 3. Uder forudsætig af at alt adet er rimeligt kostat, betyder dette, at hvis ma udtager e stikprøve på 3 objekter, vil ma have e sadsylighed på midst 97% for at opdage, at middelværdie ikke er, hvis de faktisk er. Omvedt betyder det, at der højst er 3% sadsylighed for fejlagtigt at acceptere, at middelværdie er, hvis de faktisk er. COMPLET A/S SIDE 84 OPGAVESAMLING I STATISTIK