Stastistik og Databehandling på en TI-83



Relaterede dokumenter
Tema. Dagens tema: Indfør centrale statistiske begreber.

Statistik i GeoGebra

Konfidensintervaller og Hypotesetest

Eksamen i Statistik for biokemikere. Blok

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Note til styrkefunktionen

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Afsnit E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse

Ovenstående figur viser et (lidt formindsket billede) af 25 svampekolonier på en petriskål i et afgrænset felt på 10x10 cm.

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Løsning eksamen d. 15. december 2008

Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen

Module 4: Ensidig variansanalyse

Statistik II 4. Lektion. Logistisk regression

Analysestrategi. Lektion 7 slides kompileret 27. oktober :24 p.1/17

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Løsning til eksamen d.27 Maj 2010

Produkt og marked - matematiske og statistiske metoder

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1

Løsning til eksaminen d. 29. maj 2009

Note om Monte Carlo metoden

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Opgaver til kapitel 3

Matematisk Modellering 1 Cheat Sheet

Vejledende besvarelser til opgaver i kapitel 14

Simpel Lineær Regression

Skriftlig eksamen Science statistik- ST501

Løsning til eksaminen d. 14. december 2009

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

Appendiks Økonometrisk teori... II

Økonometri: Lektion 4. Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater

Kvantitative Metoder 1 - Forår 2007

Undervisningsbeskrivelse

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

Brug af TI-83. Løsning af uligheder: Andre ikke simple uligheder løses ved følgende metode - skitseret ved et eksempel : Løs uligheden

PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006

Model. (m separate analyser). I vores eksempel er m = 2, n 1 = 13 (13 journalister) og

Landmålingens fejlteori - Lektion 2 - Transformation af stokastiske variable

Vejledende besvarelse af eksamen i Statistik for biokemikere, blok

Nanostatistik: Opgaver

Vejledning til GYM17 Copyright Adept Nordic 2013

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression

Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet

Økonometri Lektion 1 Simpel Lineær Regression 1/31

Modul 12: Regression og korrelation

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge

Skriftlig Eksamen ST501: Science Statistik Mandag den 11. juni 2007 kl

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger

Forelæsning 9: Inferens for andele (kapitel 10)

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper.

2 -test. Fordelingen er særdeles kompleks at beskrive med matematiske formler. 2 -test blev opfundet af Pearson omkring år 1900.

Vejledning til Gym18-pakken

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning

Konfidensinterval for µ (σ kendt)

Reminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

Kapitel 7 Forskelle mellem centraltendenser

Statistik viden eller tilfældighed

VIDEREGÅENDE STATISTIK

Kvantitative Metoder 1 - Forår Dagens program

Matematik A. Studentereksamen. Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Hvad er danskernes gennemsnitshøjde? N = 10. X 1 = 169 cm. X 2 = 183 cm. X 3 = 171 cm. X 4 = 113 cm. X 5 = 174 cm

MPH specialmodul Epidemiologi og Biostatistik

Dagens Emner. Likelihood teori. Lineær regression (intro) p. 1/22

Transkript:

Stastistik og Databehandling på en TI-83 Af Jonas L. Jensen (jonas@imf.au.dk). 1 Fordelingsfunktioner Husk på, at en fordelingsfunktion for en stokastisk variabel X er funktionen F X (t) = P (X t) og at variable med samme fordeling har samme fordelingsfunktion. Disse kan vi finde på vores TI-83 (eller lignende) ved hjælp af cdf-kommandoerne, der findes under DISTR (2nd + VARS). Det gør vi på følgende måde Normalfordeling Lad X N(µ, σ 2 ). Så er F X (x) = normalcdf( 10 99, x, µ, σ 2 ) Hvis i vil finde P (a X b) gøres det på følgende måde P (a X b) = normalcdf(a, b, µ, σ 2 ) t-fordeling Lad X t[f]. Så er F X (x) = tcdf( 10 99, x, f) χ 2 -fordelingen Lad X χ 2 [f]. Så er F X (x) = χ 2 cdf(0, x, f) F-fordelingen Lad X F [r, s]. Så er F X (x) = F cdf(0, x, r, s) Binomial-fordelingen Lad X binomial(n, p). Så er F X (x) = binomcdf(n, p, x) Man kan også finde sandsynlighedsfunktionen P (X = x) = binompdf(n, p, x). Possion-fordelingen Lad X poisson(λ). Så er F X (x) = poissoncdf(λ, x) Man kan også finde sandsynlighedsfunktionen P (X = x) = poissonpdf(λ, x). 1

2 Data På TI-83 eren har man muligheden for at gemme en masse data, for derefter at analysere det. Tryk STAT og derefter Edit... Nu kan du flytte rundt, og fylde data i dine lister. Her vil jeg henvise til manualen (12-20). Når vi har indtastet data, er vi klar til at analysere. Tryk STAT og tryk en gang til højre så vi er i menuen CALC. Vælg nu 1:1-Var-Stats, og indtast så hvilken liste vi havde vores data i. Hvis det fx var i L 1, så tryk 2nd+1. Tryk nu på enter. Nu dukker der en masse op. Bl.a. x (skønnet af middelværdien), Σx (summen af data), Σx 2 (summen af data i anden), Sx (skøn af standardafvigelsen, denne kalder vi normalt s), samt Med (medianen). Hvis i har to lister med observationer, kan i vælge 2:2-Var-Stats, og så indtaste en 2 lister adskilt af, og derefter trykke enter. Så får i noget tilsvarende. 3 Test og konfidensintervaller Man kan lave test både ud fra data man har i en liste, eller ud fra udregnede estimatorer. Vi vil nu følge Jens noter Estimation og test: katalog. Alle de statistik-kommandoer vi refererer til, ligger under STAT, under menuen TESTS. Jeg vil her angive, hvilke kommandoer på lommeregneren, der svarer hvilke test i Jens noter. Men først en smule info om, hvordan man gør. I alle test kan man øverst vælge mellem DATA og STATS. Forskellen er om man har data i en liste, eller om man bare kender nogle estimater. Derefter skal i enten indtaste jeres hypoteseværdi, samt enten data eller estimater. Læg mærke til, at i skal angive estimatet for spredningen (dvs. s) og ikke estimatet for variansen (s 2 ), men det kan jo klares med en lille kvadratrod. Til sidst skal i vælge jeres alternativ-hypotese. Når i skal finde konfidensintervaller, gøres det på nogenlunde samme måde, hvor i så også skal vælge jeres 1 α under C-level. Som regel er denne 0.95. Jeg vil her gennemgå hvordan i gør i par tilfælde. 3.1 Normalfordeling: Teste µ = µ 0, σ 2 kendt Vælg 1:Z-Test... Nu kan du vælge at bruge enten indtastet data (Data) eller indtaste dine estimationer (Stats). Lad os tage et par eksempler Data (opg 10.3) Tast nu vores 18 observationer ind i liste L 1 som beskrevet i afsnittet Data. Gå nu ind under 1:Z-Test... og vælg menuen Data. Nu skal vi indtaste µ 0 og vores kendte spredning σ (læg mærke til, at det er σ, og ikke σ 2 ). Under List skal i vælge i hvilken liste jeres data er - i vores tilfælde L 1. Freq skal være 1. Under µ: skal i vælge hvad jeres alternativ-hypotese skal være, som regel µ µ 0. Når alt dette er på plads skal i flytte cursoren ned til Calculate og trykke enter. Nu får udregnet følgende Teststatistikken: z = 1.6 p-værdien: p =.1095985788 Gennemsnittet: x = 25.05333333 2

Estimat for σ: Sx =.1373274318 I dette tilfælde er vores p-værdi større end 0.05, så vi kan acceptere vores hypotese. Stats (opg 10.3) Dette gøres på nøjagtigt samme måde som ovenfor bortset fra, at man skal indtaste gennemsnittet ( x) istedet for sin liste. Så indtast som ovenfor, men skriv x = 25.05333333, og vælg Calculate. I skulle nu gerne få samme output som ovenfor, bortset fra at den ikke estimerer spredningen. I kan finde konfidensintervallet under 7:ZInterval... Med α = 0.05 fårmed data fra opg 10.3 dette output: (24.961,25.146). 3.2 Normalfordeling: Teste µ = µ 0, σ 2 ukendt Dette gør man under 2:T-Test... Fremgangsmåden er nøjagtig som i afsnittet med ukendt varians, udover at man ikke skal indtaste spredningen under Data, og at man skal indtaste sit estimat for spredningen under Stats. Hvis man indtaster data fra opg 10.3 får man følgende output Teststatistikken: t = 1.647698257 p-værdien: p =.117772002 Gennemsnittet: x = 25.05333333 Estimat for σ: Sx =.1373274318 Her findes konfidensintervallet under 8:TInterval... 3.3 Normalfordeling: Teste σ 2 = σ 2 0 Dette kan desværre ikke gøres på en TI-83, men i kan stadig få hjælp til jeres udregninger, da men fx kan finde F χ 2 [n 1]((n 1)v) ved at skrive χ 2 cdf(0, (n 1) v, n 1) (beskrevet i afsnittet om fordelingsfunktioner). 3.4 Binomialfordelingen: Teste p = p 0 Dette gøres med 5:1-PropZTest. Nu skal vi indtaste vores p 0, vores observation x og n, samt vælge alternativ-hypotesen. Eksempel: opg. 10.5 Her er p 0 = 0.008, x = 11 og n = 800. Vores alternativhypotese er p p 0. Tryk nu calculate, så skulle i gerne få følgende output Teststatistikken: z = 1.825626826 p-værdien: p =.0679063762 Gennemsnittet: ˆp = 0.01375 Antal elementer n = 800 let findes her med A:1-propZInt... 3

3.5 To normalfordelinger: teste µ 1 = µ 2, σ 2 x = σ 2 y Til dette skal i bruge 3:2-SampTTest... Læg mærke til, at i skal indtaste data eller estimater for to observationer. Her skal i vælge Yes ved Pooled, da vi kan antage at varianserne er ens. Brug 0:2-SampTInt... 3.6 To normalfordelinger: teste µ 1 = µ 2, σ 2 x σ 2 y Her skal i, som ovenfor, bruge 3:2-SampTTest..., men her skal i så vælge No ved Pooled. Brug 0:2-SampTInt... 3.7 To normalfordelinger: teste σ 2 x = σ 2 y Her skal vi bruge D:2-SampFTest... 3.8 To binomialfordelinger: teste p 1 = p 2 Dette gøres med 6:2-PropZTest... Ofte får i angivet ˆp 1 og ˆp 2, men i testen skal i skrive det observerede antal x 1 og x 2. Dem kan i naturligvis finde ved og så runde af til et helt tal. x i = ˆp i n i Brug B:2-PropZInt... 3.9 To binomialfordelinger: log odds ratio Den kan ikke laves på en TI-83. 3.10 Lineær regression: teste hældning Dette gøres med E:LinRegTTest... Her kan vi kun teste β = 0, men det er som regel også det i skal teste. Læg mærke til, at jeres X-lister og Y-lister passe sammen, dvs. at første indgang i X-listen skal svare til første indgang i Y-listen osv. Se bort fra, at der står noget med ρ under alternativ-hypotesen. Lad os lige tage opg. 14.6 som et eksempel. Opg 14.6 Indtast husstørrelserne (x i erne) i L 1 og og huspriserne (y i erne) i L 2. Under E:LinRegTTest... sætter i nu Xlist til L 1 og Ylist til L 2. Alternativhypotesen skal være β 0. Tryk nu Calculate. Så skulle i gerne få følgende output t = 5.542802202 (teststatistikken) p =.0014557765 (p-værdien) df = 6 (dette er bare n 2) 4

a =.0893521966 (dette er ˆγ) b =.0106478034 (dette er ˆβ) s =.1244496227 (dette er vores spredningsestimat s) Da p-værdien er under 0.05, kan vi forkaste vores hypotese om β = 0, så der er altså en lineær sammenhæng mellem huspriser og husstørrelser. 3.11 Andre lineær regressions test Det kan vi desværre ikke på en lommeregner. Men til udregning af p-værdierne, kan vores afsnit om fordelingsfunktioner være til nytte. 4 Lineær regression Når i har en liste med x erne og en liste med y erne, kan i lave lineær regression på jeres lommeregner. Det ved at trykke STAT, vælge CALC og så trykke 4:LinReg(ax+b). Nu skal du indtaste din X-liste hhv. Y-liste adskilt af,. Lad os tage opg. 14.6 som et eksempel. Indtast huspriserne under L 2 og størrelserne under L 1. Vælg så 8:LinReg(ax+b) som beskrevet ovenfor, og tryk L1,L2. Nu skulle der gerne stå LinReg(a+bx) L1,L2. Tryk nu enter. Nu får vi følgende output a =.0893521966 (dette er vores ˆγ) b =.0106478034 (dette er vores ˆβ) Se i øvrigt også 3.10 om regressionstest. 5 Afsluttende bemærkninger For god ordens skyld skal jeg vel lige sige, at bare fordi ens lommeregner kan så mange fine ting, er det ingen undskyldning for ikke at forstå stoffet. Hvis i har kommentarer eller tilføjelser, kan i sende dem til jonas@imf.au.dk. 5