Statistik i GeoGebra



Relaterede dokumenter
χ 2 -test i GeoGebra Jens Sveistrup, Gammel Hellerup Gymnasium

Skriv punkternes koordinater i regnearket, og brug værktøjet To variabel regressionsanalyse.

Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen

Stastistik og Databehandling på en TI-83

Analyse af en lineær regression med lav R 2 -værdi

Opgave 6. Opgave 7. Peter Harremoës Mat A eksamen med hjælpemidler 25. maj (x + a) 1 /2. dx = 42 løses ved hjælp af GeoGebra CAS: Ligningen 15

Vejledning til WordMat på Mac

Maple. Skærmbilledet. Vi starter med at se lidt nærmere på opstartsbilledet i Maple. Værktøjslinje til indtastningsområdet. Menulinje.

Spørgeskemaundersøgelser og databehandling

Statistik med TI-Nspire CAS version 3.2. Bjørn Felsager September [Fjerde udgave]

Peter Harremoës Matematik A med hjælpemidler 16. december M = S 1 + a = a + b a b a = b 1. b 1 a = b 1. a = b 1. b 1 a = b

For at få tegnet en graf trykkes på knappen for graftegning. Knap for graftegning

Vejledning til GYM17 Copyright Adept Nordic 2013

Lineære sammenhænge, residualplot og regression

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

Peter Harremoës Mat A eksamen med hjælpemidler 21. april 2014

Løsning eksamen d. 15. december 2008

Matematik A. Studentereksamen. Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet

Modul 12: Regression og korrelation

Note om Monte Carlo metoden

Opgave 6. Opgave 7. Peter Harremoës Matematik A med hjælpemidler 26 maj a) Se Bilag 2! b) Variablen n isoleres. L = 2 z 1 α. L = 2 z 1 α L = n =

Undervisningsbeskrivelse

Tema. Dagens tema: Indfør centrale statistiske begreber.

Grupperede observationssæt Deskriptiv statistik: Middelværdi, frekvensfordeling, sumkurve, kvartilsæt, boxplot

Vejledning til Gym18-pakken

Statistik II 4. Lektion. Logistisk regression

Afsnit E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse

Gennemsnit og normalfordeling illustreret med terningkast, simulering og SLUMP()

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Dig og din puls Dig og din puls Side 1 af 17

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Undervisningsbeskrivelse

Modellering af elektroniske komponenter

Løsning til eksamen d.27 Maj 2010

Huskesedler. Anvendelse af regneark til statistik

Forelæsning 11: Kapitel 11: Regressionsanalyse

Regneark Excel fortsat

Analysestrategi. Lektion 7 slides kompileret 27. oktober :24 p.1/17

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kvadratisk regression

TID-data i Excel regneark. Generelt. Forberede tid-data

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

Løsning til eksaminen d. 29. maj 2009

Peter Harremoës Matematik A eksamen med hjælpemidler 25. maj 2016

for gymnasiet og hf 2017 Karsten Juul

Løsning til opgave 7, 9, 10 og 11C Matematik B Sommer 2014

c) For, er, hvorefter. Forklar.

Produkt og marked - matematiske og statistiske metoder

Statistik vejledende læreplan og læringsmål, foråret 2015 SmartLearning

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Excel tutorial om lineær regression

R / RStudio. Intro til R / RStudio

Start Excel Du skal starte med at åbne Excel. I Excel åbner du herefter en tom projektmappe.

Mini AT-forløb om kommunalvalg: Mandatfordeling og Retfærdighed 1.x og 1.y 2009 ved Ringsted Gymnasium MANDATFORDELING

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ

Konfidensintervaller og Hypotesetest

Deskriptiv statistik for hf-matc

Excel regneark. I dette kapitel skal I arbejde med noget af det, Excel regneark kan bruges til. INTRO EXCEL REGNEARK

Peter Harremoës Matematik A eksamen med hjælpemidler 25. maj For at finde ekstrema skal ligningen f (x) = 0 løses. f er differentieret.

Undervisningsbeskrivelse

Deskriptiv statistik. Version 2.1. Noterne er et supplement til Vejen til matematik AB1. Henrik S. Hansen, Sct. Knuds Gymnasium

Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 136

Harald Michalsen og Lasse Storr-Hansen. Log på med administrator rettigheder, så du ser ovenstående hovedmenu

Løsning til eksaminen d. 14. december 2009

Version Harald Michalsen og Lasse Storr-Hansen. Ludus Tplan Ludus. Indholdsfortegnelse INTRODUKTION...2

Brugervejledning til Graph

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

Vejledning i brug af Gym-pakken til Maple

Teknikker til analyse af tal med Excel

Velkommen til Flemmings store Maplekursus 1. lektion. Skift mellem tekst- og matematikmode

Flemmings Maplekursus 1. Løsning af ligninger

Modul 7: Eksempler. 7.1 Beskrivende dataanalyse Diagrammer. Bent Jørgensen. Forskningsenheden for Statistik ST501: Science Statistik

Økonometri Lektion 1 Simpel Lineær Regression 1/31

QR15 Vejledning i at bestemme kvartilsæt og at tegne sumkurver med Nspire, Maple og Geogebra

Forelæsning 9: Inferens for andele (kapitel 10)

Projekt 8.3 Hvordan undersøges om et talmateriale normalfordelt?

Statistik kommandoer i Stata opdateret 22/ Erik Parner

Deskriptiv statistik for matc i stx og hf

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable

Transkript:

Statistik i GeoGebra Peter Harremoës 13. maj 2015 Jeg vil her beskrive hvordan man kan lave forskellige statistiske analyser ved hjælp af GeoGebra 4.2.60.0. De statistiske analyser svarer til pensum Matematik A på HHX. Det er lettest at eksportere via skærmbillede (screen shots, PrtSc). Hvordan figurer i GeoGebra kan exporteres uden tab af figurenes kvalitet, er beskrevet i et separat dokument. GeoGebra er et Java-program og er derfor relativt langsom sammenlignet med f.eks. programmet R, men med de relativt små datasæt, som forekommer i eksamensopgaverne, har dette næppe nogen betydning. Hvis man tager skærmprint fra GeoGebra, skal skærmprintet altid ledsages af lidt forklaring på hvordan diverse udregninger og diagrammer er lavet. I denne vejledning har jeg taget udgangspunkt i brug af sandsynlighedslommeregneren, men tilsvarende udregninger kan også laves i GeoGebras CAS-del. 1 Beregninger for statistiske fordelinger Sandsynligheder for de sædvanligt forekommende sandsynlighedsfordelinger udregnes lettest ved hjælp af GeoGebras sandsynlighedslommeregner. Denne findes under regneark ved at vælge nederste punkt under 2. knap. Man vælger fordeling og dennes parametre. Herefter vælger man om man ønsker sandsynligheden i i et interval begrænset tv., th. eller i begge retninger. I øverste linje Figur 1: Beregning af en normalfordelingssandsynlighed og udregning af 95 % fraktilen for en χ 2 -fordling med 5 frihedsgrader giver værdien 11.07. 1

Figur 2: Histogram i GeoGebra. kan man vælge at eksportere figuren mens beregningerne ikke umiddelbart kan eksporteres. Hvis man skal dokumentere sine beregninger foretaget med sandsynlighedslommeregneren, skal man derfor tage et skærmbillede. Fraktiler for en sandsynlighedsfordeling kan findes ved at vælge at intervallet skal være begrænset med højre hvorefter man intaster sandsynligheden og trykker enter. 2 Indlæsning af data Data er lettest at indlæse ved først at konvertere filen til en tabulatorsepareret tekstfil (efternavn.txt eller.csv). Man åbner tekstfilen med en ASCII-editor og kopierer alt. Hvis curseren placeres i en celle i et regneark og man vælger indsæt, så vil rækker og søjler automatisk blive kopieret korrekt ind i cellerne. Decimalkommaer i tekstfilen vil blive oversat til decimalpunktum i regnearket i GeoGebra. Undgå punktum og semikolon i tekstfilen. 3 Histogrammer Hvis data er indlæst som en søjle, kan man lave histogrammer og andre diagrammer for at illustrere data. Først markeres søjlen. Herfter klikkes på histogram på anden knap. Hvis søjlerne skal være lige bredde, skal man blot vælge antallet af søjler med en skyder. Øverst th. kan man klikke på en knap som giver en menu til at finjustere diagrammet. Det er også muligt at få vælge andre typer af diagrammer, men i den nuværende danske version har diagrammerne ikke de rigtige navne. Hvis man klikker på Søjlediagram, får man et pindediagram og hvis man klikker på Kvartilplot, så får man et normalfordelingsplot. 2

4 Fraktiler Data lægges ind i regnearket og data markeres. Her er det vigtigt, at eventuelle overskrifter ikke markeres. Herefter trykkes på knappen Lav liste {1,2}. Med kommandoen Percentil i CAS-vinduet kan man nu udregne den ønskede fraktil ved at indtaste det navn man har givet listen samt fraktilen skrevet som decimaltal. 5 Regression Værdierne af to variable indlæses som søjler i et regneark. Begge søjler markeres og man vælger 2. knap og 2 variable regressionsanalyse. Hvis man vælger statistik kommer diverse nøgletal for regressionsanalysen frem. Betegnelse i GeoGebra Standardbetegnelse i matematik MiddelX Gennemsnit af x-værdierne MiddelY Gennemsnit af y-værdierne Sx Estimeret standardafvigelse af x-værdierne Sy Estimeret standardafvigelse af y-værdierne r Korrelationskoefficienten ρ Spearmans rang-korrelation Sxx n gange variansen af x-værdierne Syy n gange variansen af y-værdierne Sxy n gange kovariansen af xy-værdierne R 2 Determinationskoefficienten R 2 SSE Residualsummen Desværre er det ikke muligt at beregne et konfidensinterval for regressionskoefficienten a direkte ved hjælp af GeoGebra. I stedet kan konfidensintervallet beregnes som â ± t n 2 sâ. Her er t n 2 betegnelsen for 1 α /2 fraktilen af en t-fordeling med n 2 frihedsgrader. Hvis vi f.eks. skal udregne et 95 % konfidensinterval er α = 0.05 og man skal beregne 0.975 fraktilen af t-fordelingen. Denne kan beregnes CAS som vist på Figur 5. Størrelsen sâ er standardfejlen, som lettest beregnes ved beregnes ved formlen ( 1 R 2 )1/2 sâ = â R 2. (n 2) 3

Figur 3: Bestemmelse af 62 % fraktilen af et datasæt. 4

Figur 4: Lineær regression. Figur 5: Beregning af fraktilen for en t-fordeling med 34 frihedsgrader svarende til regression for 36 punkter. Et et 95 % konfidensniveau svarer til et signifikansniveau på α = 5% så vi skal finde fraktilen 1 α /2 = 0.975. 5

Figur 6: Eksemplet stammer fra Mat B Øvelse 21 på s. 327. 6 Tests og konfidensintervaller med sandsynlighedslommeregneren 6.1 χ 2 -test for uafhængighed Data optælles med en pivottabel i Excel, Open Office Calc eller andet regnearksprogram. Vælg Chi_i_anden Test i rullemenuen. Man vælger matricens størrelse og skriver tallene ind manuelt. GeoGebra udregner søjletotaler men pussigt nok ikke rækketotaler som vist på Figur 6. Hvis man også ønsker en tabel over forventede værdier og bidragene til χ 2 -teststørrelsen, hakkes disse af som vist til højre på Figur 6. 6.2 Konfidensinterval for middelværdi Data sættes ind i et regneark hvorefter man vælger statistek for en variabel. Der kommer et diagram frem og man vælger Vis statistik (knappen x). Hvis standardafvigelsen estimeres ud fra data, vælges T estimat af middel i stedet for Statistik som vist på figur 7. Hvis standardafvigelsen er givet i opgaveformuleringen, så vælges Z estimat af middel. Det er er også muligt at beregne t-intervaller og z-intervaller ved hjælp af sandsynlighedslommeregnerens statistikdel. 6

Figur 7: I dette eksempel er både middelværdi og standardafvigelsen estimeret, og vi bruger T estimat af middel. 7

Figur 8: Beregning af z-interval. 8

Figur 9: Konfidensinterval for andel. 6.3 Konfidensinterval for andel I GeoGebra kaldes dette proportion, men uanset hvad det kaldes, er der tale om estimation af den ukendte sandsynlighedsparameter i en binomialmodel. Man åbner sandsynlighedslommeregneren, skifter til Statistik og vlger Z estimat på proportion. Herefter vælges konfidensniveau, det observerede antal successer samt det samlede antal observationer, hvorefter GeoGebra returnerer et konfidensinterval for den ukendte sandsynlighedsparameter p som vist på Figur 9. 9