Aktivitetsmappe for introkurset til Naturvidenskabeligt grundforløb 2008

Størrelse: px
Starte visningen fra side:

Download "Aktivitetsmappe for introkurset til Naturvidenskabeligt grundforløb 2008"

Transkript

1 Den eksperimentelle metode i statistik Den naturvidenskabelige metode er i fokus efter gymnasiereformen. Det starter med naturvidenskabeligt grundforløb: Aktivitetsmappe for introkurset til Naturvidenskabeligt grundforløb 2008 Velkommen til tre dage med Dataopsamling Databehandling Datafremlæggelse Som vignetten antyder er kan den naturvidenskabelige metode bl.a. struktureres efter tre stadier i arbejdet med data: Dataopsamling: Indsamling af data Databehandling: Bearbejdning og strukturering af data Datafremlæggelse: Formidling og fortolkning af data De samme tre stadier findes i den statistiske metode, som nok er den metode der kommer den naturvidenskabelige metode nærmest indenfor de matematiske fag: Også her er det helt centralt at indsamle statistiske data på forsvarlig vis, at kunne bearbejde de statistiske data med numeriske og grafiske metoder samt at kunne drage passende konklusioner af de statistiske data. Det er også karakteristisk for den statistiske metode at man kan arbejde med dataene på forskellige niveauer: Det beskrivende niveau: EDA (Explorative Data Analysis deskriptiv statistik) Det bekræftende niveau: Deduktive/induktive analyser (skøn/hypotesetest) På det laveste beskrivende niveau interesserer man sig alene for hvordan de rent faktisk indsamlede data opfører sig. Her benyttes først og fremmest forskellige grafiske fremstillinger suppleret med udregningen af de vigtigste deskriptorer. Man har altså indsamlet en stikprøve og undersøger med passen- 1

2 de grafiske og numeriske metoder hvordan den pågældende stikprøve er struktureret. Det er dette niveau vi underviser i på C-niveau. På det højeste bekræftende niveau går man nu et skridt videre og vurderer dels om stikprøven kan opfattes som en repræsentativ stikprøve for en større population, dels om hvilke af de fundne karakteristika, det i givet fald er rimeligt at udstrække til hele populationen. Det er langt mere kompliceret at holde styr på denne problemstilling, der bygger på en blanding af deduktive og induktive metoder, og det er dette niveau som resten af noten kommer til at beskæftige sig med. Det er dette niveau vi underviser i på B- og A-niveau. Men før vi kaster os over det bekræftende niveau er det vigtigt at gøre sig klart at det forudsætter en fortrolighed med det foregående beskrivende niveau, dvs. et rimeligt kendskab til simple deskriptorer som middelværdi, median og kvartiler, og en rimelig fortrolighed med brug af passende grafiske fremstillinger, som punktplot, histogrammer og boksplot. Først ser vi igen overordnet på den naturvidenskabelige metode. I bogen 'Naturvidenskabeligt grundforløb en introduktion til den naturvidenskabelig metodik' af Hans Marker, Lars Andersen, Carsten Ladegaard Pedersen og Steffen Samsøe (forlag Malling Beck nu L&R uddannelse) formuleres den naturvidenskabelige metode også kaldet den hypotetisk-deduktive metode således (se diagram næste side). Den naturvidenskabelige metode kan selvfølgelig formuleres på mange tilsvarende måder, men det afgørende er at man som udgangspunkt har en formodning om hvordan tingene hænger sammen, en såkaldt arbejdshypotese, og at man på basis af eksperimenter/observationer, når frem til et empirisk resultat. Det er dette resultat, der så skal sammenholdes med arbejdshypotesen. Her skal man derfor på basis af hypotesen foretage en udledning/deduktion af hypotesens konsekvenser, der efterfølgende kan sammenholdes med de empiriske resultater. Denne diskussion af overensstemmelsen mellem hypotese og resultater har så ideelt to mulige udfald: 1) Hypotesen bekræftes, idet der er en klar overensstemmelse mellem resultatet og hypotesen 2) Hypotesen forkastes, idet der er en klar modstrid mellem resultatet og hypotesen. I praksis kan diskussionen ofte vise sig at være mudret og sammenhængen mellem resultatet og hypotesen er derfor uklar. Processen må så gå om igen. Hvis hypotesen bekræftes tilstrækkeligt mange gange dvs. ved induktion - kan den til sidst ophøjes til en teori. Dette er et eksempel på anvendelsen af slutningsformen abduktion, hvor man slutter tilbage fra bekræftelsen af en påstands konsekvens til gyldigheden af selve påstanden. Som med induktionen er det ikke nogen sikker slutningsmetode (idet konsekvensen kunne være sand af andre årsager), men i praksis er det en særdeles anvendelig metode. Hvis hypotesen forkastes, må man i stedet opstille en ny hypotese, der så kan gøres til genstand for afprøvning osv. 2

3 Noter til DASG-kursuss i statistik den 4. september 2009 I den statistiske metode går man nu frem på tilsvarende vis: Vi observerer et stokastisk fænomen (fx ved at kaste med terninger eller ved at indsamle svar til en spørgeskemaundersøgelse osv. Det karakteristiske for ob- servationerne i et stokastisk fænomen er at de varierer tilfældigt for hver gangg eksperimentet/ indsamlingen gentages. Derefter sammenligner vi de observerede resultater med de forventedee resulta- ter fremkommet ud fra en arbejdshypotese (nul-hypotesen)observered de og forventede resultat er så lille at det med rimelighed kan tilskrivess tilfældigheder, eller om afvigelsen er så stor at det er mere rimeligt at tro på det er resultatet af en systematisk ten- dens, der bryder med nul-hypotesen. Det afgørende e spørgsmål er da m afvigelsen mellem det 3

4 Noter til DASG-kursus at vi har en standard for hvad det vil sige at afvi- i statistik den 4. september 2009 Det forudsætter selvfølgelig, gelsen er lille henholdsvis stor! I den statistiske metodee afgøres det ved hjælp af en teststørrelse, idet forskellen mellem det observere ede resultat benyttes som teststørrelse. Det er fordelingen af denne teststørrelse, der leverer standarden for hvornår afvigelsen er lille og hvornår den er stor. Eksperimentel simulering Nulhypotese Fordelingen af teststørrelsen Teoretisk deduktion Som det ses er der nu to principielt forskellige metoder vi kan benyttee til at fastlægge fordelingen af teststørrelsen. Begge metoder har fordele og ulemper: 1) I den eksperimentelle metode foretager man en simulering af nulhypo- tesen H 0 og på basis af simuleringen opstiller man et skøn over sandsyn- som ligheden for at man vil opnå et udfald, der er mindst lige så skævt det observerede. Det kræver et indgående kendskab til de metoder, man udnytter i simulering af stokastiske fænomener. 2) I den teoretiske metode opstiller man en sandsynlighedsteoretisk beman vil regning på basis af nulhypotesen H 0 af sandsynlighedenn for at opnå et udfald, der er mindst lige så skævt som det observerede. Det kæ- til ver et indgående kendskab til de sandsynlighedsfordelinger, der ligger grund for nulhypotesen. Den eksperimentellee metodee - er en fælles metode, der kan bruges for alle slags statistiske test. Den bygger på en vigtig modelleringskompetence: kom- petencen til at modellere et stokastisk fænomen. Den teoretiskee metodee - kræver et godt kendskab til et antal teo- normalfordelingen, t-fordelingen, χ2-for- 2 retiske fordelinger: Binomialfordelingen, delingen osv. Den underliggende metode har en tendens til at forsvinde i den vold- somme dosis teori. 4

5 - er kun praktisk mulig gennem brugen af computere. Den har nu opnået status som industristandard. Men der kræves en gennemregning af mange simuleringer ( ) for at kunne træffe en pålidelig slutning. - bygger på velkendte gennemprøvede eksakte matematiske metoder. Men resultatet af de teoretiske beregninger er ikke nødvendigvis mere præcist end resultatet af de eksperimentelle simuleringer. Den teoretiske metode bygger i praksis på adskillige tilnærmelser: de grundlæggende stokastiske variable er typisk kun approksimativt normalfordelte ligesom den teoretiske fordeling for teststørrelsen er ofte kun en asymptotisk fordeling. I undervisningsmæssig sammenhæng er det vigtigt at fastslå at der er fuldstændig valgfrihed mellem at bruge de forskellige metoder. Det er lærerens ansvar i samspil med klassen at udvælge undervisningsstrategien for den bekræftende statistik, og derved afgøre om den alene skal bygge på en af de ovennævnte metoder eller på en passende blanding af de to metoder. Susanne Christensens noter bygger på den teoretiske metode, mens den foreliggende note præsenterer den eksperimentelle metode. Også i eksamenssammenhæng er der fuldstændig valgfrihed om man vil løse opgaverne ude fra den eksperimentelle metode ved simulering af nulhypotesen eller ud fra en teoretisk beregning. 5

6 Hvad skal et program kunne for at kunne udføre en eksperimentel statistisk test? Med udgangspunkt i TI-Nspire CAS vil vi nu diskutere, hvad det er for egenskaber ved et regneark, der er væsentlige for at man kan udføre en eksperimentel test. Da TI-Nspire CAS deler fælles teknologi med DataMeter (Fathom) gælder de samme betragtninger for DataMeter. Ser vi på regnearket i TI- Nspire CAS er der fire ingredienser, der er afgørende: 2. Genberegn: CTRL R Regnearket opdateres løbende, men de tilfældige rutiner rand() osv. genberegnes kun hvis man vælger Genberegn! 3. Datafangst: Automatisk eller manuel Hvis man har oprettet en navngivet variabel (en måling) kan man fange dens værdier automatisk, når de ændres, og manuelt (CTRL.) når som helst. De indfangne værdier gemmes i en liste. 4. Hurtig-graf: Hvis man sværter en enkelt eller to kolonner kan man automatisk få oprettet et grafrum med et prikdiagram ved hjælp af Hurtig-graf. Faciliteten kendes fx fra TI-Interactive. 1. Dynamisk stikprøve: Ved hjælp af kommandoen randsamp() kan man udtrække en tilfældig (random) stikprøve (sample) fra en liste (population) med eller uden tilbagelægning (replacement). 1) Det skal være muligt at udtage dynamiske stikprøver. I TI-Nspire CAS sker det ved hjælp af kommandoen randsamp(). I DataMeter er det et menupunkt for skattekisten (Udtag stikprøve). Kommandoen Rand- Samp() findes også i TI-89, men den findes ikke i TI-Interactive, hvor den derfor må tilføjes som et brugerdefineret program. I fx Excel er det kompliceret at udtage stikprøver det sker ved hjælp af udvidelsesmodulet Dataanalyse - og de er ikke dynamiske. Uden dynamiske stikprøver er man i stedet nødt til at strikke en simulering sammen ved hjælp af tilfældighedsgeneratorer. I fx Excel har man umiddelbart kun adgang til tilfældighedsgeneratorerne SLUMP() og SLUMP.MELLEM(). Men der findes gode muligheder for at lave gentagne lister udregnet med diverse tilfældighedsgeneratorer, herunder en, der bygger på en brugerdefineret sandsynlighedsfordeling, ved hjælp af udvidelsesmodulet Dataanalyse. 2) Det skal være muligt at genberegne regnearket, så man får opdateret simuleringen, hvad enten den bygger på tilfældighedsgeneratorer eller tilfældige stikprøver. I TI-Nspire CAS sker der det ved hjælp af menupunk- 6

7 tet Genberegn (CTRL R). I DataMeter er det et menupunkt (Gentag simulering CTRL U) eller en knap på skattekisten. I TI-89 og TI-Interactive kan man ikke automatisk genberegne. Man må så i stedet gentage beregningen manuelt fx ved hjælp af nestede sekvens-kommandoer. I Excel virker funktionstasten F9. 3) Det skal være muligt at samle målinger op for en valgt teststørrelse knyttet til simuleringen. I TI-Nspire CAS gøres det ved hjælp af menupunktet Datafangst i Data-menuen. I DataMeter er det et menupunkt for skattekisten (Udtag gentagne målinger). Beregningen af en teststørrelse er triviel i alle former for regneark. Det er oprettelsen af en måling, der kan gentages, der er ikke-triviel. Både i TI-Nspire CAS og DataMeter skal man oprette målingen via en speciel teknik: I TI-Nspire CAS sker det ved at gemme formlen som en variabel man kan linke til (CTRL L), i DataMeter sker det ved at åbne for inspektøren i skattekisten og vælge fanebladet måling. I TI-89 henholdsvis TI-Interactive er det ikke umiddelbart muligt at oprette en måling og man må i stedet gennem den væk i en sekvens-kommando. Noget tilsvarende gælder for Excel. 4) Hurtig graf: Det skal være simpelt at oprette grafer for de optagne målinger. De fleste regneark har indbygget simple rutiner, der tillader hurtig oprettelse af grafer for udvalgte grafer. I TI-Nspire CAS kan man fx sværte kolonnen med målinger til, hvorefter menupunktet hurtig-graf automatisk opretter et Data og Statistik værksted hvorefter målingerne vises som et prikdiagram. Det giver allerede en hurtig fornemmelse for fordelingen. Derefter kan man bearbejde grafen på forskellig vis, fx skifte til histogram osv. Også TI-89 og TI-Interactive har tilsvarende faciliteter til automatisk hurtig oprettelse af grafer. Men også Datameter, Excel osv. gør det nemt at oprette grafer over udvalgte lister. Med disse fire faciliteter til rådighed kan man bruge dynamiske stikprøver til at opbygge en simulering af nulhypotesen, genberegning af regnearket til at gentage simuleringen mange gang og opsamling af målinger til at samle teststørrelsen for de mange simuleringer i en særskilt liste, så man kan undersøge fordelingen af teststørrelsen nøjere, herunder vurdere P-værdien, og endelig udnytte hurtig-grafen til at danne sig et visuelt indtryk af fordelingen og derved få en første fornemmelse for hvor signifikant resultatet er. Resten er tekniske detaljer, hvor vi nu vil prøve at gennemarbejde et antal cases, der kan vise den statistiske metode i praksis og også illustrere nogle af faciliteter, der er i de dynamiske statistikprogrammer. Da det er nemmest at simulere en kendt fordeling starter vi med at se på goodness-of-fit testen. Bagefter diskuterer vi så hvordan man kan simulere uafhængigheden for to stokastiske variable. 7

8 Eksempel 1: Noter til DASG-kursus i statistik den 4. september 2009 I Susannes noter finder vi det følgende eksempel: Danmarks statistiks opgørelse af indkomstfordelingen for personer over 15 år i Danmark år 2007 viser følgende billede: I=Indkomst i 1000 kr. % af befolkning I<50 50 I< I< I< I< I< I< I En markedsanalytiker har foretaget en undersøgelse af 1000 personers kendskab til et særdeles kostbart fladskærmsprodukt, men efterfølgende er der opstået tvivl om udvælgelsen af stikprøven, der er forgået som interviewundersøgelse over et par dage i et lokalt supermarked. Det frygtes, at stikprøven har fået for mange respondenter med i de lavere indkomstklasser. Heldigvis er der blevet spurgt om folks indkomst, så man kan lave et test for, om indkomstfordelingen i stikprøven synes at komme fra et specielt segment af befolkningen og altså dermed ikke at have den samme fordeling som indkomstfordelingen i Danmark. Hvis det er tilfældet, kan man nemlig ikke generalisere undersøgelsens resultat til hele befolkningen. Indkomstfordelingen i stikprøven var: Observerede antal: I=Indkomst i 1000 kr. I<50 50 I< I< I< I< I< I< I Antal i stikprøven Disse to tabeller overføres nu til et Lister og regneark værksted, idet de forventede hyppigheder i en stikprøve på 1000 adspurgte findes ved at gange procenterne med 10: 8

9 Læg mærke til at kategorierne, dvs. indkomstintervallerne, indtastes med gåseøjne! Det sker for at de skal opfattes som tekststrenge og ikke som formler. Opretter vi frekvensplot for de to hyppighedslister kan vi nu se at den mest markante forskel optræder i den laveste indkomstkategori. Så måske er lavindkomstgrupperne overrepræsenteret i interviewundersøgelsen! 9

10 Vi lægger nu ud med et mål for afvigelsen mellem de observerede og forventede hyppigheder. Som udgangspunkt er det naturligt at benytte summen af de kvadratiske afvigelser som et sådant mål: Det er jo det centrale mål for afvigelser i mindste kvadraters metode. Men som påpeget af Karl Pearson i 1900 er det smart at ændre udtrykket til den vægtede sum chi 2 Vi vil senere se på hvorfor det er smart at vægte de enkelte kvadratled på denne måde. Foreløbigt inkluderer vi afvigelsen, det såkaldte chi-kvadrat i et regneark (hvor vi ganger med 1. for at tvinge resultatet til at fremstå i decimaler): Spørgsmålet er så blot om er en stor afvigelse, som er svær at forklare ud fra tilfældige fluktuationer i stikprøven, eller om det er en lille afvigelse, der sagtens kan tilskrives tilfældige udsving i stikprøven. Det kan man ikke umiddelbart sige noget om, da et tal i sig selv ikke har nogen absolut størrelse. Vi må først fastlægge en standard for den forventede størrelse af afvigelsen, hvis den kan tilskrives tilfældige udsving, dvs. vi må først simulere nul-hypotesen, før vi kan udtale os om hvorvidt teststørrelsen er stor eller lille. Denne simulering af nulhypotesen foregår nu ved at vi udtrækker stikprøver fra superpopulationen, dvs. fra den samlede danske befolkning. Heldigvis behøver vi ikke konstruere en superpopulation, der indeholder alle danskere. Vi skal bare konstruere en ideel population, der afspejler den danske befolkning i den forstand at de forskellige indkomstgrupper netop forekommer med de samme andele som i den samlede befolkning. Denne ideelle population kan vi så trække stikprøver fra. 10

11 Da frekvensfordelingen for indkomstgrupperne er opgivet i procenter med 1 decimal (svarende til promiller) er det smart at konstruere en ideel population bestående af 1000 mennesker, dvs. bruge de forventede hyppigheder som udgangspunkt for den ideelle population. Vi benytter nu en meget nyttig kommando freqtable list(), der netop konverterer en hyppighedstabel til én lang liste med de rigtige forekomster af de enkelte kategorier: Denne superpopulation kan vi så afbilde som et histogram i et almindeligt data og statistik værksted og får med et søjlediagram netop adgang til en afbildning af hyppighederne (se figuren på næste side). Men hvis vi nu trækker en tilfældig person fra denne ideelle liste så vil sandsynligheden for at vedkommende har en lav indkomst mellem 0 og 50 kilokroner jo netop være 6.4 % og tilsvarende for de andre indkomstkategorier. Hvis vi ydermere laver udtrækningen MED tilbagelægning, så vil hver eneste person være trukket med de rigtige sandsynligheder, og indkomsten for to forskellige personer vil være uafhængige af hinanden. Vi kan nu med andre ord simulere nul-hypotesen, ifølge hvilken indkomstfordelingen for de udtrukne følger landsfordelingen! 11

12 Det sker ved hjælp af kommandoen randsamp() (en forkortelse af random sampling): Her er ejsvar en fejloversættelse af norep, dvs. no replacement. Så standarden er følgende valgfri parameter = 0 stikprøven udtages med tilbagelægning valgfri parameter = 1 stikprøven udtages uden tilbagelægning Da standarden netop foregår MED tilbagelægning kan vi bare ignorere den! Vi trækker da 1000 tilfældige indkomstgrupper fra den ideelle fordelinger, idet vi jo skal matche de 1000 personer i den oprindelige interviewundersøgelse. Dermed simulerer vi netop nulhypotesen, dvs. vi kan nu afbilde stikprøven og se hvordan den opfører sig, når vi gentager stikprøven ved at taste CTRL-R mange gange i regnearket! 12

13 Hver gang blafrer søjlerne i stikprøven så op og ned som udtryk for den naturlige variation i en stikprøve! Det ændrer ikke på det overordnede mønster, men det er tydeligt at de enkelte hyppigheder varierer ganske pænt og at der derfor godt kan være en vis afstand til den ideelle fordeling repræsenteret af de forventede hyppigheder. 13

14 For at kunne undersøge variationen nærmere får vi nu brug at finde de simulerede hyppigheder. Det kan gøres på forskellig vis. Der findes en indbygget kommando for at finde hyppighederne, frequency(), men den tæller desværre også de tilfælde med, der falder udenfor de oplyste kategorier (også selv om der jo ingen er i vores tilfælde). Det er desværre en arv fra Excel, som er helt overflødig: Derved passer listelængden ikke med den tilsvarende for kategorier. Det kan man som vist sno sig ud af ved at skære listen til med en left-kommando: left('sim_hyp,8) Hvis man ikke kan lide denne løsning må man i stedet bygge hyppighederne op med en celle-kommando, som trækkes ned gennem de 8 celler. I celle F1 skriver man da formlen countif(stikprøve,a1) der tæller hvor mange gange den første kategori forekommer i stikprøven osv. 14

15 Vi kan nu køre simulationen et antal gange fx 20 og lægger mærke til at der dukker chi2-tesstørrelser op i tyverne men ikke i trediverne. Så det synes ikke helt nemt at fange en teststørrelse på ! Vi bygger nu fordelingen af teststørrelsen op. Det kræver at vi lagrer dem som variable, dvs. vi højreklikker på cellerne B1 og B2 og lagrer dem som Chi2_obs og Chi2_sim: 15

16 Læg mærke til at cellerne nu er grå som tegn på at de er sat på lager! Men når vi først har lagret dem kan vi også gå på jagt efter dem med en datafangst. I fanger dem i søjle C, hvor vi sætter en måling op. Først giver vi søjle C et navn, i dette tilfælde måling og derefter vælger vi menupunktet Datafangst i Datamenuen. Det resulterer i en kommando capture(var,1) hvor vi selv skal udfylde variabelnavnet. Der er ikke tale om en kommando i sædvanlig forstand. Den kan kun bruges i lister og regneark og den står derfor ikke i kataloget! Resultatet er en første fangst af den nuværende værdi for teststørrelsen chi2_sim. Vi har også tilføjet en tæller i B3, der skal holde øje med hvor mange vi har fanget. Det sker ved celleformlen = dim(måling) 16

17 Endelig opretter vi en data- og statistikgraf, hvor vi kan se fordelingen af den simulerede teststørrelse og også sammenholde den med den observerede teststørrelse Chi2_obs, der derfor plottes som en værdi: Herefter er det bare at gå i gang med simuleringen ved at taste CTRL-R i det oprindelige regneark, hvor simuleringen foregår! Til at begynde med ser man punkterne tilføjes et for et, men efterhånden foregår det i større og større ryk, hvor programmet regner på livet løs, mens CTRL-R tasten holdes nede. Og når vi når op til 2500 målinger, går målingen i stå, fordi regnearket ikke kan rumme søjler/lister med over 2500 elementer: 17

18 Efter 2500 forsøg er det ikke lykkedes os en eneste gang at nå op til de og kun to gange er det lykkedes at nå over 25. Det er altså meget svært at simulere sig til en værdi, der er lige så ekstrem som den observerede og nulhypotesen er derfor ikke troværdig! Den bør forkastes. Men inden vi forlader eksemplet vil vi lige illustrere nogle flere karakteristiske egenskaber ved fordelingen. Først plotter vi middelværdien: Middelværdien ligger meget tæt ved 7. Det er ikke noget tilfælde: 18

19 Det vægtede gennemsnit i Pearsons teststørrelse er netop valgt, så fordelingen af teststørrelsen får en middelværdi, der ligger tæt på antallet af frihedsgrader (og som er lig med antallet af frihedsgrader, når vi regner på den forventede teoretiske fordeling af teststørrelsen). Antallet af frihedsgrader i en goodness-offit test svarer til antallet af hyppigheder, der kan vælges frit. I en stikprøve på 1000 elementer med 8 kategorier er der netop 7 frihedsgrader, for når vi har valgt 7 hyppigheder fastlægges den sidste af kravet om at summen af hyppighederne skal være Det giver en første fornemmelse for hvornår en observeret teststørrelse er lille eller stor. Den skal i hvert fald et stykke over middelværdien, dvs. antallet af frihedsgrader, før der kan blive tale om at den er stor! For nu at præcisere det har man truffet et valg af det såkaldte signifikansniveau, som typisk er 5% eller 1%. Her vil vi illustrere det med 1%. For at en teststørrelse kan regnes for stor og nulhypotesen dermed for utroværdig, skal den være mindst lige så stor om de største 1% i fordelingen af den simulerede teststørrelse. Eller sagt med andre ord: Sandsynligheden for at den er fremkommet ved et tilfælde ud fra nulhypotesen skal være mindre end 1% før vi forkaster nulhypotesen. Nu svarer 1% til 25 observationer ud af de 2500 målinger, så vi skal have fat i de 25 største målinger. Det kan man nemt finde ud af ved at ordne målingerne efter størrelse, men da målingerne er fremkommet ved en datafangstkommando skal den slettes først før vi får lov til at ordne målingerne! Det tager selvfølgelig et stykke tid at ordne de 2500 målinger efter aftagende størrelse, men til sidst falder det på plads: Vi ser da at man skal over 19 før en teststørrelse kan karakteriseres som stor. Man kan også udregne den kritiske sandsynlighed, dvs. sandsynligheden for at simulere en teststørrelse, der er mindst lige så skæv som den observerede. Vi skal da tælle hvor mange af de simulerede teststørrelser, der er større end eller lig med den observerede. I vores tilfælde er der ingen, så vi kan vurdere den 19

20 kritiske sandsynlighed p til at være mindre end 1/2500 = 0.04%, som ligger langt under signifikansniveauet, dvs. der er tale om en meget sjælden begivenhed, når man observerer , og dermed er nulhypotesen meget utroværdig. I almindelighed finder man antallet af skæve teststørrelser med en countifkommando: countif(måling,?>=chi2_obs) der derefter divideres med det samlede antal målinger. Men vi kan også kigge på den teoretiske fordeling af teststørrelsen. Vi vil da først omforme prikdiagrammet til et histogram med søjlebredden 1 og skalaen til densitet, dvs. der er tale om tæthedshistogram med det samlede areal 1: Vi ser da netop den karakteristiske form af chi2-fordelingen med 7 frihedsgrader (den topper lidt før 7, men er til gengæld højreskæv!). Vi kan tegne den teoretiske fordeling ved at plotte funktionen chi2pdf(x,7) hvor Pdf står for pointdistribution. Vi ser da at den følger tæthedshistogrammet meget nøje. Vi kan derfor i praksis godt erstatte den eksperimentelle simulering med den teoretiske fordelingskurve. Det vil give samme resultat! 20

21 Hvis vi højreklikker på grafen og vælger Skraver under funktion kan vi endda finde den kritiske sandsynlighed ved at klikke på chi2_obs og på boksen med +. Vi finder da resultatet helt ned til højre som Det er i overensstemmelse med vores tidligere skøn, idet det er det samme som %. Vi kan også finde den kritiske teststørrelse svarende til signifikansniveauet 1%. Igen skraverer vi under funktionen, men denne gang starter vi i - og trækker musen indtil vi passer de 99% (så der kun er 1% tilbage). Vi ser da at den kriti- 21

22 ske teststørrelse ligger meget tæt på 18.5, dvs. alt over 18.5 er statistisk signifikant! Hvis man først er blevet rigtig fortrolig med testen kan man endda regne direkte på den teoretiske fordeling i grafregneren: Men så kan man såmænd lige så godt udføre testet som et indbygget test! Det kan fx gøres i lister og regneark-værkstedet: 22

23 Læg mærke til at vi selv skal anføre antallet af frihedsgrader. Det er godt, for der er mere avancerede eksempler på goodness-of-fit test, hvor man først skal estimere parametre for fordelingen, og derfor mister yderligere frihedsgrader. Læg også mærke til at man kan få plottet data! Vi får da netop oplyst teststørrelsen χ 2, den kritiske sandsynlighed Pval, antallet af frihedsgrader (som vi selv har oplyst) og endelig en liste over de enkelte kategoriers bidrag til teststørrelsen (der viser at det især er den første kategori, der bidrager kraftigt!). På grafplottet ses tilsvarende teststørrelsen og den kritiske sandsynlighed (som med fire decimaler er 0, dvs. den er meget lille). Endelig vil området under grafen være skraveret, men det kan man i dette ekstreme tilfælde først se, når man har pillet ret så kraftigt ved skalaen! 23

24 24

25 Et uafhængighedstest Som det sidste eksempel vil vi se på et uafhængighedstest, der samtidigt giver os mulighed for at demonstrere, hvordan man kan simulere uafhængighed af to stokastiske variable. Vi lægger ud med et fiktivt talmateriale 1 der skal forestille resultatet af en spørgeskemaundersøgelse, hvor man vil belyse en eventuel sammenhæng mellem unges tøjforbrug og deres køn: Adskiller kvinder og mænd sig i deres tøjforbrug? Her er et lavt forbrug sat til at udgøre højst 1500 kr. om måneden og et højt forbrug er sat til at udgøre mindst 1500 kr. om måneden. køn\forbrug lavt højt i alt kvinder mænd i alt Disse tal udgør altså vores observation. Som udgangspunkt vil vi nu teste nulhypotesen, der udsiger at der ingen sammenhæng er mellem køn og forbrug. Vi lægger da ud med at konstruere et datasæt ud fra de givne observationer. Det er dette datasæt, vi vil basere vores simulering af nulhypotesen på, men først skal det opbygges. Vi lægger ud med to kategorilister, der tilsammen dækker kombinationerne i vores krydstabel (dvs. krydstabellen repræsenteres af to krydslister). Derefter skriver vi de observerede hyppigheder ind, som de fremgår af den ovenstående tabel: På basis af disse krydslister kan vi nu opbygge vores rådata, dvs. de faktiske lister med køn og forbrug. Det sker ved hjælp af kommandoen FreqTable List(kategoriliste, hyppighedsliste), der omdanner en kategoriliste med tilhørende hyppigheder til en liste af rådata. Vi opretter altså nu to nye variable en for køn og en for forbrug, som er i overensstemmelse med de oplyste data: 1 Hentet fra et udkast til noter om chi-i-anden fordelingen af E. Susanne Christensen. Lektor i statistik. Institut for Matematiske Fag. Aalborg Universitet. 25

26 Vi kan nu checke rådata ved at oprette søjlediagrammer for køn henholdsvis forbrug: Bortset fra at vi har fået byttet om på rækkefølgen af højt forbrug og lavt forbrug, har vi genskabt tabellen i grafisk form. Vi ser også at mænd har et noget højere forbrug end kvinder, men spørgsmålet er om det er nok til at være signifikant? For at undersøge det vil vi simulere uafhængigheden af de to variable ved at røre rundt i den ene variabel, dvs. permutere rækkefølgen helt tilfældigt, så vi bryder enhver sammenhæng mellem værdien for køn og værdien for forbrug. Vi vælger at røre rundt i køn og benytter derfor kommandoen randsamp(population, antal, uden = 1) til at udtrække en stikprøve fra køn uden tilbagelægning med det samme antal elementer: Her ser vi resultatet af de 5 første omrøringer: 26

27 Vi kan også oprette en krydslister som før for omrøringen ved at foretage optællinger med sim(iffn(kritere,1,0))-kommandoen, der efterfølgende trækkes ned gennem cellerne i krydslisten: Læg mærke til at randværdierne, dvs. rækketotalerne og søjletotalerne er de samme som i vores observationer. Det er kun kombinationerne, der skifter værdier. Med udgangspunkt i simuleringen skal vi nu opbygge teststørrelsen, dvs. chikvadratet. Vi må da først finde de forventede værdier. Under antagelse af nulhypotesen må vi nu forvente at fordelingen af forbruget for kvinder følger den generelle fordeling af forbruget (som ses i søjletotalerne), dvs. at 202 ud af de 360 har et højt forbrug. Det forventede antal kvinder med højt forbrug er derfor givet ved Søjletotal Rækketotal 200 = = Det samlede antal og tilsvarende for de andre kombinationer. Vi kan derfor udregne de forventede antal ud fra denne formel: Som det ses ligger de omrørte hyppigheder og de forventede hyppigheder rimeligt tæt på hinanden. Med udgangspunkt i disse værdier kan vi nu udregne chi-teststørrelsen givet ved ( observeret forventet) chikvadrat = forventet 2 27

Statistik med TI-Nspire CAS version 3.2. Bjørn Felsager September 2012. [Fjerde udgave]

Statistik med TI-Nspire CAS version 3.2. Bjørn Felsager September 2012. [Fjerde udgave] Statistik med TI-Nspire CAS version 3.2 Bjørn Felsager September 2012 [Fjerde udgave] Indholdsfortegnelse Forord Beskrivende statistik 1 Grundlæggende TI-Nspire CAS-teknikker... 4 1.2 Lister og regneark...

Læs mere

Schweynoch, 2003. Se eventuelt http://www.mathematik.uni-kassel.de/~fathom/projekt.htm.

Schweynoch, 2003. Se eventuelt http://www.mathematik.uni-kassel.de/~fathom/projekt.htm. Projekt 8.5 Hypotesetest med anvendelse af t-test (Dette materiale har været anvendt som forberedelsesmateriale til den skriftlige prøve 01 for netforsøget) Indhold Indledning... 1 χ -test... Numeriske

Læs mere

Personlig stemmeafgivning

Personlig stemmeafgivning Ib Michelsen X 2 -test 1 Personlig stemmeafgivning Efter valget i 2005 1 har man udspurgt en mindre del af de deltagende, om de har stemt personligt. Man har svar fra 1131 mænd (hvoraf 54 % har stemt personligt

Læs mere

Et matematikeksperiment: Bjørn Felsager, Haslev Gymnasium & HF

Et matematikeksperiment: Bjørn Felsager, Haslev Gymnasium & HF Sammenligning af to måleserier En af de mest grundlæggende problemstillinger i statistik består i at undersøge om to forskellige måleserier er signifikant forskellige eller om forskellen på de to serier

Læs mere

Simulering af stokastiske fænomener med Excel

Simulering af stokastiske fænomener med Excel Simulering af stokastiske fænomener med Excel John Andersen, Læreruddannelsen i Aarhus, VIA Det kan være en ret krævende læreproces at udvikle fornemmelse for mange begreber fra sandsynlighedsregningen

Læs mere

I. Deskriptiv analyse af kroppens proportioner

I. Deskriptiv analyse af kroppens proportioner Projektet er delt i to, og man kan vælge kun at gennemføre den ene del. Man kan vælge selv at frembringe data, fx gennem et samarbejde med idræt eller biologi, eller man kan anvende de foreliggende data,

Læs mere

Gennemsnit og normalfordeling illustreret med terningkast, simulering og SLUMP()

Gennemsnit og normalfordeling illustreret med terningkast, simulering og SLUMP() Gennemsnit og normalfordeling illustreret med terningkast, simulering og SLUMP() John Andersen, Læreruddannelsen i Aarhus, VIA Et kast med 10 terninger gav følgende udfald Fig. 1 Result of rolling 10 dices

Læs mere

At træffe sine valg i en usikker verden - eller den statistiske modellerings rolle.

At træffe sine valg i en usikker verden - eller den statistiske modellerings rolle. At træffe sine valg i en usikker verden - eller den statistiske modellerings rolle. Af E. Susanne Christensen. Lektor i statistik. Institut for Matematiske Fag. Aalborg Universitet. I mange tilfælde og

Læs mere

Spørgeskemaundersøgelser og databehandling

Spørgeskemaundersøgelser og databehandling DASG. Nye veje i statistik og sandsynlighedsregning. side 1 af 12 Spørgeskemaundersøgelser og databehandling Disse noter er udarbejdet i forbindelse med et tværfagligt samarbejde mellem matematik og samfundsfag

Læs mere

Hvad er meningen? Et forløb om opinionsundersøgelser

Hvad er meningen? Et forløb om opinionsundersøgelser Hvad er meningen? Et forløb om opinionsundersøgelser Jette Rygaard Poulsen, Frederikshavn Gymnasium og HF-kursus Hans Vestergaard, Frederikshavn Gymnasium og HF-kursus Søren Lundbye-Christensen, AAU 17-10-2004

Læs mere

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0 Hypotesetest Hypotesetest generelt Ingredienserne i en hypotesetest: Statistisk model, f.eks. X 1,,X n uafhængige fra bestemt fordeling. Parameter med estimat. Nulhypotese, f.eks. at antager en bestemt

Læs mere

Fagligt samspil mellem Ma-B og SA-A Lisbeth Basballe, Mariagerfjord Gymnasium og Marianne Kesselhahn, Egedal Gymnasium og HF

Fagligt samspil mellem Ma-B og SA-A Lisbeth Basballe, Mariagerfjord Gymnasium og Marianne Kesselhahn, Egedal Gymnasium og HF Fagligt samspil mellem Ma-B og SA-A Lisbeth Basballe, Mariagerfjord Gymnasium og Marianne Kesselhahn, Egedal Gymnasium og HF Vi ønskede at planlægge og afprøve et undervisningsforløb, hvor anvendelse af

Læs mere

Mini AT-forløb om kommunalvalg: Mandatfordeling og Retfærdighed 1.x og 1.y 2009 ved Ringsted Gymnasium MANDATFORDELING

Mini AT-forløb om kommunalvalg: Mandatfordeling og Retfærdighed 1.x og 1.y 2009 ved Ringsted Gymnasium MANDATFORDELING MANDATFORDELING Dette materiale er lavet som supplement til Erik Vestergaards hjemmeside om samme emne. 1 http://www.matematiksider.dk/mandatfordelinger.html I dette materiale er en række øvelser der knytter

Læs mere

Temaopgave i statistik for

Temaopgave i statistik for Temaopgave i statistik for matematik B og A Indhold Opgave 1. Kast med 12 terninger 20 gange i praksis... 3 Opgave 2. Kast med 12 terninger teoretisk... 4 Opgave 3. Kast med 12 terninger 20 gange simulering...

Læs mere

Statistik i GeoGebra

Statistik i GeoGebra Statistik i GeoGebra Peter Harremoës 13. maj 2015 Jeg vil her beskrive hvordan man kan lave forskellige statistiske analyser ved hjælp af GeoGebra 4.2.60.0. De statistiske analyser svarer til pensum Matematik

Læs mere

Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen

Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen Microsoft Excel har en del standard anvendelsesmuligheder i forhold til den beskrivende statistik og statistisk

Læs mere

Statistik (deskriptiv)

Statistik (deskriptiv) Statistik (deskriptiv) Ikke-grupperede data For at behandle ikke-grupperede data i TI, skal data tastes ind i en liste. Dette kan gøres ved brug af List, hvis ikon er nr. 5 fra venstre på værktøjsbjælken

Læs mere

Skolesektionen på www.ballerup.dk

Skolesektionen på www.ballerup.dk Skolesektionen på www.ballerup.dk Louise Callisen Dyhr (ldyh) Marie Louise Gottlieb Frederiksen (mgfr) Janus Askø Madsen (jaam) Nanna Petersen (nshy) Antal tegn: 28319 Afleveringsdato: 21. maj 2014 1 Indledning...

Læs mere

Introduktion til SPSS

Introduktion til SPSS Introduktion til SPSS Øvelserne på dette statistikkursus skal gennemføres ved hjælp af det såkaldte SPSS program. Det er erfaringsmæssigt sådan, at man i forbindelse af øvelserne på statistikkurser bruger

Læs mere

Skriv punkternes koordinater i regnearket, og brug værktøjet To variabel regressionsanalyse.

Skriv punkternes koordinater i regnearket, og brug værktøjet To variabel regressionsanalyse. Opdateret 28. maj 2014. MD Ofte brugte kommandoer i Geogebra. Generelle Punktet navngives A Geogebra navngiver punktet Funktionen navngives f Funktionen navngives af Geogebra Punktet på grafen for f med

Læs mere

Uafhængighed et eksempel på en rød tråd i statistikken

Uafhængighed et eksempel på en rød tråd i statistikken Uafhængighed et eksempel på en rød tråd i statistikken Statistiknoter til TI-Nspire CAS version 3.1 Bjørn Felsager Revideret November 2011 329 Uafhængighed et eksempel på en rød tråd i statistikken Chi-i-anden-testen

Læs mere

Forelæsning 9: Inferens for andele (kapitel 10)

Forelæsning 9: Inferens for andele (kapitel 10) Kursus 02402 Introduktion til Statistik Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

KURSUSMATERIALE TIL DET NYE STATISTIKPENSUM

KURSUSMATERIALE TIL DET NYE STATISTIKPENSUM KURSUSMATERIALE TIL DET NYE STATISTIKPENSUM Det foreliggende udkast til kursusmateriale er lagt ud til orientering for kollegerne med henblik på at indhente kommentarer til materialet. Sammen med Susanne

Læs mere

Projekt 1 Spørgeskemaanalyse af Bedst på Nettet

Projekt 1 Spørgeskemaanalyse af Bedst på Nettet Projekt 1 Spørgeskemaanalyse af Bedst på Nettet D.29/2 2012 Udarbejdet af: Katrine Ahle Warming Nielsen Jannie Jeppesen Schmøde Sara Lorenzen A) Kritik af spørgeskema Set ud fra en kritisk vinkel af spørgeskemaet

Læs mere

Dig og din puls Lærervejleding

Dig og din puls Lærervejleding Dig og din puls Lærervejleding Indledning I det efterfølgende materiale beskrives et forløb til matematik C, hvori eleverne skal måle hvilepuls og arbejdspuls og beskrive observationerne matematisk. Materialet

Læs mere

Vejledning til Gym18-pakken

Vejledning til Gym18-pakken Vejledning til Gym18-pakken Copyright Maplesoft 2014 Vejledning til Gym18-pakken Contents 1 Vejledning i brug af Gym18-pakken... 1 1.1 Installation... 1 2 Deskriptiv statistik... 2 2.1 Ikke-grupperede

Læs mere

Taldata 1. Chancer gennem eksperimenter

Taldata 1. Chancer gennem eksperimenter Taldata 1. Chancer gennem eksperimenter Indhold 1. Kast med to terninger 2. Et pindediagram 3. Sumtabel 4. Median og kvartiler 5. Et trappediagram 6. Gennemsnit 7. En statistik 8. Anvendelse af edb 9.

Læs mere

1. Opbygning af et regneark

1. Opbygning af et regneark 1. Opbygning af et regneark Et regneark er et skema. Vandrette rækker og lodrette kolonner danner celler, hvori man kan indtaste tal, tekst, datoer og formler. De indtastede tal og data kan bearbejdes

Læs mere

Projekt 8.3 Hvordan undersøges om et talmateriale normalfordelt?

Projekt 8.3 Hvordan undersøges om et talmateriale normalfordelt? Projekt 8.3 Hvordan undersøges om et talmateriale normalfordelt? Projektet drejer sig om at udvikle en metode, til at undersøge om et givet talmateriale med rimelighed kan siges at være normalfordelt.

Læs mere

Velkommen til TI-Nspire CAS 2.0 (Lærerversion)

Velkommen til TI-Nspire CAS 2.0 (Lærerversion) Velkommen til TI-Nspire CAS 2.0 (Lærerversion) Når du åbner for TI-Nspire CAS i en standardopsætning ser brugerfladen således ud (hvis ikke, så vælg Dialogboks > Indlæs standardområdet): I midterpanelet

Læs mere

F I N N H. K R I S T I A N S E N KUGLE SIMULATIONER MÅLSCORE I HÅNDBOLD G Y L D E N D A L

F I N N H. K R I S T I A N S E N KUGLE SIMULATIONER MÅLSCORE I HÅNDBOLD G Y L D E N D A L RÆSONNEMENT & 1BE V I S F I N N H. K R I S T I A N S E N GNING 2 EGNEARK KUGLE 5 MÅLING SIMULATIONER 3 G Y L D E N D A L MÅLSCORE I HÅNDBOLD Faglige mål: Håndtere simple modeller til beskrivelse af sammenhænge

Læs mere

Indblik i statistik - for samfundsvidenskab

Indblik i statistik - for samfundsvidenskab Indblik i statistik - for samfundsvidenskab Læs mere om nye titler fra Academica på www.academica.dk Nikolaj Malchow-Møller og Allan H. Würtz Indblik i statistik for samfundsvidenskab Academica Indblik

Læs mere

Statistik. Deskriptiv statistik, normalfordeling og test. Karsten Juul

Statistik. Deskriptiv statistik, normalfordeling og test. Karsten Juul Statistik Deskriptiv statistik, normalfordeling og test Karsten Juul Intervalhyppigheder En elevgruppe på et gymnasium har spurgt 100 tilfældigt valgte elever på gymnasiet om hvor lang tid det tager dem

Læs mere

Projekt 10.16: Matematik og demokrati Mandatfordelinger ved sidste kommunalvalg

Projekt 10.16: Matematik og demokrati Mandatfordelinger ved sidste kommunalvalg Projekt 10.16: Matematik og demokrati Mandatfordelinger ved sidste kommunalvalg Introduktion: Vi vil nu se på et konkret eksempel på hvordan man i praksis fordeler mandaterne i et repræsentativt demokrati,

Læs mere

MODELSÆT 2; MATEMATIK TIL LÆREREKSAMEN

MODELSÆT 2; MATEMATIK TIL LÆREREKSAMEN MODELSÆT ; MATEMATIK TIL LÆREREKSAMEN Forberedende materiale Den individuelle skriftlige røve i matematik vil tage udgangsunkt i følgende materiale:. En diskette med to regnearks-filer og en MathCad-fil..

Læs mere

Teoretisk Statistik, 2. december 2003. Sammenligning af poissonfordelinger

Teoretisk Statistik, 2. december 2003. Sammenligning af poissonfordelinger Uge 49 I Teoretisk Statistik, 2. december 2003 Sammenligning af poissonfordelinger o Generel teori o Sammenligning af to poissonfordelinger o Eksempel Opsummering om multinomialfordelinger Fishers eksakte

Læs mere

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable Statistik II Lektion 3 Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable Setup: To binære variable X og Y. Statistisk model: Konsekvens: Logistisk regression: 2 binære var. e e X Y P

Læs mere

Statistik er at behandle en stor mængde af tal, så de bliver lettere at overskue og forstå.

Statistik er at behandle en stor mængde af tal, så de bliver lettere at overskue og forstå. Statistik er at behandle en stor mængde af tal, så de bliver lettere at overskue og forstå. Hvis man fx samler de karakterer, der er givet til en eksamen i én stor bunke (se herunder), kan det være svært

Læs mere

VisiRegn: En e-bro mellem regning og algebra

VisiRegn: En e-bro mellem regning og algebra Artikel i Matematik nr. 2 marts 2001 VisiRegn: En e-bro mellem regning og algebra Inge B. Larsen Siden midten af 80 erne har vi i INFA-projektet arbejdet med at udvikle regne(arks)programmer til skolens

Læs mere

Matematik i Word. En manual til elever og andet godtfolk. Indhold med hurtig-links. Kom godt i gang med Word Matematik. At regne i Word Matematik

Matematik i Word. En manual til elever og andet godtfolk. Indhold med hurtig-links. Kom godt i gang med Word Matematik. At regne i Word Matematik Matematik i Word En manual til elever og andet godtfolk. Indhold med hurtig-links Kom godt i gang med Word Matematik At regne i Word Matematik Kom godt i gang med WordMat Opsætning, redigering og kommunikationsværdi

Læs mere

2. Ved et roulettespil kan man vinde 0,10,100, 500 og 1000 kr. Sandsynligheden for gevinsterne ses af følgende skema:

2. Ved et roulettespil kan man vinde 0,10,100, 500 og 1000 kr. Sandsynligheden for gevinsterne ses af følgende skema: Der er hjælp til opgaver med # og facit på side 6 1. Et eksperiment kan beskrives med følgende skema: u 1 2 3 4 5 P(u) 0,3 0,2 0,1 0,2 x Bestem x og sandsynligheden for at udfaldet er et lige tal.. 2.

Læs mere

Regnearket Excel - en introduktion

Regnearket Excel - en introduktion Regnearket Excel - en introduktion Flytte rundt i regnearket. Redigere celler Hjælp Celleindhold Kopiering af celler Lokalmenu og celleegenskaber Opgaver 1. Valutakøb 2. Hvor gammel er du 3. Momsberegning

Læs mere

χ 2 test Formål med noten... 2 Goodness of fit metoden (GOF)... 2 1) Eksempel 1 er stikprøven repræsentativ for køn? (1 frihedsgrad)...

χ 2 test Formål med noten... 2 Goodness of fit metoden (GOF)... 2 1) Eksempel 1 er stikprøven repræsentativ for køn? (1 frihedsgrad)... χ Indhold Formål med noten... Goodness of fit metoden (GOF)... 1) Eksempel 1 er stikprøven repræsentativ for køn? (1 frihedsgrad)... ) χ -fordelingerne (fordelingsfunktionernes egenskaber)... 6 3) χ -

Læs mere

Excel 2007 (5): Formler, diagrammer og tips

Excel 2007 (5): Formler, diagrammer og tips Excel 2007 (5): Formler, diagrammer og tips HUSK AT: Man kan godt skrive flere linjer under hinanden i den samme celle. Marker den pågældende celle (evt. flere celler) og vælg "Ombryd tekst" på fanebladet

Læs mere

Undervisningsbeskrivelse

Undervisningsbeskrivelse Undervisningsbeskrivelse Termin Efterår 2014 Institution Niels Brock Uddannelse Fag og niveau Lærer Hold HHX Matematik - Niveau A Peter Harremoës GSK hold t14gymaau1o2 Oversigt over gennemførte undervisningsforløb

Læs mere

Disposition for kursus i Excel2007

Disposition for kursus i Excel2007 Disposition for kursus i Excel2007 Analyse af data (1) Demo Øvelser Målsøgning o evt. opgave 11 Scenariestyring o evt. opgave 12 Datatabel o evt. opgave 13 Evt. Graf og tendens o evt. opgave 10 Subtotaler

Læs mere

Differentialligninger med TI Nspire CAS version 3.1

Differentialligninger med TI Nspire CAS version 3.1 Differentialligninger med TI Nspire CAS version 3.1 Der er tilføjet en ny graftype til Graf værkstedet kaldet Diff lign. Denne nye graftype er en implementering af differentialligningerne som vi kender

Læs mere

Indhold Forelæsning Dat-D1: Regneark Matematik og databehandling 2012

Indhold Forelæsning Dat-D1: Regneark Matematik og databehandling 2012 Indhold Forelæsning Dat-D1: Regneark Matematik og databehandling 2012 Henrik L. Pedersen Institut for Matematiske Fag henrikp@life.ku.dk 1 Forberedelsesopgaverne Dat-D-1 og Dat-D-2 2 Regnearks grundprincipper

Læs mere

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M. Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 9, 2015 Sandsynlighedsregning og lagerstyring Normalfordelingen

Læs mere

Undervisning i Dansk Palliativ Database

Undervisning i Dansk Palliativ Database Undervisning i Dansk Palliativ Database - AnalysePortalen og mulighederne for at anvende egne data Undervisning i Dansk Palliativ Database - AnalysePortalen og mulighederne for at anvende egne data Dagens

Læs mere

Kapitel 2 Tal og variable

Kapitel 2 Tal og variable Tal og variable Uden tal ingen matematik - matematik handler om tal og anvendelse af tal. Matematik beskæftiger sig ikke udelukkende med konkrete problemer fra andre fag, og de konkrete tal fra andre fagområder

Læs mere

Kapitel 4 Sandsynlighed og statistiske modeller

Kapitel 4 Sandsynlighed og statistiske modeller Kapitel 4 Sandsynlighed og statistiske modeller Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 Indledning 2 Sandsynlighed i binomialfordelingen 3 Normalfordelingen 4 Modelkontrol

Læs mere

Program. t-test Hypoteser, teststørrelser og p-værdier. Hormonkonc.: statistisk model og konfidensinterval. Hormonkoncentration: data

Program. t-test Hypoteser, teststørrelser og p-værdier. Hormonkonc.: statistisk model og konfidensinterval. Hormonkoncentration: data Faculty of Life Sciences Program t-test Hypoteser, teststørrelser og p-værdier Claus Ekstrøm E-mail: ekstrom@life.ku.dk Resumé og hængepartier fra sidst. Eksempel: effekt af foder på hormonkoncentration

Læs mere

Program dag 2 (11. april 2011)

Program dag 2 (11. april 2011) Program dag 2 (11. april 2011) Dag 2: 1) Hvordan kan man bearbejde data; 2) Undersøgelse af datamaterialet; 3) Forskellige typer statistik; 4) Indledende dataundersøgelser; 5) Hvad kan man sige om sammenhænge;

Læs mere

Manual til regneark anvendt i bogen. René Vitting 2014

Manual til regneark anvendt i bogen. René Vitting 2014 Manual til regneark anvendt i bogen René Vitting 2014 Introduktion. Dette er en manual til de regneark, som du har downloadet sammen med bogen Ind i Gambling. Manualen beskriver, hvordan hvert regneark

Læs mere

Tak for kaffe! 17-10-2004 Tak for kaffe! Side 1 af 16

Tak for kaffe! 17-10-2004 Tak for kaffe! Side 1 af 16 Tak for kaffe! Jette Rygaard Poulsen, Frederikshavn Gymnasium og HF-kursus Hans Vestergaard, Frederikshavn Gymnasium og HF-kursus Søren Lundbye-Christensen, AAU 17-10-2004 Tak for kaffe! Side 1 af 16 Tak

Læs mere

Økonometri: Lektion 4. Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater

Økonometri: Lektion 4. Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater Økonometri: Lektion 4 Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater 1 / 35 Hypotesetest for én parameter Antag vi har model y = β 0 + β 1 x 2 + β 2 x 2 + + β k x k + u. Vi

Læs mere

Hvad er nyt i version 3.6?

Hvad er nyt i version 3.6? Hvad er nyt i version 3.6? 1. Dokumentformater Den afgørende nyhed og også den mest problematiske er indførelsen af nye dokumentformater: Vi har hidtil arbejdet med et flydende dokumentformat. Når man

Læs mere

Oversigt. Kursus 02402 Introduktion til Statistik. Forelæsning 10: Statistik ved hjælp af simulering. Per Bruun Brockhoff.

Oversigt. Kursus 02402 Introduktion til Statistik. Forelæsning 10: Statistik ved hjælp af simulering. Per Bruun Brockhoff. Kursus 02402 Introduktion til Statistik Forelæsning 10: Statistik ved hjælp af simulering Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Noter til Statistik. Lisbeth Tavs Gregersen. 1. udgave

Noter til Statistik. Lisbeth Tavs Gregersen. 1. udgave Noter til Statistik Lisbeth Tavs Gregersen 1. udgave 1 Indhold 1 Intro 3 1.1 HF Bekendtgørelsen........................ 3 1.2 Deskriptiv statistik......................... 3 2 Ikke-grupperet Talmateriale

Læs mere

Bjørn Felsager Seks guidede ture med DataMeter

Bjørn Felsager Seks guidede ture med DataMeter Bjørn Felsager Seks guidede ture med DataMeter DataMeter 1_0 September 2005 Seks guidede ture med DataMeter Indholdsfortegnelse Forord Eksempel 1: Kasseproblemet side 1 1. Problembeskrivelsen side 1 2.

Læs mere

Excel tutorial om lineær regression

Excel tutorial om lineær regression Excel tutorial om lineær regression I denne tutorial skal du lære at foretage lineær regression i Microsoft Excel 2007. Det forudsættes, at læseren har været igennem det indledende om lineære funktioner.

Læs mere

TI-Nspire CAS software Teknikhjælp for begyndere - Et par gør det selv opgaver Plus lidt regression og statistik

TI-Nspire CAS software Teknikhjælp for begyndere - Et par gør det selv opgaver Plus lidt regression og statistik TI-Nspire CAS software Teknikhjælp for begyndere - Et par gør det selv opgaver Plus lidt regression og statistik Klar til start TI-Nspire CAS software...2 Navigation...2 Opgave 3...3 Skriv matematik...3

Læs mere

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression Statikstik II 2. Lektion Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression Sandsynlighedsregningsrepetition Antag at Svar kan være Ja og Nej. Sandsynligheden for at Svar Ja skrives

Læs mere

Statistik II 4. Lektion. Logistisk regression

Statistik II 4. Lektion. Logistisk regression Statistik II 4. Lektion Logistisk regression Logistisk regression: Motivation Generelt setup: Dikotom(binær) afhængig variabel Kontinuerte og kategoriske forklarende variable (som i lineær reg.) Eksempel:

Læs mere

Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet

Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet Eksamen ved Københavns Universitet i Kvantitative forskningsmetoder Det Samfundsvidenskabelige Fakultet 14. december 2011 Eksamensnummer: 5 14. december 2011 Side 1 af 6 1) Af boxplottet kan man aflæse,

Læs mere

Løs nu opgaverne i a) brug alt materialet her samt evt. regnearkene i Fronter som hjælp.

Løs nu opgaverne i a) brug alt materialet her samt evt. regnearkene i Fronter som hjælp. Udarbejdet af Thomas Jensen og Morten Overgård Nielsen Indhold Introduktion til materialet. s. 2 Introduktion til chi i anden test. s. 4 Et eksempel hastighed og ulykker på motorveje s. 8 Sådan udregnes

Læs mere

Grupperet materiale kan f.eks. være befolkningsdata eller indkomstfordelinger.

Grupperet materiale kan f.eks. være befolkningsdata eller indkomstfordelinger. Thomas Jensen & Morten Overgård Nielsen At bestemme kvartilsæt Indhold - At finde kvartilsæt i ikke-grupperet datamateriale (link til dokumentet her) - At bestemme kvartilsæt ved hjælp af Excel (link til

Læs mere

Hint: Man kan alternativt benytte genvejstasterne ctrl+6/cmd+6 for at sprede applikationerne og ctrl+4/cmd+4 for at samle applikationer.

Hint: Man kan alternativt benytte genvejstasterne ctrl+6/cmd+6 for at sprede applikationerne og ctrl+4/cmd+4 for at samle applikationer. [OPGAVER I NSPIRE] 1 Opgave 1) Opgaver og sider - dokumentstyring Start et nyt Nspire dokument. Følg herefter nedenstående trin. a) Opret to opgaver i dokumentet, hvor første opgave består to sider, og

Læs mere

Vejledende besvarelse

Vejledende besvarelse Ib Michelsen Svar: stx B 29. maj 2013 Side 1 1. Udfyld tabellen Vejledende besvarelse Givet funktionen f (x)=4 5 x beregnes f(2) f (2)=4 5 2 =4 25=100 Den udfyldte tabel er derfor: x 0 1 2 f(x) 4 20 100

Læs mere

KURSUS I ANALYSEPORTALEN (AP) DANSK PALLIATIV DATABASE 3 1. ÅBNING AF ANALYSEPORTALEN 3 2. OPRETTELSE AF EN RAPPORT DVS. START AF DATAANALYSE 4

KURSUS I ANALYSEPORTALEN (AP) DANSK PALLIATIV DATABASE 3 1. ÅBNING AF ANALYSEPORTALEN 3 2. OPRETTELSE AF EN RAPPORT DVS. START AF DATAANALYSE 4 KURSUS I ANALYSEPORTALEN (AP) DANSK PALLIATIV DATABASE 3 1. ÅBNING AF ANALYSEPORTALEN 3 2. OPRETTELSE AF EN RAPPORT DVS. START AF DATAANALYSE 4 3. VALG AF DATA 5 4. BEHANDLING OG VISNING AF DATA 7 1 Liste

Læs mere

En håndbog om tælling af biblioteksbesøg i de danske folkebiblioteker

En håndbog om tælling af biblioteksbesøg i de danske folkebiblioteker En håndbog om tælling af biblioteksbesøg i de danske folkebiblioteker Udarbejdet af DIOS A/S December 2001 INDHOLDSFORTEGNELSE REGISTRERING AF ANTAL BIBLIOTEKSBESØG...1 BAGGRUNDEN FOR METODENS UDVIKLING...1

Læs mere

Introduktion til EXCEL med øvelser

Introduktion til EXCEL med øvelser Side 1 af 10 Introduktion til EXCEL med øvelser Du kender en almindelig regnemaskine, som kan være til stort hjælp, når man skal beregne resultater med store tal. Et regneark er en anden form for regnemaskine,

Læs mere

Indholdsfortegnelse. Regneark for matematiklærere

Indholdsfortegnelse. Regneark for matematiklærere Indholdsfortegnelse Forord... 3 Diskettens indhold... 4 Grafer i koordinatsystemet... 5 Brug af guiden diagram... 5 Indret regnearket fornuftigt... 9 Regneark hentet på Internettet... 15 Læsevenlige tal

Læs mere

matx.dk Undersøgelsesdesign Statistik Dennis Pipenbring

matx.dk Undersøgelsesdesign Statistik Dennis Pipenbring matx.dk Undersøgelsesdesign Statistik Dennis Pipenbring 7. april 2011 Indhold 1 Undersøgelsesdesign 5 1.1 Kausalitet............................. 5 1.2 Validitet og bias......................... 6 1.3

Læs mere

Elevmateriale. Forløb Statistik

Elevmateriale. Forløb Statistik Elevmateriale Forløb Statistik Første lektion: I første lektion skal eleverne reflektere over, hvordan man sammenligner datasæt. Hvordan afgør man, hvor høj man er i 5. klasse? I andre dele af matematikken

Læs mere

Program. Logistisk regression. Eksempel: pesticider og møl. Odds og odds-ratios (igen)

Program. Logistisk regression. Eksempel: pesticider og møl. Odds og odds-ratios (igen) Faculty of Life Sciences Program Logistisk regression Claus Ekstrøm E-mail: ekstrom@life.ku.dk Odds og odds-ratios igen Logistisk regression Estimation og inferens Modelkontrol Slide 2 Statistisk Dataanalyse

Læs mere

Maple. Skærmbilledet. Vi starter med at se lidt nærmere på opstartsbilledet i Maple. Værktøjslinje til indtastningsområdet. Menulinje.

Maple. Skærmbilledet. Vi starter med at se lidt nærmere på opstartsbilledet i Maple. Værktøjslinje til indtastningsområdet. Menulinje. Maple Dette kapitel giver en kort introduktion til hvordan Maple 12 kan benyttes til at løse mange af de opgaver, som man bliver mødt med i matematiktimerne på HHX. Skærmbilledet Vi starter med at se lidt

Læs mere

Teknikker til analyse af tal med Excel

Teknikker til analyse af tal med Excel 1 Appendiks 2 Teknikker til analyse af tal med Excel Dette appendiks indeholder mange gentagelser fra kapitel 10, afsnit 4 Teknikker til analyse af tal i Den skinbarlige virkelighed) dog med den forskel,

Læs mere

Foreløbig udgave af læringsmål til: Kapitel 1 Regn med store tal Fælles Mål Læringsmål Forslag til tegn på læring

Foreløbig udgave af læringsmål til: Kapitel 1 Regn med store tal Fælles Mål Læringsmål Forslag til tegn på læring Foreløbig udgave af læringsmål til: Kapitel 1 Regn med store tal Fælles Mål Læringsmål Forslag til tegn på læring udføre beregninger med de fire regningsarter inden for naturlige tal, herunder beregninger

Læs mere

Grundlæggende metode og videnskabsteori. 5. september 2011

Grundlæggende metode og videnskabsteori. 5. september 2011 Grundlæggende metode og videnskabsteori 5. september 2011 Dagsorden Metodiske overvejelser Kvantitativ >< Kvalitativ metode Kvalitet i kvantitative undersøgelser: Validitet og reliabilitet Dataindsamling

Læs mere

KORTLÆGNING AF DIGITIALISERINGS- BEHOV I DANMARK HUMANOMICS RESEARCH CENTER

KORTLÆGNING AF DIGITIALISERINGS- BEHOV I DANMARK HUMANOMICS RESEARCH CENTER ANALYSERAPPORT KORTLÆGNING AF DIGITIALISERINGS- BEHOV I DANMARK HUMANOMICS RESEARCH CENTER Denne rapport samt bilag indeholder den endelige database af spørgeskemaet Anvendelsen af digitale ressourcer

Læs mere

brikkerne til regning & matematik statistik preben bernitt

brikkerne til regning & matematik statistik preben bernitt brikkerne til regning & matematik statistik 2+ preben bernitt brikkerne til regning & matematik statistik 2+ 1. udgave som E-bog ISBN: 978-87-92488-33-6 2009 by bernitt-matematik.dk Kopiering af denne

Læs mere

Undervisningsbeskrivelse

Undervisningsbeskrivelse Undervisningsbeskrivelse Stamoplysninger til brug ved prøver til gymnasiale uddannelser Termin Maj/juni 2012 (denne beskrivelse dækker efterår 2011 og forår 2012) Institution Roskilde Handelsskole Uddannelse

Læs mere

How to do in rows and columns 8

How to do in rows and columns 8 INTRODUKTION TIL REGNEARK Denne artikel handler generelt om, hvad regneark egentlig er, og hvordan det bruges på et principielt plan. Indholdet bør derfor kunne anvendes uden hensyn til, hvilken version

Læs mere

Matematik. Matematikundervisningen tager udgangspunkt i Folkeskolens Fælles Mål

Matematik. Matematikundervisningen tager udgangspunkt i Folkeskolens Fælles Mål Matematik Matematikundervisningen tager udgangspunkt i Folkeskolens Fælles Mål Formålet med undervisningen i matematik er, at eleverne bliver i stand til at forstå og anvende matematik i sammenhænge, der

Læs mere

Regneark LibreOffice. Øvelseshæfte. Version: September 2013

Regneark LibreOffice. Øvelseshæfte. Version: September 2013 Regneark LibreOffice Øvelseshæfte Version: September 2013 Indholdsfortegnelse Øvelserne...4 Øvelse 1 Gem en kopi...4 Øvelse 2 Omdøb faneblad + lav en kopi...4 Øvelse 3 - tekstombrydning...5 Øvelse 4 Sorter

Læs mere

U L I G H E D I D A N M A R K

U L I G H E D I D A N M A R K D E N N I S P I P E N B R I N G U L I G H E D I D A N M A R K M AT X. D K Copyright 2013 Dennis Pipenbring offentliggjort på matx.dk layout af tufte-latex.googlecode.com Materialet er til fri afbenyttelse

Læs mere

For at få tegnet en graf trykkes på knappen for graftegning. Knap for graftegning

For at få tegnet en graf trykkes på knappen for graftegning. Knap for graftegning Graftegning på regneark. Ved hjælp af Excel regneark kan man nemt tegne grafer. Man åbner for regnearket ligger under Microsoft Office. Så indtaster man tallene fra tabellen i regnearkets celler i en vandret

Læs mere

Dagens program. Velkommen og præsentation.

Dagens program. Velkommen og præsentation. Dagens program Velkommen og præsentation. Evt. udveksling af mailadresser. Forenklede Fælles Mål om geometri og dynamiske programmer. Screencast, hvordan og hvorfor? Opgave om polygoner i GeoGebra, løst

Læs mere

LÆRINGSMÅL PÅ NIF MATEMATIK 2014-15

LÆRINGSMÅL PÅ NIF MATEMATIK 2014-15 LÆRINGSMÅL PÅ NIF MATEMATIK 2014-15 Mål for undervisningen i Matematik på NIF Følgende er baseret på de grønlandske læringsmål, tilføjelser fra de danske læringsmål står med rød skrift. Læringsmål Yngstetrin

Læs mere

Mathcad Survival Guide

Mathcad Survival Guide Mathcad Survival Guide Mathcad er en blanding mellem et tekstbehandlingsprogram (Word), et regneark (Ecel) og en grafisk CAS-lommeregner. Programmet er velegnet til matematikopgaver, fysikrapporter og

Læs mere

Normalfordelingen. Erik Vestergaard

Normalfordelingen. Erik Vestergaard Normalfordelingen Erik Vestergaard Erik Vestergaard www.matematiksider.dk Erik Vestergaard, 008. Billeder: Forside: jakobkramer.dk/jakob Kramer Side 7: istock.com/elenathewise Side 8: istock.com/jaroon

Læs mere

Projektopgave Observationer af stjerneskælv

Projektopgave Observationer af stjerneskælv Projektopgave Observationer af stjerneskælv Af: Mathias Brønd Christensen (20073504), Kristian Jerslev (20072494), Kristian Mads Egeris Nielsen (20072868) Indhold Formål...3 Teori...3 Hvorfor opstår der

Læs mere

SÅDAN BRUGER DU REGNEARK INTRODUKTION

SÅDAN BRUGER DU REGNEARK INTRODUKTION SÅDAN BRUGER DU REGNEARK INTRODUKTION I vejledningen bruger vi det gratis program Calc fra OpenOffice som eksempel til at vise, hvordan man bruger nogle helt grundlæggende funktioner i regneark. De øvrige

Læs mere

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x) Formelsamlingen 1 Regneregler for middelværdier M(a + bx) a + bm X M(X+Y) M X +M Y Spredning varians og standardafvigelse VAR(X) 1 n n i1 ( X i - M x ) 2 Y a + bx VAR(Y) VAR(a+bX) b²var(x) 2 Kovariansen

Læs mere

Regneark for begyndere

Regneark for begyndere Regneark for begyndere Regneark i Open- og LibreOffice Version: August 2012 Indholdsfortegnelse Hvad er et regneark?...4 Grundlæggende opbygning...4 Kast dig ud i det!...5 Du arbejder med: Din første

Læs mere

Forslag til program: Statistiske undersøgelser på kirkegården 3. kl.

Forslag til program: Statistiske undersøgelser på kirkegården 3. kl. Forslag til program: Statistiske undersøgelser på kirkegården 3. kl. Forberedelse: (Ca. 5-6 timer) 1) Forforståelse: Hvad ved I om kirkegårde? (fælles) Udfyld et tankekort Tankekort om kirkegårde (Word).

Læs mere

Om at finde bedste rette linie med Excel

Om at finde bedste rette linie med Excel Om at finde bedste rette linie med Excel Det er en vigtig og interessant opgave at beskrive fænomener i naturen eller i samfundet matematisk. Dels for at få en forståelse af sammenhængende indenfor det

Læs mere

Regneark hvorfor nu det?

Regneark hvorfor nu det? Regneark hvorfor nu det? Af seminarielektor, cand. pæd. Arne Mogensen Et åbent program et værktøj... 2 Sådan ser det ud... 3 Type 1 Beregning... 3 Type 2 Præsentation... 4 Type 3 Gæt... 5 Type 4 Eksperiment...

Læs mere