Kapitel 3 Centraltendens og spredning
|
|
|
- Karen Bertelsen
- 9 år siden
- Visninger:
Transkript
1 Kapitel 3 Centraltendens og spredning Peter Tibert Stoltze [email protected] Elementær statistik F2011
2 1 Indledning 2 Centraltendens 3 Spredning 4 Praktisk beregning 5 Fraktiler 6 Opsamling
3 1 Indledning 2 Centraltendens 3 Spredning 4 Praktisk beregning 5 Fraktiler 6 Opsamling
4 Indledning I kapitel 2 omsatte vi de rå data til en tabel, der bedre viste materialets fordeling Fordelingen illustrerede vi med forskellige former for grafik Nu vil vi gerne karakterisere fordelingerne kvantitativt gennem deres beliggenhed og variation
5 1 Indledning 2 Centraltendens 3 Spredning 4 Praktisk beregning 5 Fraktiler 6 Opsamling
6 Centraltendens Typetal eller modus (eng: mode) Aritmetisk middelværdi eller stikprøvegennemsnit (eng: mean or sample mean) Median
7 Modus Modus eller typetallet er den hyppigst forekommende værdi Eneste anvendelige mål for data målt på nominalskala (m/k, ja/nej) men vel nok mest anvendt ifm. data målt på ordinalskala (karakterer, scores) Læsescores: 71 for pigerne mod 55 for drengene Beregnes i Excel med funktionen hyppigst
8 Modus Modus eller typetallet er den hyppigst forekommende værdi Eneste anvendelige mål for data målt på nominalskala (m/k, ja/nej) men vel nok mest anvendt ifm. data målt på ordinalskala (karakterer, scores) Læsescores: 71 for pigerne mod 55 for drengene Beregnes i Excel med funktionen hyppigst
9 Aritmetisk middelværdi Betegnes også tit som stikprøvegennemsnit Den aritmetiske middelværdi er summen af observationerne i forhold til antallet af observationer x = 1 n n i=1 x i = x 1 + x x n n Læsescores: 59,7 for pigerne mod 51,9 for drengene Beregnes i Excel med funktionen middel
10 Aritmetisk middelværdi Betegnes også tit som stikprøvegennemsnit Den aritmetiske middelværdi er summen af observationerne i forhold til antallet af observationer x = 1 n n i=1 x i = x 1 + x x n n Læsescores: 59,7 for pigerne mod 51,9 for drengene Beregnes i Excel med funktionen middel
11 Median Medianen er den midterste observation (gennemsnittet af de to midterste hvis n er lige) Specialtilfælde af generelt fraktilbegreb, som vi gennemgår senere Læsescores: 62,5 for pigerne mod 50,5 for drengene Beregnes i Excel med funktionen median
12 Median Medianen er den midterste observation (gennemsnittet af de to midterste hvis n er lige) Specialtilfælde af generelt fraktilbegreb, som vi gennemgår senere Læsescores: 62,5 for pigerne mod 50,5 for drengene Beregnes i Excel med funktionen median
13 Centraltendenser for læsescores Score Drenge Piger n Modus x (stikprøvegennemsnit) 51,9 59,7 Median 50,5 62,5
14 1 Indledning 2 Centraltendens 3 Spredning 4 Praktisk beregning 5 Fraktiler 6 Opsamling
15 Spredning og varians Spredning kaldes også for standardafvigelse Spredning på læsescores er 16,6 for pigerne mod 19,2 for drengene der er større spredning på drengenes score end på pigernes, der i gennemsnit ligner hinanden mere Med Excel benyttes funktionerne stdafv og varians til beregning af spredning og varians
16 Spredning og varians Spredning kaldes også for standardafvigelse Spredning på læsescores er 16,6 for pigerne mod 19,2 for drengene der er større spredning på drengenes score end på pigernes, der i gennemsnit ligner hinanden mere Med Excel benyttes funktionerne stdafv og varians til beregning af spredning og varians
17 Spredning og varians Spredning kaldes også for standardafvigelse Spredning på læsescores er 16,6 for pigerne mod 19,2 for drengene der er større spredning på drengenes score end på pigernes, der i gennemsnit ligner hinanden mere Med Excel benyttes funktionerne stdafv og varians til beregning af spredning og varians
18 Spredning og varians Spredningen s er kvadratroden af variansen s 2 Variansen s 2 er kvadratet på spredningen s Variansen beregnes efter følgende formel: hvor s 2 = 1 n 1 SAK x = n i=1 n i=1 (x i x) 2 = SAK x n 1 x 2 i 1 n n ( x i ) 2 i=1 Hvis der ikke er tale om en stikprøve kan man benytte n i stedet for n 1 i nævneren, men...
19 Spredning og varians Spredningen s er kvadratroden af variansen s 2 Variansen s 2 er kvadratet på spredningen s Variansen beregnes efter følgende formel: hvor s 2 = 1 n 1 SAK x = n i=1 n i=1 (x i x) 2 = SAK x n 1 x 2 i 1 n n ( x i ) 2 i=1 Hvis der ikke er tale om en stikprøve kan man benytte n i stedet for n 1 i nævneren, men...
20 Spredning og varians Spredningen s er kvadratroden af variansen s 2 Variansen s 2 er kvadratet på spredningen s Variansen beregnes efter følgende formel: hvor s 2 = 1 n 1 SAK x = n i=1 n i=1 (x i x) 2 = SAK x n 1 x 2 i 1 n n ( x i ) 2 i=1 Hvis der ikke er tale om en stikprøve kan man benytte n i stedet for n 1 i nævneren, men...
21 n 1 giver centrale estimater SAK n SAK n 1 Population ,80 61,00 Stikprøve ,19 10,92 Stikprøve ,00 81,33 Stikprøve ,69 80,92 Stikprøve ,19 70,92 Stikprøve ,69 60,92 Gennemsnit 45,75 61,00
22 Standardafvigelse og standardfejl Spredning kaldes også for standardafvigelse (eng: standard deviation) Må ikke forveksles med standardfejl (eng: standard error), der er spredningen på middelværdien: s x = s n Dette vender vi tilbage til i kapitel 4
23 Standardafvigelse og standardfejl Spredning kaldes også for standardafvigelse (eng: standard deviation) Må ikke forveksles med standardfejl (eng: standard error), der er spredningen på middelværdien: s x = s n Dette vender vi tilbage til i kapitel 4
24 1 Indledning 2 Centraltendens 3 Spredning 4 Praktisk beregning 5 Fraktiler 6 Opsamling
25 Først lidt opsamling på nomenklatur Vi regner på en simpelt tilfældigt udtaget stikprøve fra en population. Vi antager at observationerne er målt på en intervalskala eller en ratioskala. Gennemsnittet i stikprøven x er et estimat for middelværdien µ i populationen: ˆµ = x Spredningen i stikprøven s er estimat for spredningen σ i populationen: ˆσ = s Spredningen er målt på samme skala som observationerne det er variansen ikke.
26 Først lidt opsamling på nomenklatur Vi regner på en simpelt tilfældigt udtaget stikprøve fra en population. Vi antager at observationerne er målt på en intervalskala eller en ratioskala. Gennemsnittet i stikprøven x er et estimat for middelværdien µ i populationen: ˆµ = x Spredningen i stikprøven s er estimat for spredningen σ i populationen: ˆσ = s Spredningen er målt på samme skala som observationerne det er variansen ikke.
27 Først lidt opsamling på nomenklatur Vi regner på en simpelt tilfældigt udtaget stikprøve fra en population. Vi antager at observationerne er målt på en intervalskala eller en ratioskala. Gennemsnittet i stikprøven x er et estimat for middelværdien µ i populationen: ˆµ = x Spredningen i stikprøven s er estimat for spredningen σ i populationen: ˆσ = s Spredningen er målt på samme skala som observationerne det er variansen ikke.
28 Først lidt opsamling på nomenklatur Vi regner på en simpelt tilfældigt udtaget stikprøve fra en population. Vi antager at observationerne er målt på en intervalskala eller en ratioskala. Gennemsnittet i stikprøven x er et estimat for middelværdien µ i populationen: ˆµ = x Spredningen i stikprøven s er estimat for spredningen σ i populationen: ˆσ = s Spredningen er målt på samme skala som observationerne det er variansen ikke.
29 Først lidt opsamling på nomenklatur Vi regner på en simpelt tilfældigt udtaget stikprøve fra en population. Vi antager at observationerne er målt på en intervalskala eller en ratioskala. Gennemsnittet i stikprøven x er et estimat for middelværdien µ i populationen: ˆµ = x Spredningen i stikprøven s er estimat for spredningen σ i populationen: ˆσ = s Spredningen er målt på samme skala som observationerne det er variansen ikke.
30 Praktisk beregning af middelværdi og spredning Data (stikprøven) præsenteres på en liste på følgende måde x = {9; 2; 8; 11; 16; 16; 6; 5; 4; 6} Start med at bestemme antallet af observationer n = 10 og dernæst summen af observationerne (indeks på sumtegnene er udeladt, da der summeres over alle observationer) x = = 83 Nu kan du bestemme gennemsnittet i stikprøven x x = n = = 8, 3
31 Praktisk beregning af middelværdi og spredning Data (stikprøven) præsenteres på en liste på følgende måde x = {9; 2; 8; 11; 16; 16; 6; 5; 4; 6} Start med at bestemme antallet af observationer n = 10 og dernæst summen af observationerne (indeks på sumtegnene er udeladt, da der summeres over alle observationer) x = = 83 Nu kan du bestemme gennemsnittet i stikprøven x x = n = = 8, 3
32 Praktisk beregning af middelværdi og spredning Data (stikprøven) præsenteres på en liste på følgende måde x = {9; 2; 8; 11; 16; 16; 6; 5; 4; 6} Start med at bestemme antallet af observationer n = 10 og dernæst summen af observationerne (indeks på sumtegnene er udeladt, da der summeres over alle observationer) x = = 83 Nu kan du bestemme gennemsnittet i stikprøven x x = n = = 8, 3
33 Praktisk beregning af middelværdi og spredning Data (stikprøven) præsenteres på en liste på følgende måde x = {9; 2; 8; 11; 16; 16; 6; 5; 4; 6} Start med at bestemme antallet af observationer n = 10 og dernæst summen af observationerne (indeks på sumtegnene er udeladt, da der summeres over alle observationer) x = = 83 Nu kan du bestemme gennemsnittet i stikprøven x x = n = = 8, 3
34 Praktisk beregning af middelværdi og spredning Så beregner du summen af de kvadrerede observationer (kvadratsummen) x 2 = = 895 så du kan beregne summen af de kvadrerede afvigelser fra gennemsnittet (summen af afvigelsernes kvadrater) SAK x = (x i x) 2 = x 2 1 n ( x) 2 = = 206, 1 Så kan du beregne variansen for xerne i stikprøven var(x) ˆ = SAK x n 1 = 206, = 22, 9 og endelig spredningen (stikprøvestandardafvigelsen) s = var(x) ˆ = 22, 9 = 4, 8
35 Praktisk beregning af middelværdi og spredning Så beregner du summen af de kvadrerede observationer (kvadratsummen) x 2 = = 895 så du kan beregne summen af de kvadrerede afvigelser fra gennemsnittet (summen af afvigelsernes kvadrater) SAK x = (x i x) 2 = x 2 1 n ( x) 2 = = 206, 1 Så kan du beregne variansen for xerne i stikprøven var(x) ˆ = SAK x n 1 = 206, = 22, 9 og endelig spredningen (stikprøvestandardafvigelsen) s = var(x) ˆ = 22, 9 = 4, 8
36 Praktisk beregning af middelværdi og spredning Så beregner du summen af de kvadrerede observationer (kvadratsummen) x 2 = = 895 så du kan beregne summen af de kvadrerede afvigelser fra gennemsnittet (summen af afvigelsernes kvadrater) SAK x = (x i x) 2 = x 2 1 n ( x) 2 = = 206, 1 Så kan du beregne variansen for xerne i stikprøven var(x) ˆ = SAK x n 1 = 206, = 22, 9 og endelig spredningen (stikprøvestandardafvigelsen) s = var(x) ˆ = 22, 9 = 4, 8
37 Praktisk beregning af middelværdi og spredning Så beregner du summen af de kvadrerede observationer (kvadratsummen) x 2 = = 895 så du kan beregne summen af de kvadrerede afvigelser fra gennemsnittet (summen af afvigelsernes kvadrater) SAK x = (x i x) 2 = x 2 1 n ( x) 2 = = 206, 1 Så kan du beregne variansen for xerne i stikprøven var(x) ˆ = SAK x n 1 = 206, = 22, 9 og endelig spredningen (stikprøvestandardafvigelsen) s = var(x) ˆ = 22, 9 = 4, 8
38 1 Indledning 2 Centraltendens 3 Spredning 4 Praktisk beregning 5 Fraktiler 6 Opsamling
39 Fraktiler Om P%-fraktilen gælder, at P procent af observationerne er mindre end eller lig denne værdi Der er nogle fraktilværdier, man ofte er specielt interesseret i: Medianen (50) Kvartiler (25, 50, 75) Deciler (10, 20,..., 90) Percentiler (1, 2,..., 99) Specielt er 25% fraktilen den nedre kvartil og 75% fraktilen den øvre kvartil, og forskellen mellem øvre og nedre kvartil kaldes for interkvartilafstanden (IQR)
40 Fraktiler Om P%-fraktilen gælder, at P procent af observationerne er mindre end eller lig denne værdi Der er nogle fraktilværdier, man ofte er specielt interesseret i: Medianen (50) Kvartiler (25, 50, 75) Deciler (10, 20,..., 90) Percentiler (1, 2,..., 99) Specielt er 25% fraktilen den nedre kvartil og 75% fraktilen den øvre kvartil, og forskellen mellem øvre og nedre kvartil kaldes for interkvartilafstanden (IQR)
41 Fraktiler Om P%-fraktilen gælder, at P procent af observationerne er mindre end eller lig denne værdi Der er nogle fraktilværdier, man ofte er specielt interesseret i: Medianen (50) Kvartiler (25, 50, 75) Deciler (10, 20,..., 90) Percentiler (1, 2,..., 99) Specielt er 25% fraktilen den nedre kvartil og 75% fraktilen den øvre kvartil, og forskellen mellem øvre og nedre kvartil kaldes for interkvartilafstanden (IQR)
42 Direkte beregning af fraktiler Lad en stikprøve med n elementer være opstillet i rækkefølge, således at x 1 er den mindste observation og x n er den største, da er den i te observation P-fraktilen i stikprøven, hvor P = i 0, 5 n For store stikprøver er således P 0 for i = 1 og P 1 for i = n Ønsker man at kende en bestemt fraktil, da kan man regne baglæns i ovenstående udtryk, hvor resultatet dog kun sjældent vil være heltalligt i og dermed en bestemt observation. Dette kan løses ved lineær interpolation...
43 Direkte beregning af fraktiler Lad en stikprøve med n elementer være opstillet i rækkefølge, således at x 1 er den mindste observation og x n er den største, da er den i te observation P-fraktilen i stikprøven, hvor P = i 0, 5 n For store stikprøver er således P 0 for i = 1 og P 1 for i = n Ønsker man at kende en bestemt fraktil, da kan man regne baglæns i ovenstående udtryk, hvor resultatet dog kun sjældent vil være heltalligt i og dermed en bestemt observation. Dette kan løses ved lineær interpolation...
44 Direkte beregning af fraktiler Lad en stikprøve med n elementer være opstillet i rækkefølge, således at x 1 er den mindste observation og x n er den største, da er den i te observation P-fraktilen i stikprøven, hvor P = i 0, 5 n For store stikprøver er således P 0 for i = 1 og P 1 for i = n Ønsker man at kende en bestemt fraktil, da kan man regne baglæns i ovenstående udtryk, hvor resultatet dog kun sjældent vil være heltalligt i og dermed en bestemt observation. Dette kan løses ved lineær interpolation...
45 Beregning af fraktiler for grupperet data hvor P% = L + P er den ønskede fraktil k( Pn 100 F ) f L nedre grænse i klassen, hvor den ønskede fraktil befinder sig k er klassebredden n er antal observationer F er antal observationer op til nedre grænse i den klasse, hvor fraktilen befinder sig f er antal observationer i den klasse, hvor fraktilen befinder sig
46 Eksempel: Vokalvarighed Frekvensfordeling for vokalvarighed i ms. Klassebredde er 5ms. Nedre Øvre Frekvens Kumulativ frekvens Relativt 184, ,0 184,5 189, ,0 189,5 194, ,0 194,5 199, ,5 199,5 204, ,5 204,5 209, ,0 209,5 214, ,0 214,5 219, ,0 219,5 224, ,0 224,5 229, ,5 229,5 234, ,0 234, ,0 40
47 Kumulativ fordeling af vokalvarighed Fraktil [pct.] Grupperet data Direkte beregning Vokalvarighed [ms]
48 Eksempel på beregning Vi vil beregne 50% fraktilen (medianen) for datasættet med vokalvarighed: Median = L + Pn k( 100 F ) ( 100 = 204, ) = 208, 39 f 9 Vi kunne også lave interpolation i tabellen: dvs. bestemme x 204,5 32,5 x 50,0 209,5 55,0
49 Lineær interpolation generelt Vi kender punkterne (x 1, y 1 ) og (x 2, y 2 ) og ønsker at bestemme punktet (x, y ) idet vi kender den ene af koordinaterne. Vi antager at der gælder y 2 y 1 x 2 x 1 = y y 1 x x 1 Kender vi x kan vi bestemme y som y = y 1 + y 2 y 1 x 2 x 1 (x x 1 ) Kender vi omvendt y kan vi bestemme x som x = x 1 + x 2 x 1 y 2 y 1 (y y 1 )
50 Lineær interpolation grafisk Fraktil [pct.] (204.5, 32.5) (209.5, 55.0) (208.39, 50) Vokalvarighed [ms] 55, 0 32, 5 50, 0 32, 5 = 209, 5 204, 5 x 204, 5 x 209, 5 204, 5 = 204, 5 + (50, 0 32, 5) = 208, 39 55, 0 32, 5
51 Beregning med Excel Beregnes i Excel med funktionen fraktil Der benyttes her en lidt anden definition end den her anvendte, men resultaterne minder en del om hinanden (specielt for store n) Beregning med Excel af de tre kvartiler samt interkvartilafstand (IQR) og spredning (s) for læsescores: Fraktil Drenge Piger 25% fraktil 39,3 55,0 50% fraktil 49,0 62,7 75% fraktil 65,0 67,6 IQR 25,8 12,6 s 19,2 16,6
52 Omsamling omkring fraktiler Om P%-fraktilen for et datasæt gælder, at P procent af observationerne i datasættet er mindre end eller lig denne værdi Specielle fraktiler har navne som kvartiler, deciler og percentiler, men det er altså alle fraktiler Beregning kan foretages direkte på stikprøven, typisk vha en regnearksfunktion Der kan også laves beregning for grupperede data enten med en lidt kryptisk formel eller ved lineær interpolation
53 Omsamling omkring fraktiler Om P%-fraktilen for et datasæt gælder, at P procent af observationerne i datasættet er mindre end eller lig denne værdi Specielle fraktiler har navne som kvartiler, deciler og percentiler, men det er altså alle fraktiler Beregning kan foretages direkte på stikprøven, typisk vha en regnearksfunktion Der kan også laves beregning for grupperede data enten med en lidt kryptisk formel eller ved lineær interpolation
54 Omsamling omkring fraktiler Om P%-fraktilen for et datasæt gælder, at P procent af observationerne i datasættet er mindre end eller lig denne værdi Specielle fraktiler har navne som kvartiler, deciler og percentiler, men det er altså alle fraktiler Beregning kan foretages direkte på stikprøven, typisk vha en regnearksfunktion Der kan også laves beregning for grupperede data enten med en lidt kryptisk formel eller ved lineær interpolation
55 Omsamling omkring fraktiler Om P%-fraktilen for et datasæt gælder, at P procent af observationerne i datasættet er mindre end eller lig denne værdi Specielle fraktiler har navne som kvartiler, deciler og percentiler, men det er altså alle fraktiler Beregning kan foretages direkte på stikprøven, typisk vha en regnearksfunktion Der kan også laves beregning for grupperede data enten med en lidt kryptisk formel eller ved lineær interpolation
56 1 Indledning 2 Centraltendens 3 Spredning 4 Praktisk beregning 5 Fraktiler 6 Opsamling
57 Opsamling Vi regner på en simpelt tilfældigt udvalgt stikprøve fra en population Centraltendens kan beskrives ved modus, stikprøvegennemsnit og median Spredning kan beskrives ved variationsområde, stikprøvestandardafvigelse og interkvartilafstand Den samlede fordeling kan beskrives med den empiriske fordelingsfunktion, dvs. fraktilværdien afsat som funktion af observationsværdien.
58 Opsamling Vi regner på en simpelt tilfældigt udvalgt stikprøve fra en population Centraltendens kan beskrives ved modus, stikprøvegennemsnit og median Spredning kan beskrives ved variationsområde, stikprøvestandardafvigelse og interkvartilafstand Den samlede fordeling kan beskrives med den empiriske fordelingsfunktion, dvs. fraktilværdien afsat som funktion af observationsværdien.
59 Opsamling Vi regner på en simpelt tilfældigt udvalgt stikprøve fra en population Centraltendens kan beskrives ved modus, stikprøvegennemsnit og median Spredning kan beskrives ved variationsområde, stikprøvestandardafvigelse og interkvartilafstand Den samlede fordeling kan beskrives med den empiriske fordelingsfunktion, dvs. fraktilværdien afsat som funktion af observationsværdien.
60 Opsamling Vi regner på en simpelt tilfældigt udvalgt stikprøve fra en population Centraltendens kan beskrives ved modus, stikprøvegennemsnit og median Spredning kan beskrives ved variationsområde, stikprøvestandardafvigelse og interkvartilafstand Den samlede fordeling kan beskrives med den empiriske fordelingsfunktion, dvs. fraktilværdien afsat som funktion af observationsværdien.
Kapitel 3 Centraltendens og spredning
Kapitel 3 Centraltendens og spredning Peter Tibert Stoltze [email protected] Elementær statistik F2011 1 / 25 Indledning I kapitel 2 omsatte vi de rå data til en tabel, der bedre viste materialets fordeling
Module 2: Beskrivende Statistik
Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen og Hans Chr. Petersen Module 2: Beskrivende Statistik 2.1 Histogrammer og søjlediagrammer......................... 1 2.2 Sammenfatning
Kapitel 2 Frekvensfordelinger
Kapitel 2 Frekvensfordelinger Peter Tibert Stoltze [email protected] Elementær statistik F2011 1 Indledning 2 Grafik af frekvensfordelinger 3 Frekvensfordeling med Excel 4 Opsamling 1 Indledning 2 Grafik
Kapitel 1 Statistiske grundbegreber
Kapitel 1 Statistiske grundbegreber Peter Tibert Stoltze [email protected] Elementær statistik F2011 1 Indledning 2 Population versus stikprøve 3 Variabeltyper og måleskalaer 4 Parametrisk versus ikke-parametrisk
Statistik med GeoGebra
Statistik med GeoGebra Hayati Balo, AAMS, marts 2012 1 Observationssæt Det talmateriale, som man gerne vil undersøge, kaldes et observationssæt. Det talsæt som fremgår i tabel 5.1 kan indsættes i GeoGebra
Løsninger til kapitel 1
Opgave. a) observation hyppighed frekvens kum. frekvens 2,25,25 3,875,325 2 3,875,5 3 3,875,6875 4,625,75 5,625,825 6,,825 7 2,25,9375 8,,9375 9,625, Frekvenser illustreres i et pindediagram,2,8,6,4,2,,8,6,4,2
Modul 5: Test for én stikprøve
Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 5: Test for én stikprøve 5.1 Test for middelværdi................................. 1 5.1.1 t-fordelingen.................................
Deskriptiv statistik. Version 2.1. Noterne er et supplement til Vejen til matematik AB1. Henrik S. Hansen, Sct. Knuds Gymnasium
Deskriptiv (beskrivende) statistik er den disciplin, der trækker de væsentligste oplysninger ud af et ofte uoverskueligt materiale. Det sker f.eks. ved at konstruere forskellige deskriptorer, d.v.s. regnestørrelser,
Hypotese test. Repetition fra sidst Hypoteser Test af middelværdi Test af andel Test af varians Type 1 og type 2 fejl Signifikansniveau
ypotese test Repetition fra sidst ypoteser Test af middelværdi Test af andel Test af varians Type 1 og type fejl Signifikansniveau Konfidens intervaller Et konfidens interval er et interval, der estimerer
Kapitel 7 Forskelle mellem centraltendenser
Kapitel 7 Forskelle mellem centraltendenser Peter Tibert Stoltze [email protected] Elementær statistik F2011 1 / 29 Indledning 1. z-test for ukorrelerede data 2. t-test for ukorrelerede data med ens
Konfidensinterval for µ (σ kendt)
Program 1. Repetition: konfidens-intervaller. 2. Hypotese test 3. Type I og type II fejl, p-værdi 4. En og to-sidede tests 5. Test for middelværdi (kendt varians) 6. Test for middelværdi (ukendt varians)
Statistik og Sandsynlighedsregning 2
Statistik og Sandsynlighedsregning 2 Den flerdimensionale normalfordeling, fordeling af ( X,SSD) Helle Sørensen Uge 9, mandag SaSt2 (Uge 9, mandag) Flerdim. N, ford. af ( X,SSD) 1 / 16 Program Resultaterne
Program. 1. Repetition: konfidens-intervaller. 2. Hypotese test, type I og type II fejl, signifikansniveau, styrke, en- og to-sidede test.
Program 1. Repetition: konfidens-intervaller. 2. Hypotese test, type I og type II fejl, signifikansniveau, styrke, en- og to-sidede test. 1/19 Konfidensinterval for µ (σ kendt) Estimat ˆµ = X bedste bud
Kapitel 11 Lineær regression
Kapitel 11 Lineær regression Peter Tibert Stoltze [email protected] Elementær statistik F2011 1 / 1 Indledning Vi modellerer en afhængig variabel (responset) på baggrund af en uafhængig variabel (stimulus),
Kapitel 4 Sandsynlighed og statistiske modeller
Kapitel 4 Sandsynlighed og statistiske modeller Peter Tibert Stoltze [email protected] Elementær statistik F2011 1 / 22 Generalisering fra stikprøve til population Idé: Opstil en model for populationen
Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning
Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning Introduktion Kasper K. Berthelsen, Inst f. Matematiske Fag Omfang: 8 Kursusgang I fremtiden
Kapitel 4 Sandsynlighed og statistiske modeller
Kapitel 4 Sandsynlighed og statistiske modeller Peter Tibert Stoltze [email protected] Elementær statistik F2011 1 Indledning 2 Sandsynlighed i binomialfordelingen 3 Normalfordelingen 4 Modelkontrol
Lektion 9 Statistik enkeltobservationer
Lektion 9 Statistik enkeltobservationer Middelværdi med mere Hyppigheds- og frekvens-tabeller Diagrammer Hvilket diagram er bedst? Boxplot Lektion 9 Side 1 Når man skal holde styr på mange oplysninger,
Kvantitative Metoder 1 - Forår 2007. Dagens program
Dagens program Kapitel 7 Introduktion til statistik Organisering af data Diskrete variabler Kontinuerte variabler Beskrivende statistik Fraktiler Gennemsnit Empirisk varians og spredning Empirisk korrelationkoe
Statistikkompendium. Statistik
Statistik INTRODUKTION TIL STATISTIK Statistik er analyse af indsamlet data. Det vil sige, at man bearbejder et datamateriale, som i matematik næsten altid er tal. Derved får man et samlet overblik over
En Introduktion til SAS. Kapitel 6.
En Introduktion til SAS. Kapitel 6. Inge Henningsen Afdeling for Statistik og Operationsanalyse Københavns Universitet Marts 2005 6. udgave Kapitel 6 Regressionsanalyse i SAS 6.1 Indledning Dette kapitel
Kapitel 10 Simpel korrelation
Kapitel 10 Simpel korrelation Peter Tibert Stoltze [email protected] Elementær statistik F2011 1 Indledning 2 Pearsons r 3 Spearmans ρ 1 Indledning 2 Pearsons r 3 Spearmans ρ Indledning Korrelation
Kapitel 12 Variansanalyse
Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 / 43 Indledning Sammenligning af middelværdien i to grupper indenfor en stikprøve kan
Kapitel 12 Variansanalyse
Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 Indledning 2 Ensidet variansanalyse 3 Blokforsøg 4 Vekselvirkning 1 Indledning 2 Ensidet
Ensidet variansanalyse
Ensidet variansanalyse Sammenligning af grupper Helle Sørensen E-mail: [email protected] StatBK (Uge 47, mandag) Ensidet ANOVA 1 / 18 Program I dag: Sammenligning af middelværdier Sammenligning af spredninger
Program. Ensidet variansanalyse Sammenligning af grupper. Statistisk model og hypotese. Eksempel: Aldersfordeling i hjertestudie
Program Ensidet variansanalyse Sammenligning af grupper Helle Sørensen E-mail: [email protected] I dag: Sammenligning af middelværdier Sammenligning af spredninger Parvise sammenligninger To eksempler:
Secret Sharing. Olav Geil Institut for Matematiske Fag Aalborg Universitet email: [email protected] URL: http://www.math.aau.dk/ olav.
1 Læsevejledning Secret Sharing Olav Geil Institut for Matematiske Fag Aalborg Universitet email: [email protected] URL: http://www.math.aau.dk/ olav September 2006 Nærværende note er tænkt som et oplæg
Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/
Program: 1. Repetition af vigtige sandsynlighedsfordelinger: binomial, (Poisson,) normal (og χ 2 ). 2. Populationer og stikprøver 3. Opsummering af data vha. deskriptive størrelser og grafer. 1/29 Binomial
Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik
Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Introduktion Kursusholder: Kasper K. Berthelsen Opbygning: Kurset består af 5 blokke En blok består af: To normale
Grupperede observationer et eksempel. (begreber fra MatC genopfriskes og varians og spredning indføres)
Grupperede observationer et eksempel. (begreber fra MatC genopfriskes og varians og spredning indføres) Til Gribskovløbet 006 gennemførte 118 kvinder 1,4 km distancen. Fordelingen af kvindernes løbstider
Antal timer 19 5 7 10 0 6 6 3 7 6 4 14 6 5 12 10 Køn k m k m m k m k m k k k m k k k
Statistik 5 Statistik er en meget omfattende matematisk disciplin, og den anvendes i meget stor udstrækning i vores moderne samfund. Den handler om at analysere et (ofte meget stort) talmateriale. Det
Kursus 02402 Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff
Kursus 02402 Introduktion til Statistik Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks
Modul 3: Kontinuerte stokastiske variable
Forskningsenheden for Statistik ST501: Science Statistik Bent Jørgensen Modul 3: Kontinuerte stokastiske variable 3.1 Kontinuerte stokastiske variable........................... 1 3.1.1 Tæthedsfunktion...............................
Trivsel og fravær i folkeskolen
Trivsel og fravær i folkeskolen Sammenfatning De årlige trivselsmålinger i folkeskolen måler elevernes trivsel på fire forskellige områder: faglig trivsel, social trivsel, støtte og inspiration og ro og
Statistik vejledende læreplan og læringsmål, efteråret 2013 SmartLearning
Side 1 af 6 Statistik vejledende læreplan og læringsmål, efteråret 2013 SmartLearning Litteratur: Kenneth Hansen & Charlotte Koldsø: Statistik I økonomisk perspektiv, Hans Reitzels Forlag 2012, 2. udgave,
3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve
Basal statistik. 30. januar 2007
Basal statistik 30. januar 2007 Deskriptiv statistik Typer af data Tabeller Grafik Summary statistics Lene Theil Skovgaard, Biostatistisk Afdeling Institut for Folkesundhedsvidenskab, Københavns Universitet
Module 12: Mere om variansanalyse
Mathematical Statistics ST06: Linear Models Bent Jørgensen og Pia Larsen Module 2: Mere om variansanalyse 2. Parreded observationer................................ 2.2 Faktor med 2 niveauer (0- variabel)........................
TALTEORI Wilsons sætning og Euler-Fermats sætning.
Wilsons sætning og Euler-Fermats sætning, marts 2007, Kirsten Rosenkilde 1 TALTEORI Wilsons sætning og Euler-Fermats sætning. Disse noter forudsætter et grundlæggende kendskab til talteori som man kan
Matematik B. Højere handelseksamen. 1. Delprøve, uden hjælpemidler. Mandag den 19. december 2011. kl. 9.00-13.00
Matematik B Højere handelseksamen 1. Delprøve, uden hjælpemidler kl. 9.00-10.00 hhx113-mat/b-19122011 Mandag den 19. december 2011 kl. 9.00-13.00 Matematik B Prøven uden hjælpemidler Prøvens varighed er
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006 I dag: To stikprøver fra en normalfordeling, ikke-parametriske metoder og beregning af stikprøvestørrelse Eksempel: Fiskeolie
Forslag til løsning af Opgaver til ligningsløsning (side172)
Forslag til løsning af Opgaver til ligningsløsning (side17) Opgave 1 Hvis sønnens alder er x år, så er faderens alder x år. Der går x år, før sønnen når op på x år. Om x år har faderen en alder på: x x
LØNSPREDNINGSOPGØRELSER NU TILGÆNGELIG I LOPAKS
LØNSPREDNINGSOPGØRELSER NU TILGÆNGELIG I LOPAKS INDHOLD 2 Formål 2 LOPAKS 3 Begreber 6 Eksempler 6. december 2010 LOPAKS er nu udvidet med en ny tabel, der giver mulighed for at opgøre lønspredning på
Privatansatte mænd bliver desuden noget hurtigere chef end kvinderne og forholdsvis flere ender i en chefstilling.
Sammenligning af privatansatte kvinder og mænds løn Privatansatte kvindelige djøfere i stillinger uden ledelsesansvar har en løn der udgør ca. 96 procent af den løn deres mandlige kolleger får. I sammenligningen
Ligninger med reelle løsninger
Ligninger med reelle løsninger, marts 2008, Kirsten Rosenkilde 1 Ligninger med reelle løsninger Når man løser ligninger, er der nogle standardmetoder som er vigtige at kende. Vurdering af antallet af løsninger
Valgkampens og valgets matematik
Ungdommens Naturvidenskabelige Forening: Valgkampens og valgets matematik Rune Stubager, ph.d., lektor, Institut for Statskundskab, Aarhus Universitet Disposition Meningsmålinger Hvorfor kan vi stole på
Billedbehandling og mønstergenkendelse: Lidt elementær statistik (version 1)
; C ED 6 > Billedbehandling og mønstergenkendelse Lidt elementær statistik (version 1) Klaus Hansen 24 september 2003 1 Elementære empiriske mål Hvis vi har observationer kan vi udregne gennemsnit og varians
Behandling af kvantitativ data 28.10.2013
Behandling af kvantitativ data 28.10.2013 I dag skal vi snakke om Kvantitativ metode i kort form Hvordan man kvalitetssikrer stikprøven Hvordan man kan kode og indtaste data Data på forskellig måleniveau
Basal statistik for sundhedsvidenskabelige forskere, forår 2015 Udleveret 3. marts, afleveres senest ved øvelserne i uge 13 (24.-25.
Hjemmeopgave Basal statistik for sundhedsvidenskabelige forskere, forår 2015 Udleveret 3. marts, afleveres senest ved øvelserne i uge 13 (24.-25. marts) En stikprøve bestående af 65 mænd og 65 kvinder
Matematik. på Åbent VUC. Trin 2 Xtra eksempler. Trigonometri, boksplot, potensfunktioner, to ligninger med to ubekendte
Matematik på Åbent VUC Trin Xtra eksempler Trigonometri, boksplot, potensfunktioner, to ligninger med to ubekendte Trigonometri Sinus og cosinus Til alle vinkler hører der to tal, som kaldes cosinus og
5. Statistik. Hayati Balo,AAMS. 1. Carstensen, Frandsen og Studsgaard, stx mat B2, systime
5. Statistik Hayati Balo,AAMS Følgende fremstilling er baseret på 1. Carstensen, Frandsen og Studsgaard, stx mat B2, systime 1. Ugrupperede Observationer Hvis der foreligger et antal målinger eller observationer
Formelsamling Matematik C
Formelsamling Matematik C Ib Michelsen Ikast 2011 Ligedannede trekanter Hvis to trekanter er ensvinklede har de proportionale sider (dvs. alle siderne i den ene er forstørrelser af siderne i den anden
Matematisk modellering og numeriske metoder. Lektion 18
Matematisk modellering numeriske metoder Lektion 18 Morten Grud Rasmussen 12. november, 2013 1 Numeriske metoder til førsteordens ODE er [Bens afsnit 21.1 side 898] 1.1 Euler-metoden Vi stiftede allerede
Funktionalligninger - løsningsstrategier og opgaver
Funktionalligninger - løsningsstrategier og opgaver Altså er f (f (1)) = 1. På den måde fortsætter vi med at samle oplysninger om f og kombinerer dem også med tidligere oplysninger. Hvis vi indsætter =
TALTEORI Wilsons sætning og Euler-Fermats sætning.
Wilsons sætning og Euler-Fermats sætning, marts 2007, Kirsten Rosenkilde 1 TALTEORI Wilsons sætning og Euler-Fermats sætning. Disse noter forudsætter et grundlæggende kendskab til talteori som man kan
Undervisningsbeskrivelse
Undervisningsbeskrivelse Stamoplysninger til brug ved prøver til gymnasiale uddannelser Termin Maj 2013 Institution Roskilde Handelsskole Uddannelse Fag og niveau Lærer(e) Hold Hhx Matematik B Henrik Laursen
Note til styrkefunktionen
Teoretisk Statistik. årsprøve Note til styrkefunktionen Først er det vigtigt at gøre sig klart, at når man laver statistiske test, så kan man begå to forskellige typer af fejl: Type fejl: At forkaste H
2 Populationer. 2.1 Virkelige populationer
2 Populationer I en statistisk sammenhæng er en population en samling af elementer, fx personer, virksomheder, lande, kunder eller mere abstrakte objekter. Fra en population kan man udtage en stikprøve.
Undervisningsbeskrivelse
Undervisningsbeskrivelse Stamoplysninger til brug ved prøver til gymnasiale uddannelser Termin Maj 2013 Institution Roskilde Handelsskole Uddannelse Fag og niveau Lærer(e) Hold Hhx Matematik B Else Marie
Beskrivende statistik
Beskrivende statistik Stikprøve af størrelse n for variablen x: x 1, x 2,, x n Beskriv fordelingen af data med nogle få talstørrelser. Centralt mål: en værdi som data er centreret om. Variationsmål: mål
T A L K U N N E N. Datasæt i samspil. Krydstabeller Grafer Mærketal. INFA Matematik - 1999. Allan C
T A L K U N N E N 3 Allan C Allan C.. Malmberg Datasæt i samspil Krydstabeller Grafer Mærketal INFA-Matematik: Informatik i matematikundervisningen Et delprojekt under INFA: Informatik i skolens fag Et
Normalfordelingen. Statistik og Sandsynlighedsregning 2
Normalfordelingen Statistik og Sandsynlighedsregning 2 Repetition og eksamen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange variable, blandt andet tilfældige fejl på
Den nationale trivselsmåling i folkeskolen, 2016
Den nationale trivselsmåling i folkeskolen, Resultaterne af den nationale trivselsmåling i foråret foreligger nu. Eleverne fra.-9. klasses trivsel præsenteres i fem indikatorer: faglig trivsel, social
Økonometri 1. Inferens i den lineære regressionsmodel 25. september 2006. Oversigt: De næste forelæsninger
Oversigt: De næste forelæsninger Økonometri Inferens i den lineære regressionsmodel 5. september 006 Statistisk inferens: hvorledes man med udgangspunkt i en statistisk model kan drage konklusioner på
Opgavesæt 12 21/01-2009. Laura Pettrine Madsen Uden hjælpemidler. skitse af grafen for f(x).
Uden hjælpemidler Opgave 8.00 Funktionen f(x) er bestemt ved skitse af grafen for f(x). f ( x) = x 3 4x. På figuren ses en Grafen skærer førsteaksen i punkterne P(,0), O(0,0) og Q(,0). Sammen med førsteaksen
To samhørende variable
To samhørende variable Statistik er tal brugt som argumenter. - Leonard Louis Levinsen Antagatviharn observationspar x 1, y 1,, x n,y n. Betragt de to tilsvarende variable x og y. Hvordan måles sammenhængen
Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher
Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: [email protected]
Oversigt. Course 02402/02323 Introducerende Statistik. Forelæsning 3: Kontinuerte fordelinger. Per Bruun Brockhoff
Course 242/2323 Introducerende Statistik Forelæsning 3: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 22 Danmarks Tekniske Universitet 28 Lyngby Danmark
Kapitel 8 Chi-i-anden (χ 2 ) prøven
Kapitel 8 Chi-i-anden (χ 2 ) prøven Peter Tibert Stoltze [email protected] Elementær statistik F2011 1 / 19 Indledning Forskelle mellem stikprøver undersøges med z-test eller t-test for data målt på
Oversigt. Kursus 02402 Introduktion til Statistik. Forelæsning 1: Intro og beskrivende statistik. Per Bruun Brockhoff. Praktisk Information
Kursus 02402 Forelæsning 1: Intro og beskrivende statistik Oversigt 1 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:
Forelæsning 1: Intro og beskrivende statistik
Kursus 02402 Introduktion til Statistik Forelæsning 1: Intro og beskrivende statistik Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby
Statistik. Hjemmeside: kkb. Statistik - lektion 1 p.1/22
Statistik Kursets omfang: 2 ECTS Inklusiv mini-projekt! Bog: Complete Business Statistics, AD Aczel & J. Sounderpandian Software: SPSS eller Excel?? Forelæser: Kasper K. Berthelsen E-mail: [email protected]
Matematik B. Højere handelseksamen
Matematik B Højere handelseksamen hh121-mat/b-04062012 Mandag den 4. juni 2012 kl. 9.00-13.00 Prøven består af to delprøver. Delprøven uden hjælpemidler består af opgave 1 til 5 med i alt 5 spørgsmål.
Statistik. Introduktion Deskriptiv statistik Sandsynslighedregning
Statistik Introduktion Deskriptiv statistik Sandsynslighedregning Introduktion Kasper K. Berthelsen, Institut f. Mat. Fag 8 Kursusgange Individuel mundtlig eksamen (7-skala) Udgangspunkt i opgaver Software:
Rekordhøjt fattigdomsniveau har bidt sig fast
Rekordhøjt fattigdomsniveau har bidt sig fast Fattigdommen i Danmark bliver ved med at stige, og der er nu over.000 fattige i Danmark. Fraregnes studerende er antallet af fattige på godt.000 personer,
Overførsler for de rigeste i Danmark
Overførsler for de rigeste i Danmark De rigeste familier i Danmark modtager samlet 3,4 mia. kr. i indkomstoverførsler. Det svarer til et gennemsnit på 15.500 kr. for hver af de 220.000 personer der er
Økonometri 1. Interne evalueringer af forelæsninger. Kvalitative variabler. Dagens program. Dummyvariabler 21. oktober 2004
Dagens program Økonometri 1 Dummyvariabler 21. oktober 2004 Emnet for denne forelæsning er kvalitative egenskaber i den multiple regressionsmodel (Wooldridge kap. 7.1-7.6) Kvalitative variabler generelt
Grafteori, Kirsten Rosenkilde, september 2007 1. Grafteori
Grafteori, Kirsten Rosenkilde, september 007 1 1 Grafteori Grafteori Dette er en kort introduktion til de vigtigste begreber i grafteori samt eksempler på opgavetyper inden for emnet. 1.1 Definition af
STATISTISKE GRUNDBEGREBER
MOGENS ODDERSHEDE LARSEN STATISTISKE GRUNDBEGREBER 18 15 1 9 6 3 0 Histogram for ph 6,9 7,1 7,3 7,5 7,7 7,9 ph 15.b udgave 015 FORORD Der er i denne bog søgt at give letlæst og anskuelig fremstilling af
En Introduktion til SAS. Kapitel 5.
En Introduktion til SAS. Kapitel 5. Inge Henningsen Afdeling for Statistik og Operationsanalyse Københavns Universitet Marts 2005 6. udgave Kapitel 5 T-test og PROC UNIVARIATE 5.1 Indledning Dette kapitel
