Billedbehandling og mønstergenkendelse: Lidt elementær statistik (version 2)
|
|
|
- Lærke Jespersen
- 9 år siden
- Visninger:
Transkript
1 Billedbehandling og mønstergenkendelse: Lidt elementær statistik (version 2) Klaus Hansen 23 september 24 Indhold Elementære empiriske mål 2 Lidt sandsynlighedsregning 3 3 Fordelinger 3 3 Grundlæggende begreber 4 32 Nogle eksempler på diskrete fordelinger 5 33 Nogle eksempler på kontinuerte fordelinger 6 4 Parameterestimation 9 5 Statistiske test 9 5 -test: følger forsøgsdata den teoretiske fordeling? 52 To sæt data: er det den samme fordeling? Elementære empiriske mål Gennemsnit og varians Hvis vi har observationer kan vi udregne gennemsnit og varians : () (2) I mange tilfælde kan man bruge som estimat for den teoretiske varians i en fordeling, og en bedre værdi fås da hvis der i udtrykket for divideres med beregnes på en bekvemmere måde som idet "! og $%"! i stedet for med kan (3) kan beregnes i samme gennemløb af data, og også bruges til at beregne Gennemsnittet tilhører ofte ikke mængden af mulige observationer, feks hvis vi måler heltalsværdier, men vi skal være forsigtige med at afrunde gennemsnittet
2 *) Median og fraktiler Har man brug for at finde den observation, der er tættest på midten, kan vi bruge medianen Vi sorterer observationerne (under brug af permutationen ) og får det sorterede sæt Det midterste element har indeks og kaldes medianen Det er ét ud af mange mulige fraktiler, som er elementer med indeks af formen Bruges % er der tale om de tre kvartiler med indices (nedre kvartil), (median) og (øvre kvartil) Hvis observationerne kan have værdierne ( er feks 256 for gråtonebilleder og ), kan vi tælle, hvor mange observationer, der har værdien Sættet af kaldes et histogram og kan vises grafisk, se figur til højre Figur : Til venstre billedet af Lena i en gråtoneudgave Til højre histogrammet for billedet De lodrette linjer er markeringer, som er irrelevante i denne sammenhæng Den vandrette akse angiver gråtoneværdierne, den lodrette de tilsvarende antal! " Gennemsnittet kan udregnes ud fra histogrammet til at være! $ Entropi Et andet statistisk mål, der kan udregnes fra histogrammet er den empiriske entropi (se side 5); man benytter som de enkelte sandsynligheder divideret med det samlede antal observationer, idet summen af sandsynlighederne jo skal være Multidimensionale data Gennemsnit og varians kan generaliseres, hvis observationerne er sæt % data ( +, af - (4) Da kan man regne forskellige gennemsnit og varianser, for rækker ( og /, er ikke potensen, men betyder række), mellem rækker, for søjler 2 ( og 2 (3 står for søjle)) og for alle ( og ): (5) 2
3 - ( (6) (7) (8) 2 2 (9) () () 2 kaldes kovariansen mellem sættene og 3 og kan opstilles i kovariansmatricen, som har dimension : ( ) ) *) 2 Lidt sandsynlighedsregning +,,, ) ) *) / Ved et eksperiment tilhører udfaldene udfaldsrummet ( universet ) Vi er interesserede i en hændelse, og specielt i sandsynligheden for at den indtræffer Et fornuftigt mål for sandsynligheder af hændelser skal opføre sig på følgende måde:,, og hvis er et sæt disjunkte hændelser (dvs har ikke udfald til fælles) er! Vi kan indføre et naturligt mål ved at tælle antallet af elementer og og sætte Hvis mængderne ikke er tællelige må vi benytte et mål baseret på arealer, dvs anvende integralregning Der gælder en lang række regneregler for sandsynligheder, her følger et par eksempler: Formel 5 kaldes Bayes formel og hændelsen 3 Fordelinger +,,, (2) (3) (4) (5) kaldes a posteriori-sandsynligheden givet a priori-sandsynligheden Vi vil nu kikke på sandsynligheder som kan beregnes ud fra en tabel eller en funktion med nogle få parametre parametriserede sandsynligheder 3
4 3 Grundlæggende begreber Vi antager at vi har en tilfældig variabel, som ved en stokastisk proces giver et tilfældigt udfald dvs det kan ikke forudsiges eksakt Vi har brug for to funktioner benævnt tæthedsfunktionen og fordelingsfunktionen Hvis er diskret, består den af en række udfald hver tilknyttet en sandsynlighed, idet! Tæthedsfunktionen er da og fordelingsfunktionen er I det ikke-diskrete tilfælde er sandsynlighederne givet ved en tæthedsfunktionen, som er en Fordelingsfunktionen er reel funktion hvorom det gælder at og Der gælder derfor at Det er muligt at lave regneregler for summer af, produkter af og kvotienter mellem statistiske variable og generelt for, når tæthedsfunktionen eller fordelingsfunktionen er kendt Momenter For statistiske variable kan man definere momenter, som er en opsummeringer svarende til gennemnit og varians Nulpunktsmomenter af k te orden har formerne (6) (7) Nulpunktmomentet af orden eller kaldes middelværdien af og svarer til fordelingens tyngdepunkt Nogle regneregler for :! " $% " (8) (9) " (2) " (2) Den sidste formel forudsætter at og " er statistisk uafhængige De centrale momenter af k te orden har formerne (22) (23) Det centrale moment af 2 orden kaldes variansen af og betegnes eller I lærebogen bruges disse begreber i afsnit 24 Images as a stochastic process I formlerne 25, 26 og 27 er notationen lidt anderledes, idet der er generaliseret til ( dimensioner, dvs at 4
5 tæthedsfunktion ( ) og fordelingsfunktion (som ikke er navngivet, men defineret som et integrale) egentlig er funktioner af ( variable benævnes idet den statistiske variabel er, en funktion af én variabel for hvert punkt i et billede I nærværende notation bliver til (her er tæthedsfunktionen, som i bogen benævnes ) og er derfor blot I Peter Johansens noter om principalkomponentanalyse bruges betegnelsen for middelværdien og betegnelsen for en retningsbestemt udgave af variansen, idet er sat til nul ved en systematisk forskydning af koordinatsystemet Entropi Et andet statistisk mål er entropien og som defineres som idet led med udelades Hvis der bruges logaritmen med grundtal 2 fås entropien i bit Hvis man kun har naturlige logaritmer eller logaritmer med grundtal kan man udnytte at / Hvis man har et histogram (et sæt af tal, se side 2), kan entropien beregnes som $ $! Entropien kan også defineres for det ikke-diskrete tilfælde 32 Nogle eksempler på diskrete fordelinger Ligefordelingen kan antage værdierne Binomialfordelingen Parameter!! " ellers Binomialfordelingen (se figur 2) benyttes ved en række ens eksperimenter til at finde sandsynligheden for det totale antal forekomster af et udfald Parametre og % ( $ *) $ ellers 5
6 7 6 Binomialfordelingen for n= p=5 p=5 p=8 sandsynlighed p(x=x) x 2 3 Figur 2: Binomialfordelingen for tre værdier af parameteren Poissonfordelingen Poissonfordelingen (se figur 3) anvendes hvis der ingen statistsik sammenhæng er mellem de enkelte hændelser Fordelingen bruges meget ofte i køteori for såvel antallet af ankommende som antal ekspederede i en given tidsperiode, feks for køen ved kasseapparater i supermarkeder Parameter " ellers 33 Nogle eksempler på kontinuerte fordelinger Den rektangulære fordeling Parametre og " ellers 6
7 sandsynlighed p(x=x) Poissonfordelingen µ= µ=5 µ= x Figur 3: Poissonfordelingen for tre parameterværdier Normalfordelingen (Gauss-fordelingen) Normalfordelingen (se figur 4) bruges meget ofte, specielt i sammenhænge hvor man ikke kender den egentlige fordeling, eller hvor et udfald skyldes en større række bidragende tilfældigheder Parametre og Gauss-fordelingen med og kaldes også den normerede normalfordeling eller u- fordelingen Det er fordelingen af en normeret statistisk normaltfordelt variabel Denne type statistiske variable optræder i en del statistiske test I MATLAB findes funktionen erf, som ligner u-fordelingen, men er defineret ved!, og ud fra den kan værdier af fordelings- Funktionen erfc har værdien funktionen for u-fordelingen beregnes:!!! 7
8 Normalfordelingen (Gauss fordelingen) med µ= Varians Varians 2 Varians 5 Varians 2 35 sandsynlighed p(x=x) x Figur 4: Normalfordelingen for fire varianser Laplace Laplacefordelingen (se figur 5) er et specialtilfælde af den generaliserede Gauss-fordeling Den benyttes til at beskrive fordelingen af pixelværdier og fordelingen af koefficientværdier i DCT (Discrete Cosine Transform, benyttes bla i JPEG) Den generaliserede Gauss-fordeling: Parametre og Gamma-funktionen heltallige gælder at! Se figur 6! -fordelingen Parametre og er den kontinuerte udgave af fakultetsfunktionen, idet der for Den matematiske definition er Anvendelse: se nedenfor i afsnit 5 8
9 Laplacefordelingen med µ= 5 b= b=2 b=5 b=2 4 sandsynlighed p(x=x) x Figur 5: Laplacefordelinegn Parameter (, ellers ) 4 Parameterestimation Har vi nogle forsøgsdata og en teoretisk fordeling med ukendte parametre, kan vi estimere hvilken værdi af parametrene, der bedst beskriver forsøgsdata Der er mange måder at estimere på, men et udmærket estimatet er den empiriske for middelværdien, og udregnet med nævneren for variansen 5 Statistiske test Statistiske test går ofte ud på at afgøre om forsøgsdata bekræfter eller afkræfter en hypotese, der er opstillet før forsøget; det er en god ide at opstille hypotesen før forsøget, idet forsøget i mange tilfælde da kan udformes, så udfaldet af den statistiske test får størst mulig sikkerhed En situation man ofte støder på er, at data følger en kendt fordeling, men parametrene til denne er ikke kendte Man kan da opstille hypotesen, at parametrene tilhører mængden, som er en delmængde af alle de mulige parameterkombinationer Hypotesen benævnes nulhypotesen og den modsatte hypotese er : at parametrene ikke tilhører Der er nu følgende muligheder: accepteres forkastes er sand OK fejl af art er falsk fejl af 2 art OK Vi er normalt interesserede i at sandsynligheden for en fejl af art er så lille som mulig Vi håber så at det også gælder for fejlen af 2 art Da der er tale om stokastiske variable kan vi ikke helt undgå at begå fejl En test med signifikansniveau er en test hvor! 9
10 Figur 6: Gammafunktionen Denne vælges ofte til at være 5, dvs højst 5% sandsynlighed for at forkaste Hvis man forkaster kan man yderligere angive noget om : -stjernet (*) imod ikke forkastet på % niveau svagt bevis for 2-stjernet (**) imod forkastet på % niveau, men ikke på % bevis for 3-stjernet (*** )imod også forkastet på % niveau stærkt bevis for 5 -test: følger forsøgsdata den teoretiske fordeling? Har vi nogle observationer og en teoretisk fordeling, kan vi teste om observationerne følger den teoretiske fordeling, hvis vi har observationer nok Vi grupperer observationerne fx ved at lave et histogram over de observerede data, dvs grupperer i ( klasser Histogrammet har antallet obeservationer i den te klasse, idet ( Vi har i alt! observationer For hver klasse har vi en teoretisk sandsynlighed For at testen kan bruges, skal hver være mindst 5, ellers er der for få observationer for klasserne med lille sandsynlighed Man kan evt slække på dette krav, hvis over 8% af klasserne opfylder kravet samtidig med at ingen klasse har et forventet antal, der er mindre end! og ( Vi udregner nu følger nu med god tilnærmelse en - fordeling med frihedsgrader -fordelingen beskriver egentlig fordelingen af summen af kvadraterne på stokastiske variable, der hver er normeret normaltfordelt: " Når er stor nok, vil man kunne tilnærme mange fordelinger med en normalfordeling (dette gælder fx Poisson-fordelingen og binomialfordelingen), og derfor kan man antage at kvadratet på normerede variable som i ovenstående formel med god tilnærmelse er $ -fordelt Vi skal nu finde signifikansniveauet for at hypotesen om overensstemmelse mellem teoretisk fordeling og observationer skal forkastes I MATLAB på DIKU mangler statistikpakken, så -testen findes ikke som standardfunktion C-programmører kan finde funktionen chsone i Numerical Recipes, som blandt andet kan findes i /usr/local/image/src/archive/numericalrecipes/ansi-c/ Funktionen kaldes således: chsone(float bins[], float ebins[], int nbins, int knstrn, float *df, float *chsq, float *prob), hvor nbins er antallet af klasser, bins er histogrammet, ebins de forventede værdier, knstrn i dette tilfælde er, df er en pointer til en variabel, der angiver antallet af frihedsgrader (denne ændres) I chsq returneres $ -testværdien og i prob andsynligheden for -værdien Er denne over hypotesen bekræftet niveauet, men heller ikke under, er
11 ) 52 To sæt data: er det den samme fordeling? (Kilde: Brøndum og Monrad: Statistik I og II (Den private ingeniørfond 993)) Vi får brug for to nye fordelinger: t-fordelingen og F-fordelingen t-fordelingen Har vi to statistiske variable (fordelt ) og (fordelt efter ) er fordelingen af den statistiske variabel!$ fordelt efter t-fordelingen med frihedsgradsantallet Tæthedsfunktionen for denne er (24) F-fordelingen Har vi to statistiske variable (T for tæller) og (N for nævner), som er fordelt henholdsvis og, vil sandsynlighedsfordelingen for den statistiske variabel være F- fordelt med tællerfrihedsgradsantal og nævnerfrihedsgradsantal Tæthedsfunktionen for denne er (25) To sæt data: er variansen den samme? Vi er i den situation at vi har to sæt normaltfordelte data med hver sine ukendte parametre og Vi ønsker nu at afgøre om de ukendte er forskellige Vi beregner først det empiriske gennemsnit og den empiriske varians for de to sæt data, dvs,, 3 og 3 Vi benytter Bartletts test med nulhypotesen imod den alternative: at de ikke er lig hinanden Forholdet er F-fordelt Frihedsgraderne for nævner og tæller vælges ud fra hvad og er ud fra frihedsgraderne og Hvis fx er mindre end, holder nulhypotesen med konfidensniveau 25% Et eksempel (hentet fra Brøndum og Monrad II side 385): To sæt observationer henholdsvis (622, 63, 69, 62, 634, 624, 625, 62) og (633, 626, 68, 638, 63, 632, 64) Vi beregner, 3,,, 3 og Af dette fås, og da er der ingen tegn på forskellig varians I Numerical Recipes kan testen på udføres ved hjælp af funktionen betai(a, b, x) (incomplete beta function), som med passende parametre vil give sandsynligheden for at ville have denne værdi, hvis den ene varians faktisk var mindre end den anden Funktionen kaldes med parametrene, og I kursets MATLAB-katalog (i /usr/local/del/datv-billed) findes i kataloget statistics m-filer for betai og hjælpefunktioner
12 To sæt data: er middelværdien den samme? Vi har nu afgjort at de to sæt normaltfordelte data har samme (men ukendte) varians Har vi samme varians, kan vi beregne et fællesestimat for denne 3 på grundlag af samtlige data Vi skal her benytte nævneren Vi tester nu nulhypotesen imod alternativet: at de er forskellige Størrelsen er t-fordelt med grund til at afvise nulhypotesen! 3 frihedsgrader Er t-værdien fx mindre end! I eksemplet fra forrige afsnit er 3 og!, er der ingen Da! og!, er der tegn på at middelværdierne er forskellige I Numerical Recipes kan testen på! også udføres ved hjælp af betai med parametrene og Resultatet skal trækkes fra for at give sandsynligheden I kursets MATLAB-katalog (i /usr/local/del/datv-billed) findes i kataloget statistics m-filer for betai og hjælpefunktioner Der findes også en m-fil variancetest, der foretager en test på to sæt data Ikke-parametriske test -testen fra afsnit 5 er ikke-parametrisk, da den ikke antager noget om fordelingstype- og parametre Der findes andre ikke-parametriske test, fx Wilcoxsons rang-test Vi har to statistiske variable og med ukendte fordelinger, og med medianer og Vi kan tage stikprøver, fx (3, 34, 29, 26, 32, 35) og (26, 24, 28, 29, 3, 29, 32, 26) (eksemplet er hentet fra Brøndum og Monrad II, side 494) Vi ønsker nu at teste nulhypotesen at de to fordelinger er ens (dvs ) Vi sorterer samtlige stikprøver efter størrelse og giver dem rangtal, idet mindste observation får rang og identiske observationer får en rang som er gennemsnittet af de range, de ville have fået: Obs () Obs (2) Rang () Rang (2) Summen af rangtallene for bliver 585 Når begge sæt observationer har tilstrækkelig mange elementer (større end 5) kan sandsynlighedsfordelingen approksimeres med normalfordelingen $ således at testet kan udføres som et almindeligt U-test Vi får i eksemplet at $ og Da er større, kan vi antage at de to fordelinger er identiske I kursets MATLAB-katalog (i /usr/local/del/datv-billed) findes i kataloget statistics m-filer for u-fordelinegn udistr M-filen ranktest laver en rangtest på to sæt data, 2
Billedbehandling og mønstergenkendelse: Lidt elementær statistik (version 1)
; C ED 6 > Billedbehandling og mønstergenkendelse Lidt elementær statistik (version 1) Klaus Hansen 24 september 2003 1 Elementære empiriske mål Hvis vi har observationer kan vi udregne gennemsnit og varians
Elementær sandsynlighedsregning
Elementær sandsynlighedsregning Sandsynlighedsbegrebet Et udfaldsrum S er mængden af alle de mulige udfald af et eksperiment. En hændelse A er en delmængde af udfaldsrummet S. Den hændelse, der ikke indeholder
Tema. Dagens tema: Indfør centrale statistiske begreber.
Tema Dagens tema: Indfør centrale statistiske begreber. Model og modelkontrol Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. konfidensintervaller Vi tager udgangspunkt i Ex. 3.1 i
Elementær sandsynlighedsregning
Elementær sandsynlighedsregning Sandsynlighedsbegrebet Et udfaldsrum S er mængden af alle de mulige udfald af et eksperiment. En hændelse A er en delmængde af udfaldsrummet S. Et sandsynlighedsmål er en
Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen
Statistik Lektion 3 Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen Repetition En stokastisk variabel er en funktion defineret på S (udfaldsrummet, der antager
Note til styrkefunktionen
Teoretisk Statistik. årsprøve Note til styrkefunktionen Først er det vigtigt at gøre sig klart, at når man laver statistiske test, så kan man begå to forskellige typer af fejl: Type fejl: At forkaste H
2 -test. Fordelingen er særdeles kompleks at beskrive med matematiske formler. 2 -test blev opfundet af Pearson omkring år 1900.
2 -fordeling og 2 -test Generelt om 2 -fordelingen 2 -fordelingen er en kontinuert fordeling, modsat binomialfordelingen som er en diskret fordeling. Fordelingen er særdeles kompleks at beskrive med matematiske
Løsning til eksaminen d. 29. maj 2009
DTU Informatik 02402 Introduktion til Statistik 20-2-01 LFF/lff Løsning til eksaminen d. 29. maj 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th
Konfidensintervaller og Hypotesetest
Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller
Kvantitative Metoder 1 - Forår 2007
Dagens program Kapitel 8.7, 8.8 og 8.10 Momenter af gennemsnit og andele kap. 8.7 Eksempel med simulationer Den centrale grænseværdisætning (Central Limit Theorem) kap. 8.8 Simulationer Normalfordelte
Løsning til eksaminen d. 14. december 2009
DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,
Normalfordelingen og Stikprøvefordelinger
Normalfordelingen og Stikprøvefordelinger Normalfordelingen Standard Normal Fordelingen Sandsynligheder for Normalfordelingen Transformation af Normalfordelte Stok.Var. Stikprøver og Stikprøvefordelinger
Forelæsning 3: Kapitel 5: Kontinuerte fordelinger
Kursus 02402 Introduktion til Statistik Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.
Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet March 1, 2013 Sandsynlighedsregning og lagerstyring Normalfordelingen
Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo
Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte
Sandsynlighedsregning Oversigt over begreber og fordelinger
Tue Tjur Marts 2007 Sandsynlighedsregning Oversigt over begreber og fordelinger Stat. MØK 2. år Kapitel : Sandsynlighedsfordelinger og stokastiske variable En sandsynlighedsfunktion på en mængde E (udfaldsrummet)
Produkt og marked - matematiske og statistiske metoder
Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 19, 2016 1/26 Kursusindhold: Sandsynlighedsregning og lagerstyring
Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/
Program: 1. Repetition af vigtige sandsynlighedsfordelinger: binomial, (Poisson,) normal (og χ 2 ). 2. Populationer og stikprøver 3. Opsummering af data vha. deskriptive størrelser og grafer. 1/29 Binomial
Deskriptiv statistik. Version 2.1. Noterne er et supplement til Vejen til matematik AB1. Henrik S. Hansen, Sct. Knuds Gymnasium
Deskriptiv (beskrivende) statistik er den disciplin, der trækker de væsentligste oplysninger ud af et ofte uoverskueligt materiale. Det sker f.eks. ved at konstruere forskellige deskriptorer, d.v.s. regnestørrelser,
Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0
Hypotesetest Hypotesetest generelt Ingredienserne i en hypotesetest: Statistisk model, f.eks. X 1,,X n uafhængige fra bestemt fordeling. Parameter med estimat. Nulhypotese, f.eks. at antager en bestemt
Oversigt. Kursus Introduktion til Statistik. Forelæsning 2: Kapitel 4, Diskrete fordelinger. Per Bruun Brockhoff. Stokastiske Variable
Kursus 02402 Introduktion til Statistik Forelæsning 2: Kapitel 4, Diskrete fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)
Formelsamlingen 1 Regneregler for middelværdier M(a + bx) a + bm X M(X+Y) M X +M Y Spredning varians og standardafvigelse VAR(X) 1 n n i1 ( X i - M x ) 2 Y a + bx VAR(Y) VAR(a+bX) b²var(x) 2 Kovariansen
1/41. 2/41 Landmålingens fejlteori - Lektion 1 - Kontinuerte stokastiske variable
Landmålingens fejlteori - lidt om kurset Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable - [email protected] Institut for Matematiske Fag Aalborg Universitet Kursusholder
Statistik II 1. Lektion. Sandsynlighedsregning Analyse af kontingenstabeller
Statistik II 1. Lektion Sandsynlighedsregning Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller
Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05
Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ
Løsning eksamen d. 15. december 2008
Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th
Kvantitative Metoder 1 - Efterår Dagens program
Dagens program Approksimation af binomialsandsynligheder, Afsnit 4.5 Multinomial fordeling, Afsnit 4.8 Negativ binomialfordeling, Afsnit 4.4 Poisson fordeling og Poisson process, Afsnit 4.6 Kontinuerte
Statistiske modeller
Statistiske modeller Statistisk model Datamatrice Variabelmatrice Hændelse Sandsynligheder Data Statistiske modeller indeholder: Variable Hændelser defineret ved mulige variabel værdier Sandsynligheder
Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse
Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ
Repetition. Diskrete stokastiske variable. Kontinuerte stokastiske variable
Normal fordelingen Normal fordelingen Egenskaber ved normalfordelingen Standard normal fordelingen Find sandsynligheder ud fra tabel Transformation af normal fordelte variable Invers transformation Repetition
Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)
Kursus 02402 Introduktion til Statistik Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske
3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve
Kapitel 4 Sandsynlighed og statistiske modeller
Kapitel 4 Sandsynlighed og statistiske modeller Peter Tibert Stoltze [email protected] Elementær statistik F2011 1 Indledning 2 Sandsynlighed i binomialfordelingen 3 Normalfordelingen 4 Modelkontrol
Modul 7: Eksempler. 7.1 Beskrivende dataanalyse. 7.1.1 Diagrammer. Bent Jørgensen. Forskningsenheden for Statistik ST501: Science Statistik
Forskningsenheden for Statistik ST501: Science Statistik Bent Jørgensen Modul 7: Eksempler 7.1 Beskrivende dataanalyse............................... 1 7.1.1 Diagrammer.................................
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006 I dag: To stikprøver fra en normalfordeling, ikke-parametriske metoder og beregning af stikprøvestørrelse Eksempel: Fiskeolie
Løsning til eksamen d.27 Maj 2010
DTU informatic 02402 Introduktion til Statistik Løsning til eksamen d.27 Maj 2010 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th edition]. Opgave I.1
Kapitel 7 Forskelle mellem centraltendenser
Kapitel 7 Forskelle mellem centraltendenser Peter Tibert Stoltze [email protected] Elementær statistik F2011 1 / 29 Indledning 1. z-test for ukorrelerede data 2. t-test for ukorrelerede data med ens
Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik
Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Introduktion Kursusholder: Kasper K. Berthelsen Opbygning: Kurset består af 5 blokke En blok består af: To normale
Matematik A. Studentereksamen. Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet
Matematik A Studentereksamen Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet stx11-matn/a-080501 Tirsdag den 8. maj 01 Forberedelsesmateriale til stx A Net MATEMATIK Der
Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning
Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning Introduktion Kasper K. Berthelsen, Inst f. Matematiske Fag Omfang: 8 Kursusgang I fremtiden
Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader
Stikprøver og stikprøve fordelinger Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader Statistik Statistisk Inferens: Prediktere og forekaste værdier af
Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele
Anvendt Statistik Lektion 4 Hypotesetest generelt Test for middelværdi Test for andele Hypoteser og Test Hypotese I statistik er en hypotese en påstand om en populationsparameter. Typisk en påstand om
Kapitel 4 Sandsynlighed og statistiske modeller
Kapitel 4 Sandsynlighed og statistiske modeller Peter Tibert Stoltze [email protected] Elementær statistik F2011 1 / 22 Generalisering fra stikprøve til population Idé: Opstil en model for populationen
Vejledende besvarelser til opgaver i kapitel 14
Vejledende besvarelser til opgaver i kapitel 14 Opgave 1 a) Det første trin i opstillingen af en hypotesetest er at formulere to hypoteser, hvoraf den ene støtter den teori vi vil teste, mens den anden
Personlig stemmeafgivning
Ib Michelsen X 2 -test 1 Personlig stemmeafgivning Efter valget i 2005 1 har man udspurgt en mindre del af de deltagende, om de har stemt personligt. Man har svar fra 1131 mænd (hvoraf 54 % har stemt personligt
Sandsynlighedsregning: endeligt udfaldsrum (repetition)
Program: 1. Repetition: sandsynlighedsregning 2. Sandsynlighedsregning fortsat: stokastisk variabel, sandsynlighedsfunktion/tæthed, fordelingsfunktion. 1/16 Sandsynlighedsregning: endeligt udfaldsrum (repetition)
Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.
Landmålingens fejlteori Lektion 2 Transformation af stokastiske variable - [email protected] http://people.math.aau.dk/ kkb/undervisning/lf12 Institut for Matematiske Fag Aalborg Universitet Repetition:
Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen
Landmålingens fejlteori Lektion Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ - [email protected] Institut for Matematiske Fag Aalborg Universitet En stokastisk variabel er en variabel,
Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable
Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable - [email protected] Institut for Matematiske Fag Aalborg Universitet 1/41 Landmålingens fejlteori - lidt om kurset
Bernoulli og binomial fordelingerne Kontinuerte stokastiske variable Normalfordelingen
Bernoulli og binomial fordelingerne Kontinuerte stokastiske variable Normalfordelingen Repetition Lov om total sandsynlighed Bayes sætning P( B A) = P(A) = P(AI B) + P(AI P( A B) P( B) P( A B) P( B) +
Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007
Rettevejledning til eksamen i Kvantitative metoder 1,. årsprøve. januar 007 I rettevejledningen henvises der til Berry and Lindgren "Statistics Theory and methods"(b&l) hvis ikke andet er nævnt. Opgave
Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.
Tema Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. (Fx. x. µ) Hypotese og test. Teststørrelse. (Fx. H 0 : µ = µ 0 ) konfidensintervaller
Maple 11 - Chi-i-anden test
Maple 11 - Chi-i-anden test Erik Vestergaard 2014 Indledning I dette dokument skal vi se hvordan Maple kan bruges til at løse opgaver indenfor χ 2 tests: χ 2 - Goodness of fit test samt χ 2 -uafhængighedstest.
Ovenstående figur viser et (lidt formindsket billede) af 25 svampekolonier på en petriskål i et afgrænset felt på 10x10 cm.
Multiple choice opgaver Der gøres opmærksom på, at ideen med opgaverne er, at der er ét og kun ét rigtigt svar på de enkelte spørgsmål. Endvidere er det ikke givet, at alle de anførte alternative svarmuligheder
Undervisningsbeskrivelse
Undervisningsbeskrivelse Stamoplysninger til brug ved prøver til gymnasiale uddannelser Termin Maj 2013 Institution Roskilde Handelsskole Uddannelse Fag og niveau Lærer(e) Hold Hhx Matematik B Henrik Laursen
Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede
Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede fordelinger (kap. 4) Middelværdi og varians (kap. 3-4) Fordelingsresultater
Teoretisk Statistik, 2. december 2003. Sammenligning af poissonfordelinger
Uge 49 I Teoretisk Statistik, 2. december 2003 Sammenligning af poissonfordelinger o Generel teori o Sammenligning af to poissonfordelinger o Eksempel Opsummering om multinomialfordelinger Fishers eksakte
Program. Statistik og Sandsynlighedsregning. Eksempler. Sandsynlighedstæthed og sandsynlighedsmål
Program Statistik og Sandsynlighedsregning Sandsynlighedstætheder og kontinuerte fordelinger på R Varians og middelværdi Normalfordelingen Susanne Ditlevsen Uge 48, tirsdag Tætheder og fordelingsfunktioner
Undervisningsbeskrivelse
Undervisningsbeskrivelse Stamoplysninger til brug ved prøver til gymnasiale uddannelser Termin Institution Uddannelse Fag og niveau Lærer(e) Hold Termin hvori undervisningen afsluttes: Juni 2013 Roskilde
Statistik. Hjemmeside: kkb. Statistik - lektion 1 p.1/22
Statistik Kursets omfang: 2 ECTS Inklusiv mini-projekt! Bog: Complete Business Statistics, AD Aczel & J. Sounderpandian Software: SPSS eller Excel?? Forelæser: Kasper K. Berthelsen E-mail: [email protected]
INSTITUT FOR MATEMATISKE FAG c
INSTITUT FOR MATEMATISKE FAG c AALBORG UNIVERSITET FREDRIK BAJERS VEJ 7 G 9220 AALBORG ØST Tlf.: 96 35 89 27 URL: www.math.aau.dk Fax: 98 15 81 29 E-mail: [email protected] Dataanalyse Sandsynlighed og stokastiske
Skriftlig eksamen Science statistik- ST501
SYDDANSK UNIVERSITET INSTITUT FOR MATEMATIK OG DATALOGI Skriftlig eksamen Science statistik- ST501 Torsdag den 21. januar Opgavesættet består af 5 opgaver, med i alt 13 delspørgsmål, som vægtes ligeligt.
Afsnit E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse
Afsnit 8.3 - E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse Først skal normalfordelingen lige defineres i Maple, så vi kan benytte den i vores udregninger. Dette gøres
Oversigt. Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger
Introduktion til Statistik Forelæsning 2: og diskrete fordelinger Oversigt 1 2 3 Fordelingsfunktion 4 Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 017 Danmarks Tekniske Universitet 2800
Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18
Program 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18 Fordeling af X Stikprøve X 1,X 2,...,X n stokastisk X stokastisk. Ex (normalfordelt stikprøve)
Statistik Lektion 2. Betinget sandsynlighed Bayes regel Diskrete stokastiske variable Middelværdi og varians for diskret SV Binomialfordelingen
Statistik Lektion etinget sandsynlighed ayes regel Diskrete stokastiske variable Middelværdi og varians for diskret SV inomialfordelingen Repetition Udfaldsrum S Hændelse S Simpel hændelse O i 1, 3 4,
Landmålingens fejlteori - Lektion 2 - Transformation af stokastiske variable
Landmålingens fejlteori Lektion 2 Transformation af stokastiske variable - [email protected] http://people.math.aau.dk/ kkb/undervisning/lf12 Institut for Matematiske Fag Aalborg Universitet 1/31 Repetition:
Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala
3 5% 5% 5% 0 3 4 5 6 7 8 9 0 Statistik for biologer 005-6, modul 5: Normalfordelingen opstår når mange forskellige faktorer uafhængigt af hinanden bidrager med additiv variation til. F.eks. Højde af rekrutter
Note om Monte Carlo metoden
Note om Monte Carlo metoden Kasper K. Berthelsen Version 1.2 25. marts 2014 1 Introduktion Betegnelsen Monte Carlo dækker over en lang række metoder. Fælles for disse metoder er, at de anvendes til at
Statistik i basketball
En note til opgaveskrivning [email protected] 4. marts 200 Indledning I Falcon og andre klubber er der en del gymnasieelever, der på et tidspunkt i løbet af deres gymnasietid skal skrive en større
1 Sandsynlighed Sandsynlighedsbegrebet Definitioner Diskret fordeling Betinget sandsynlighed og uafhængighed...
Indhold 1 Sandsynlighed 1 1.1 Sandsynlighedsbegrebet................................. 1 1.2 Definitioner........................................ 2 1.3 Diskret fordeling.....................................
Indblik i statistik - for samfundsvidenskab
Indblik i statistik - for samfundsvidenskab Læs mere om nye titler fra Academica på www.academica.dk Nikolaj Malchow-Møller og Allan H. Würtz Indblik i statistik for samfundsvidenskab Academica Indblik
Preben Blæsild og Jens Ledet Jensen
χ 2 Test Preben Blæsild og Jens Ledet Jensen Institut for Matematisk Fag Aarhus Universitet Egå Gymnasium, December 2010 Program 8.15-10.00 Forelæsning 10.15-12.00 Statlab: I arbejder, vi cirkler rundt
Statistik i GeoGebra
Statistik i GeoGebra Peter Harremoës 13. maj 2015 Jeg vil her beskrive hvordan man kan lave forskellige statistiske analyser ved hjælp af GeoGebra 4.2.60.0. De statistiske analyser svarer til pensum Matematik
Et eksempel på en todimensional normalfordeling Anders Milhøj September 2006
Et eksempel på en todimensional normalfordeling Anders Milhøj September 006 I dette notat gennemgås et eksempel, der illustrerer den todimensionale normalfordelings egenskaber. Notatet lægger sig op af
