Tue Tjur: Hvad er tilfældighed?

Relaterede dokumenter
π er irrationel Frank Nasser 10. december 2011

Lad os som eksempel se på samtidigt kast med en terning og en mønt:

{ } { } {( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )}

Archimedes Princip. Frank Nasser. 12. april 2011

En martingalversion af CLT

Side 9 sætningen: Kolmogorov s konsistensætning Tue Tjur, Institut for Matematisk Statistik

Hvad er formel logik?

Binomialfordelingen. Binomialfordelingen. Binomialfordelingen

Simulering af stokastiske fænomener med Excel

Om at løse problemer En opgave-workshop Beregnelighed og kompleksitet

Statistik. Peter Sørensen: Statistik og sandsynlighed Side 1

TØ-opgaver til uge 45

Skriftlig Eksamen Kombinatorik, sandsynlighed og randomiserede algoritmer (DM528)

TØ-opgaver til uge 46

Omskrivningsregler. Frank Nasser. 10. december 2011

UENDELIG, MERE UENDELIG, ENDNU MERE UENDELIG, Indledning

En martingalversion af CLT

Simulering af stokastiske fænomener med Excel

Facitliste opgaver 10

En differentiabel funktion hvis afledte ikke er kontinuert Søren Knudby

Center for Statistik. Multipel regression med laggede responser som forklarende variable

Egenskaber ved Krydsproduktet

Kvantitative Metoder 1 - Efterår Dagens program

Hvad er et tal? Dan Saattrup Nielsen

Kvantitative Metoder 1 - Forår Dagens program

Nanostatistik: sandsynligheder Kursushjemmeside: kurser/nanostatistik/

Sikre Beregninger. Kryptologi ved Datalogisk Institut, Aarhus Universitet

Landmålingens fejlteori - Sandsynlighedsregning - Lektion 1

Hvad skal vi lave i dag?

Normale tal. Outline. Hvad er tilfældighed? Uafhængighed. Matematiklærerdag Simon Kristensen. Aarhus Universitet, 24/03/2017

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Matematisk modellering og numeriske metoder. Lektion 8

Spilstrategier. Indhold. Georg Mohr-Konkurrencen. 1 Vindermængde og tabermængde 2. 2 Kopier modpartens træk 4

Matematisk modellering og numeriske metoder. Lektion 16

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger

Sandsynlighedsteori. Sandsynlighedsteori. Sandsynlighedsteori Et eksperiment beskrives af et udfaldsrum udstyret med et. Et Bayesiansk argument

Produkt og marked - matematiske og statistiske metoder

Projekt 1.4 De reelle tal og 2. hovedsætning om kontinuitet

Kapitel 4 Sandsynlighed og statistiske modeller

Funktionsterminologi

Afstande, skæringer og vinkler i rummet

Skriftlig Eksamen Kombinatorik, sandsynlighed og randomiserede algoritmer (DM528)

Sandsynlighedsregning

Hjerner i et kar - Hilary Putnam. noter af Mogens Lilleør, 1996

Afstande, skæringer og vinkler i rummet

De rigtige reelle tal

Euklids algoritme og kædebrøker

Bevidsthed, reduktion og (kunstig) intelligens.

Fornyelsesteori med anvendelser: Punktprøve

Et eksperiment beskrives af et udfaldsrum udstyret med et. alle mulige resultater af eksperimentet

Spilstrategier. 1 Vindermængde og tabermængde

Funktionsterminologi

Sandsynlighedsregning 10. forelæsning Bo Friis Nielsen

Vinkelrette linjer. Frank Villa. 4. november 2014

Sandsynlighedsregning 10. forelæsning Bo Friis Nielsen

Mat H /05 Note 2 10/11-04 Gerd Grubb

Sandsynlighedsregning 10. forelæsning Bo Friis Nielsen

1/41. 2/41 Landmålingens fejlteori - Lektion 1 - Kontinuerte stokastiske variable

Aarhus Universitet 5. februar Meddelelse 2

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Projekt 7.9 Euklids algoritme, primtal og primiske tal

Lidt historisk om chancelære i grundskolen

CMU PROJEKT HYPOTESETEST OG SIMULERING MICHAEL AGERMOSE JENSEN CHRISTIANSHAVNS GYMNASIUM

Affine rum. a 1 u 1 + a 2 u 2 + a 3 u 3 = a 1 u 1 + (1 a 1 )( u 2 + a 3. + a 3. u 3 ) 1 a 1. Da a 2

Mattip om. Statistik 2. Tilhørende kopier: Statistik 3, 4 og 5. Du skal lære om: Faglig læsning. Chance og risiko. Sandsynlighed

Forslag til løsning af Opgaver til sandsynlighedsregning (side 434)

Pointen med Funktioner

83 - Karakterisation af intervaller

Program. Statistik og Sandsynlighedsregning. Eksempler. Sandsynlighedstæthed og sandsynlighedsmål

Uendelige rækker og Taylor-rækker

J E T T E V E S T E R G A A R D

Oversigt. Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger

Gruppeteori. Michael Knudsen. 8. marts For at motivere indførelsen af gruppebegrebet begynder vi med et eksempel.

MODELSÆT 2; MATEMATIK TIL LÆREREKSAMEN

Kvantitative Metoder 1 - Forår 2007

Introduktion til Laplace transformen (Noter skrevet af Nikolaj Hess-Nielsen sidst revideret marts 2013)

Statistik Lektion 2. Betinget sandsynlighed Bayes regel Diskrete stokastiske variable Middelværdi og varians for diskret SV Binomialfordelingen

FORDELING AF ARV. 28. juni 2004/PS. Af Peter Spliid

Matematikkens filosofi filosofisk matematik

Grådige algoritmer. Et generelt algoritme-konstruktionsprincip ( paradigme ) for optimeringsproblemer.

Matematikken i kunstig intelligens Opgaver om koordinerende robotter

Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 136

1 Beviser for fornyelsessætningen

Grådige algoritmer. Et generelt algoritme-konstruktionsprincip ( paradigme ) for optimeringsproblemer.

Matematikken i kunstig intelligens Opgaver om koordinerende robotter LØSNINGER

Kapitel 4 Sandsynlighed og statistiske modeller

Sandsynlighedsregning: endeligt udfaldsrum (repetition)

Konvergens i L 1 -forstand. Definition af L 1 -seminorm. Topologi i pseudometrisk rum. Seminorm til norm

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

Matematisk induktion

Det er en af de hyppigst forekommende udregninger i den elementære talbehandling at beregne gennemsnit eller middeltal af en række tal.

Mandags Chancen. En optimal spilstrategi. Erik Vestergaard

Sandsynlighedsregning og statistik

Skriftlig Eksamen Diskret Matematik (DM528)

Kan Danmark fordoble talentmassen med et trylleslag?

Kønsproportion og familiemønstre.

Sandsynlighedsregning 3. forelæsning Bo Friis Nielsen

Sansernes og forstandens tvivlsomme brugbarhed

Transkript:

Tue Tjur: Hvad er tilfældighed? 16. 19. september 1999 afholdtes i netværkets regi en konference på RUC om sandsynlighedsregningens filosofi og historie. Som ikke specielt historisk interesseret, men nok interesseret på et lidt mere teknisk niveau i sandsynlighedsregningens og statistikkens grundlag, deltog jeg i denne konference, i håb om at der ville dukke noget interessant op. Stig Andur Pedersen har nu bedt mig om at skrive om mine indtryk. Det har jeg valgt at tage helt bogstavligt, idet jeg vil skrive om det jeg kan huske, uden at prøve at rekonstruere det jeg har glemt. Jeg vil faktisk kun skrive om en enkelt ting, en erkendelse, der for mit vedkommende gjorde konferencen til en absolut succes. Den har noget at gøre med to foredrag af Volodya Vovk og Glenn Shafer. Det var ikke noget der blev stærkt fremhævet ved disse foredrag, snarere noget der kom frem i et par sidebemærkninger. Men det satte nogle tanker igang hos mig, og det ved jeg at det også gjorde hos andre, blandt andet Teddy Seidenfeld og Flemming Topsøe. Sandsynlighedsregningen har et grundlagsproblem, som er kendt af enhver der har forsøgt at undervise i sandsynlighedsregning. Problemet er hvad man overhovedet mener med sandsynlighed, eller med at noget er tilfældigt. Når man for eksempel siger sandsynligheden for at få krone i et kast med en mønt er 1/2, hvad mener man så? I den formelle sandsynlighedsregning mener man ikke noget som helst. Der antager man det bare, dvs. man beskriver møntkast ved en model hvor de to mulige udfald har sandsynlighed 1/2, og så antager man yderligere, at hvis mønten kastes flere gange er udfaldene uafhængige. Men det er klart at man snyder både sig selv og dem man underviser, hvis man ikke siger lidt mere, for sandsynlighed er helt afgjort noget der er lige så konkret som længde, hastighed og masse. Derfor plejer man gerne (udenfor pensum, med småt osv.) at sige noget i retning af følgende: Hvis man kaster en mønt 100 gange kan man være næsten sikker på at få mellem 33 og 78 gange krone. Hvis man kaster den 10000 gange kan man være næsten sikker på at få mellem 4721 og 5280 gange krone. Hvis man kaster den et astronomisk antal gange kan man være endnu mere sikker på at få en relativ hyppighed af kroner som ligger tæt på 1/2. Så det er, hvad sandsynligheden for en hændelse betyder: Det er den relative hyppighed af hændelsen, når man gentager det eksperiment, hændelsen er knyttet til, et meget stort antal gange. Problemet med denne definition (som er grunden til at den altid gives udenfor referat) er, at den bider sig selv i halen. For hvis man går den på klingen, hvad betyder det så at man kan være næsten sikker på noget? Det betyder, hvis man vil være pedantisk, at dette noget indtræffer med en sandsynlighed som er næsten 1. Og så er man jo ligesom ikke

kommet videre. Desuden er selve det faktum, at relative hyppigheder konvergerer, måske ikke i så høj grad en empirisk iagttagelse som en konsekvens af det formelle sandsynlighedsteoretiske resultat, der kaldes de store tals lov. Mange som de første vel von Neumann og Kolmogorov, og som den sidste måske Volodya Vovk har interesseret sig for, om det ikke er muligt at give en mere håndfast forklaring. Og det som dæmrede for mig på mødet (uden at jeg tør sige, om det lige er Vovk der har opdaget det som den første) var, at det er det faktisk, i en meget mere konkret forstand end jeg troede. Et af de anvendelsesområder som intuitionen omkring sandsynlighed kan hænges op på, er det økonomiske eller spilteoretiske. Hvad er du for eksempel villig til at betale mig for at kaste 100 mønter på gulvet og lade dig få alle dem som viser krone? Svaret er naturligvis 50 kr. Ganske vist med en masse forbehold om din risikoaversion, din manglende lyst til overhovedet at ligge på gulvet og samle penge op og derefter slæbe rundt på et bjerg af mønter osv. Men alligevel, værdien af dette tilbud er, i en eller anden fundamental forstand, 50 kr. Hvis du kunne slippe med at betale 40 kr. ville du formodentlig sige ja, hvis du skulle betale 60 ville du helt afgjort sige nej. Man kan endda argumentere for, at denne påstand ikke nødvendigvis afhænger af sandsynlighedsteoretiske overvejelser, men alene er en konsekvens af mønters symmetri. Forestil dig, at du kommer med 50 enkroner og jeg kommer med 50 enkroner. Vi smider dem alle sammen på gulvet, du tager dem der viser krone og jeg tager dem der viser plat. Hvis det ikke er et retfærdigt spil, hvad er så retfærdighed? Et lignende, mere generelt eksempel, er følgende. Antag at du bliver tilbudt at spille et spil, som går ud på så mange gange du har lyst at kaste en mønt. Før hvert møntkast fastsætter du din indsats. Denne indsats får du udbetalt hvis mønten viser krone, men du må til gengæld af med det samme beløb hvis mønten viser plat. Ifølge samme intuition som ligger bag ved eksemplet med de 100 enkroner er dette et værdiløst spil. Man kan roligt vælge at spille det, risikoen for tab opvejes af chancen for gevinst. Man kan også roligt vælge at lade være, chancerne for at blive millionær på den måde er næppe store. Igen må man selvfølgelig tage nogle forbehold mod risikoaversion osv. Men disse forbehold er stort set væk hvis vi forudsætter, at du kun spiller for de småpenge du har i lommen. Et sådant krav om en begrænset formue er i øvrigt også nødvendigt, fordi man ellers kan spille med en klassisk fordoblingsregel for indsatsen, som helt sikkert giver positiv gevinst på et eller andet tidspunkt (nemlig første gang mønten viser krone), men som til gengæld kan indebære vilkårligt store tab undervejs. Formelt kan situationen præciseres således: Lad x 1, x 2, {0, 1} 2

betegne udfaldene af møntkastene, idet krone kodes som 1 og plat som 0. Du starter med en formue på F 0 kr. Din formue efter n te spil kalder vi F n. Før spil nr. n (altså før x n er observeret) fastsætter du din indsats I n. Det er et krav, at du skal kunne indfri din gæld hvis du taber, altså at I n F n 1. Specielt, hvis du på et eller andet tidspunkt satser hele din formue (I n = F n 1 ) og taber, så kan du ikke spille længere. Vi vil endvidere tillade negative indsatser, svarende til at du satser på plat i stedet for krone. I så fald kræves naturligvis at I n F n 1. Åbenbart er F n = F n 1 + (2x n 1)I n. Under den sædvanlige sandsynlighedsteoretiske model for møntkast er følgen (F n ) en martingal, om hvilken man kan bevise adskillige ting, blandt andet at den forventede værdi af din formue efter n spil uanset hvilken strategi du følger i dit valg af indsatser altid vil være lig med det beløb du startede med. Men det er overhovedet ikke sådan vi tænker på det i øjeblikket. Den følgende sætning har formelt intet med sandsynlighedsregning at gøre. Sætning. For ethvert beløb B findes en strategi (dvs. en algoritme til valg af indsats I n, når hele forløbet til og med spil nr. n 1 er givet) som har følgende egenskab. Hvis følgen x n = 1 n (x 1 + + x n ) = 1 n S n ikke konvergerer mod 1/2, så vil din formue F n på et eller andet tidspunkt overstige B. Dette resultat er, for mig at se, et meget overbevisende argument for den formelle sandsynlighedsregnings brugbarhed, i det mindste når det gælder modellering af møntkast. Det sætningen siger er sådan set, at hvis de store tals lov ikke gjaldt ville man gradvist kunne arbejde sig op til millionærstatus, bare ved at gå rundt og spille et banalt lodtrækningsspil med folk. Bemærk, at der ikke er tale om et af de sædvanlige tricks med at satse astronomiske ikke eksisterende beløb. Vi satser aldrig mere end vi har. Faktisk ser man let af beviset, at sætningen holder under det yderligere krav, at alle indsatser skal holdes under en given øvre grænse. Den eneste antagelse der kan forekomme lidt urealistisk er at pengebeløb forudsættes uendeligt delbare. I praksis ville man måske mene, at beløb skal være delelige med 1 øre (eller måske 25 øre, hvis vi taler om kontanter). Men hvis man stiller den slags krav fungerer beviset ikke. Beviset vil vi nøjes med at skitsere, omend på en sådan måde at man uden stort besvær kan opskrive et fuldstændigt bevis på basis af skitsen. Vi begynder beskedent med at vise at det er muligt at finde en strategi, der vil få vores formue til at vokse ud over en hvilken som helst grænse, 3

under antagelse af at den relative hyppighed x n af kroneudfald når op over 0.51 for vilkårligt store værdier af n. Til dette formål sætter vi I n = F n 1 for et passende ]0, 1[. Dvs. vi satser hver gang en fast andel af vores formue. Vi får så { (1 + )Fn 1 for x n = 1 F n = (1 )F n 1 for x n = 0 og dermed F n = (1 + ) xn (1 ) 1 xn F n 1 = = (1 + ) Sn (1 ) n Sn F 0. Antag nu at vi efter n spil har x n 0.51. Så er F n = (1 + ) Sn (1 ) n Sn F 0 = ( (1 + ) xn (1 ) 1 xn) n F0 ( (1 + ) 0.51 (1 ) 0.49) n F0 = ( (1 + ) 0.02 (1 2 ) 0.49) n F0. Men som man let kan overbevise sig om (f.eks. ved at tage logaritmen og rækkeudvikle) kan man ved at vælge tilstrækkeligt lille opnå at (1 + ) 0.02 (1 2 ) 0.49 > 1. Da situationen x n 0.51 kan optræde for vilkårligt store værdier af n følger det umiddelbart, at følgen (F n ) vil antage vilkårligt store værdier. Sætningens krav om en fast målværdi B er ikke engang nødvendig, den er kun medtaget for at gøre sætningen mere konkret. Hermed er vi naturligvis ikke færdige. Vi skal for eksempel også sikre os, at vi når vilkårligt højt hvis x n holder sig under 1/2, men vilkårligt ofte kommer under (for eksempel) 0.49. Det kan vi imidlertid opnå på simpel vis ved på forhånd at dele vores formue i to dele, som hele vejen igennem holdes skarpt adskilte, ganske som om de tilhørte to forskellige spillere. Den ene del bruger vi til at satse på krone efter ovennævnte strategi, den anden del bruger vi til satsning på plat efter samme strategi. Hermed sikrer vi os, at mindst en af de to dele på et eller andet tidspunkt vokser sig så stor vi måtte ønske, hvis blot følgen ( x n ) uendeligt ofte kommer uden for intervallet [0.49, 0.51]. Endelig må vi selvfølgelig modificere strategien så den fungerer når bare et eller andet lille interval [0.5 ε, 0.5+ε] forlades vilkårligt ofte af følgen ( x n ). Hertil kan benyttes en lignende opdeling af den samlede formue, denne gang blot i en hel følge af positive andele F n = F n1 + F n2 +..., hvor andelen F ni benyttes til satsning på at følgen vilkårligt ofte kommer udenfor (for eksempel) intervallet [0.5 10 i, 0.5 + 10 i ]. Den strategi 4

vi har konstruet i specialtilfældet ε = 0.01 kan naturligvis kopieres (blot med et andet valg af ) for en hvilken som helst værdi af ε > 0. Tue Tjur Handelshøjskolen i København Statistikgruppen Solhøj Plads 3 DK-2000 Frederiksberg email tuetjur@cbs.dk 5