Eksperimentel matematik Kommentarer til tag-med opgaver Hypotesedannelse I har alle produceret grafer af typen 0.8 0.6 0.4 0.2 0 0. 0.2 0.3 0.4 0.5 (de lilla punkter er fundet ved en strenglængde på 35, de sorte ved en strenglængde på 750) der viser en klar kontinuert og ikke-triviel sammenhæng mellem α og frekvensen for ŝ[α, β] for α < 2, og vist at β er uden betydning i denne sammenhæng. Lad os kalde frekvensen for ŝ[α, 0] for h(α). Spørgsmålet er nu, med en formulering lånt fra Svend, hvad dette er for en fisk. Jeg kan ikke pege på nogen systematisk måde at identificere en funktion ud fra nogle punkter der approksimerer dens graf, og her har vi jo oven i købet det problem, at funktionen kun er defineret i irrationale punkter. Det ser dog ud som om vi kan glemme dette og betragte h som en helt almindelig men ukendt differentiabel funktion defineret overalt på [0, /2]. Det virker derfor som et godt udgangspunkt at som I også alle har gjort foretage en overfladisk funktionsundersøgelse af den. I er kommet frem til at funktionen er voksende, og at h(0) = 0 og h(/2) =, og Svend estimerer endda at h (0) = og h (/2) = 4 (differentialkvotient fra venstre). Rygmarvsreaktionen er vel at plotte i enkelt- og dobbeltlogaritmisk papir (eller ved at transformere med ln og plotte i Maple), men det giver desværre negativt resultat. På denne måde kommer Ole frem til at forkaste en hypotese om at funktionen er eksponentiel. Herefter er man nok primært henvist til at bruge sin fantasi til at gætte på en god approksimand til h - eller rettere til at gætte
på en klasse af funktioner, der kan tjene som modeller for h. Svend foreslår en funktion af typen ba x + c og kommer ved at sammenholde med de estimerede værdier for h og h i endepunkterne frem til at foreslå /3[6 α ] det passer ikke helt med hypotesen h () = 4, men det er heller ikke meget galt. Lise foreslår af grunde jeg skal beskrive senere α/( α). Selv syntes jeg umiddelbart funktionen så polynomiel ud. Jeg benyttede en fit-procedure > with(stats): > bf:=fit[leastsquare[[x,y], y=a*x^3+b*x^2+c*x+d, {a,b,c,d}]](ss); i Maple til at komme frem til at det bedste approksimerende tredjegradspolynomium var 408365333658686858580065843894377900275888599722800898087265774278825α 3 358733895036684957545262627882207735704636742684707774847574373684π 3 802872942690086866768992078779606308730787886549899298555095482744432804α 2 55005863905625026823606933720065443878528075577629526542725476628070552488π 2+ 884304820226505205944275859332629998362437989949968493374038339082927α 24566528696856235580640498475032826977870443092297535879648960205945998400π 53742262623998547986023984735574387879473470687832994043579622089 07277974396266268273584838236533878878557959334204683258747694200000 Ole får den ide at plotte α/h(α) og får en graf af formen 0.9 0.8 0.7 0.6 0.5 0 0. 0.2 0.3 0.4 0.5 der får ham til at foreslå at α/h(α) aftager lineært i [0, /2]. Jeg foretog et fit som gav x + 36π 425 2
2 Afvigelsesdiskussion Hvordan afgører man hvilket af disse forslag der er bedst? Det jeg savner mest i samtlige jeres besvarelser er en kritisk stillingtagen til jeres hypoteser ud fra en sammenligning af afvigelser og fejlkilder. Det er jo klart, at vi ikke forventer at de frekvenser vi kan udregne ved at se på ŝ[α, 0]-strenge er andet end approksimationer, fordi de er genereret ud fra endelige dele af den uendelige streng af nuller og ettaller, hvis ettalsfrekvens konvergerer mod den sande frekvens. Den allerførste figur i dette dokument illustrerer denne problemstilling. Til gengæld er det vel også den eneste fejlkilde her kan det mærkes, at det er matematik og ikke in vivo eksperimenter vi arbejder med så i det omfang at hypoteserne ikke passer med data, så skal det altså kunne forklares ud fra denne fejlkilde. Lad os sammenholde de tre hypoteser. 0.8 0.6 0.4 0.2 0 0. 0.2 0.3 0.4 0.5 x Her og herunder er Lises hypotese blå, Svends hypotese lilla og min lyseblå det er ikke så nemt at se forskel fra denne afstand, men zoomer man ind som 3
0.54 0.52 0.5 0.48 0.46 0.44 0.42 0.3 0.3 0.32 0.33 0.34 0.35 x ses klart at vi ikke er helt enige. Jeg har valgt et sted på grafen der er flatterende for min hypotese. Hvis de forskellige hypoteser skal holde, så bør de estimerede frekvensværdier komme nærmere og nærmere hypoteseværdierne når strenglængden vokser. Lise foretog ved fremmødedagene et eksperiment der afslørede at der er et klart system i hvordan frekvensapproksimanderne konvergerer mod de sande frekvenser. Det falder lidt anderledes ud pga hatningen, men gør vi noget tilsvarende her får vi 0.44 0.42 0.4 0.38 0.36 0.34 0.32 0.3 0 5 0 5 20 25 30 med fast α = 7π/76, hvor værdien på førsteaksen er en fyrrentyvendedel af 4
antal bogstaver i den benyttede streng. Det virker ret usandsynligt at konvergensen vil ende på den værdi Svends hypotese har foreskrevet. Og gør vi noget tilsvarende et helt andet sted, ved α = 329π/2200, 0.9 0.895 0.89 0.885 0.88 0.875 0.87 0.865 0.86 0 5 0 5 20 25 30 (denne gang med en halvtredsindstyvendedel af strenglængden afbildet på førsteaksen) virker min hypotese nu tilsvarende usandsynlig. Derimod kan jeg ikke få Lises hypotese i gyngen på samme måde, uanset hvorhenne på grafen jeg zoomer ind. 3 Forklarlighedskriteriet Lad os forlade denne form for analyse og vende os mod en helt anden form for succeskriterium om en matematisk hypotese, som jeg også savner i jeres besvarelser, nemlig hvor forklarlig hypotesen er. Min egen hypotese står svagest på dette punkt det virker ikke ret sandsynligt at svaret på et så basalt spørgsmål kan have et så kompliceret svar som det Maple fandt til mig. Og der er ikke nogen oplagte pæne tredjegradspolynomier der approksimerer stort set lige så godt. Mit fit til Oles hypotese havde samme forklarlighedsproblem. Men her kunne vi jo have valgt at sige at da fittet var rundt regnet α +.00226 så var den sande værdi noget så enkelt som α. Bemærk: At gætte på at α/h(α) = α er jo netop Lises hypotese! Svends hypotese har i modsætning hertil allerede fra udgangspunktet meget pæne tal og et kort udtryk. Men jeg synes det er svært at pege på hvorfor vi støder på konstanten 6 i denne kontekst, og har mere lyst til at tro på Svend når han postulerer at h (/2) = 4 end når han indirekte postulerer h (/2) = 3.696784...; igen blot fordi den første hypotese er simplest. 5
Lises hypotese (som jeg nu også vil tilskrive Ole) er langt den enkleste, og kommer endda med en forklaringsmodel fra hendes hånd. Nemlig: Lad e n,α,β være antallet af ettaller i de første n tegn af følgen s[α, β]. Vi ved at brøken e n,α,β n konvergerer mod α, fordi det er frekvensen for s[α, β]. Den proces vi udfører i hatningen ændrer ikke på antallet af ettaller, men kun på det totale antal, der jo nedskrives en gang for hvert ettal i strengen. Derfor bliver dens frekvens en grænseværdi for e n,α,β n e n,α,β = e n,α,β/n e n,α,β /n. Lad n gå mod uendelig, og voila! Dette er ikke et bevis, for de brøker vi har arbejdet med er jo kun approksimander til frekvenserne, og vi har ikke så meget styr på hvorledes konvergensen forløber. Men det virker ikke usandsynligt at man ville kunne skabe et bevis ud fra denne hypotese og så ville vil jo have opnået det ypperste, matematisk eksperimenteren kan lede til. A Facit Lises hypotese er sand. Tænk på den oprindelige s-følge som frembragt af en sekvens af hop på en talakse, hvert af længde α. Følgen af 0 og frembringes ved at skrive hver gang der hoppes over et helt tal, og 0 ellers. 0 0 0 0 0 0 0 Hat-processen svarer i dette billede til at fjerne et nedslag efter hvert heltal, og i stedet hoppe 2α hver gang der skal hoppes over et element i N. 0 0 0 0 0 Lad os slette et stykke af aksen af længde α umiddelbart efter hvert heltal, svarende til de lilla intervaller på figuren herover, og rykke alting sammen igen. Situationen kan afbildes 0 0 0 0 0 6
fordi hvert af de lange hop af længde 2α nu er afkortet til hop af længde α igen. Figuren herover er af samme type som den vi tog udgangspunkt i, men bemærk at afstanden mellem to delepunkter nu ikke længere er, men α. Det kan vi rette til ved at skalere op med at gange med α, så vi får 0 0 0 0 0 Pånær lidt støj i starten, der ikke kan have indflydelse på frekvensen, har vi realiseret ŝ-følgen som en helt almindelig s-følge den med hoplængde α α. Denne observation har tro det eller ej stor teoretisk betydning, for den kan benyttes til at anvise en algoritme til at aflæse α som en kædebrøk a + a 2 + a 3 + a 4 +... ud fra en proces hvor man alternerende erstatter 0 med indtil den resulterende frekvens er over en halv, og erstatter 0 med 0 indtil frekvensen kommer under en halv igen. a i -værdierne bliver antallet af erstatninger i hver gruppe af en af typerne. 7