Registerallokator til Dat1E. Jens Jakob Jensen, Nils Daniel Brixen og Henrik Stuart

Størrelse: px
Starte visningen fra side:

Download "Registerallokator til Dat1E. Jens Jakob Jensen, Nils Daniel Brixen og Henrik Stuart"

Transkript

1 Registerallokator til Dat1E Jens Jakob Jensen, Nils Daniel Brixen og Henrik Stuart 23. maj 2002

2 Indholdsfortegnelse 1 Oversigt over opgaven Formål Læsevejledng Sammenfatng Analyse af emneområdet Emnekontekst Defition af problemet Overordnet prcip Virtuelle registre Interferens En dskrænkng Optimalitet Formulerg som graffarvng Graffarvng Interferensgrafen Registerallokerg som graffarvng Grundlægge metode Renumberg Build Coalesce Spill Costs Simplify Spill Code Select Optimistisk farvng Simplify Select Resultat Forbedret coalescg Konservativ coalescg Iterativ coalescg Resultater Spill-omkostnger Defition af spill cost Chait s metode Bedst af tre Ændret spill cost og specialtilfælde

3 INDHOLDSFORTEGNELSE Spill-kode Alternative metoder Liveness-analyse Andre teknikker Prioritetsbaseret farvng Graffusion Implementationen Mål for implementationen Indskrænkng af struktionssæt MIPS Intel IA Introduktion af pseudo-struktioner Repræsentation af arkitektur og struktionssæt Grænseflade til allokatoren Grænseflade Mere generel grænseflade Oversigt over det implementerede DList TDListFn StrgSet Worklists RegisterAllocator Om implementationen Ændrger til Appel s pseudo-kode Prioriterg af MOVE-struktioner Liveness-analyse Beregng af spill cost Implementation af spill Automatisk callee saves-bevarg Debuggg Brugervejledng Anvelse Implementation af kald-konventioner Defition af en arkitektur Afprøvng Metode til afprøvng Lovlig registerallokerg Mål for afprøvng Praktiske begrænsnger Afprøvng med MIPS Kriterier for afprøvng Beskrivelse af uddata Eksempel fra Appel & George ([App99]) Eksempel fra Torben Mogensen ([Mog00]) Afprøvng med Intel Sammenligng med den eksistere Sammenligng af allokerg og coalescg Sammenligng af kørselsresultater

4 INDHOLDSFORTEGNELSE 3 5 Konklusion 74 6 Litteratur 76 A Kildetekst 78 A.1 DList.sig A.2 DList.sml A.3 TDListFn.sml A.4 StrgSet.sig A.5 StrgSet.sml A.6 Worklists.sig A.7 Worklists.sml A.8 RegisterAllocator.sml A.9 Architecture.sig A.10 ArchAppel3.sml A.11 ArchAppel4.sml A.12 ArchMIPS.sml A.13 ArchIntel.sml A.14 RegAllocTest.sml

5 Kapitel 1 Oversigt over opgaven 1.1 Formål Registerallokatoren der benyttes til 1.-delskurset Datalogi 1E er begrænset ved kun at understøtte en delmængde af MIPS-struktionssættet, og ved ikke at understøtte spill. Desuden er den relativt ufleksibel med hensyn til angivelse af caller-/callee-savesregistre. Målet med denne opgave er at udvikle en ny registerallokator, som kan erstatte den eksistere, til brug på kurset Datalogi 1E. Vi vil derfor lægge vægt på en simpel grænseflade til allokatoren, samt fyldestgøre dokumentation af den praktiske brug. Desuden er det vigtigt at registerallokergen er korrekt, men ikke nødvigvis optimal. På Datalogi 1E bruges sproget Standard ML til at implementere en oversætter, og da registerallokatoren skal fungere som en del heraf, er det er krav, at implementationen foretages i Standard ML mere specifikt skal den fungere ved brug af Moscow MLoversætteren Læsevejledng For at kunne konstruere en registerallokator, har vi undersøgt en del af teorien bag registerallokerg. Det giver sig udslag i, at opgaven består af to dele: en teoretisk del, og en praktisk del. Den teoretiske del består af en undersøgelse af grene af teorien bag registerallokerg. Denne undersøgelse danner grundlaget for den anden del, som omhandler den konkrete implementerg af en registerallokator. Kapitel 2 deholder den teoretiske del. Det består af en præciserg af emneområdet og problemet for opgaven (afsnit 2.1 og 2.2). Herefter beskrives en klassisk tilgang til problemet i afsnit 2.3 og 2.4. Afsnit 2.5 til 2.8 omhandler nogle forbedrger til den grundlægge metode. Afsnit 2.10 opsummerer kort nogle andre metoder at gribe registerallokergsproblemet an på. Vi gør os ikke forhåbnger om at dække hele registerallokergsområdet der er en ganske stor mængde litteratur om området. Vi har forsøgt at vælge de dele, som lader til at have gennemslagskraft, det vil sige tages med i efterfølge forskng. 1 Se sestoft/mosml.html.

6 1.3 Sammenfatng 5 I den teoretiske del af opgaven vil vi udelukke koncentrere os om at beskrive problemstillger og mulige løsnger. Vi vil ikke i den del tage overvejelser omkrg implementation med - således vil kapitel 2 deholde teori for nogle teknikker, som vi ikke vil tage med i vores implementerg. Kapitel 3 beskriver den konkrete implementation vi har foretaget. Der begyndes i afsnit 3.1 og 3.2 med at præcisere, hvilke dele af den beskrevne teori vi vil tage med i vores registerallokator, og hvilke årsager vi har til at vælge de dele ud, som vi har valgt. I afsnit 3.3 til 3.6 behandles forskellige dele af registerallokatorimplementationen, og afsnit 3.7 deholder en praktisk vejledng i brug af implementationen - herunder hvordan forskellige kaldkonventioner kan realiseres. Afprøvng af en registerallokator kan gribes an på mange forskellige måder. I afsnit 4.1 diskuteres nogle af disse, og den strategi som vi har valgt til at afprøve implementationen præsenteres. Dette er første del af kapitel 4 som omhandler afprøvngen af den implementerede registerallokator. Resten af dette kapitel beskriver hvilke afprøvnger, der er foretaget, og resultaterne af dem. Til sidst i opgaven, kapitel 5, er der placeret en konklusion. Da emneområdet for opgaven er behandlet i kurset Datalogi 1E, vil vi i kapitel 2 forudsætte, at læseren har et kskab til registerallokerg og oversætterteknik generelt svare til en person der har fulgt kurset Datalogi 1E. Dog er afsnit 3.7 rettet specielt mod personer der skal benytte registerallokatoren, det vil sige nogle der er i gang med at tage kurset Datalogi 1E. 1.3 Sammenfatng Der er implementeret en registerallokator ud fra beskrivelsen i [App99] som resulterer i lovlige registerallokererger i de afprøvede tilfælde. Sammenlignet med den eksistere registerallokator er der ikke den store forskel for programmer som ikke spiller, hvilket tyder på at den implementerede registerallokator foretager en rimelig allokerg og fjerner et rimeligt antal MOVE-struktioner. Der er tilstræbt en enkel grænseflade til registerallokatoren som samtidig er fleksibel med hensyn til valg af arkitektur og kaldkonvention. Det mener vi er lykkedes. Alt i alt mener vi at have udviklet et rimeligt alternativ til den eksistere registerallokator på Datalogi 1E, som desuden kan benyttes til videre undersøgelse af emnet registerallokerg.

7 Kapitel 2 Analyse af emneområdet 2.1 Emnekontekst Registerallokerg er en del af processen at oversætte fra et programmergssprog til maskkode. Som bekt er der mange former for lager i en maske. Disse er, for eksempel, registre, CPU-cache, arbejdslager og diske. Af disse er det kun registrene, som oversætteren har fuld kontrol over - for eksempel kan oversætteren ikke kontrollere hvilke tg der er placeret i CPU ens cache. Da tilgangstiden til registrene er væsentlig lavere resten af lageret, er det ønskeligt at udnytte disse i videst mulig udstrækng. Vi vil i resten af opgaven bruge betegnelsen hukommelse om alle typer for lager, som ikke er registre. Hvis ambitionen med oversætteren blot er at få bevaret programmets semantik, kan man ignorere problemet med at udnytte registrene optimalt. Man kan så klare sig med et ganske lavt antal registre, og opbevare alt i hukommelsen; hver gang en værdi skal bruges, hentes den d i et register og skrives tilbage til hukommelsen efter en eventuel ændrg. Dette resulterer i et højt antal hukommelsestilgange for programmet, og disse antages at være væsentlig langsommere registertilgange. Hvis ambitionen derimod, er at oversættelse, for eksempel fra et højniveau-sprog til maskkode, skal resultere i kode der er (mdst) lige så god som håndprogrammeret maskkode, så er det en vigtig del af processen, at udnytte registrene godt. Det er registerallokatorens opgave at bestemme, hvad der skal placeres i de forskellige registre på forskellige tidspunkter. Opgaven går således ud på at udføre denne fordelg, så antallet af hukommelsestilgange for det resultere program mimeres. Oversættelse af et program foregår ofte i flere tr, hvor der bruges en mellemkode (se [App99] kapitel 7). På denne mellemkode udføres nogle forskellige optimerger, som for eksempel afhænger af rækkefølgen af struktionerne, og ikke af det konkrete format for struktionerne. Denne del af oversættelsen kalder vi optimerg. 2.2 Defition af problemet I dette afsnit vil vi præcisere hvad der forstås ved problemet registerallokerg.

8 2.2 Defition af problemet Overordnet prcip En metode som er helt fundamental for hvordan vi griber registerallokergen an på, er at lade optimergsfasen af oversættelsen tro, at der er et ubegrænset antal registre til rådighed. Når optimergsfasen er overstået, er det så op til registerallokatoren at sørge for, at der kun benyttes registre, som rent faktisk er til stede i masken. På denne måde bliver registerallokergen altså adskilt fra resten af oversættelsesprocessen Virtuelle registre I de dele af oversættelsen der ligger før registerallokergen dføres altså såkaldte virtuelle registre 1, som oversætteren kan benytte til at deholde variable i programmet, mellemresultater eller konstanter. Registerallokerg består så i at konstruere en afbildng fra virtuelle registre til maskregistre. På denne måde bliver hvert virtuelt register knyttet til et maskregister. Det er dog ikke ligegyldigt hvordan denne afbildng konstrueres. Hvis, for eksempel, en struktion skal læse to argumenter (antag at de henholdsvis har værdierne 3 og 5) og disse er placeret i to forskellige virtuelle registre i mellemkoden, bliver programmets semantik ikke bevaret, hvis de to virtuelle registre afbildes i samme maskregister - så vil struktionen enten få værdien 3 eller 5 på begge argumenter. I resten af opgaven vil vi bruge betegnelsen kildeprogrammet, om den sekvens af maskkode-struktioner som gives som ddata til registerallokatoren. Kildeprogrammet består altså af struktioner skrevet i et bestemt masksprog, blot med den forskel, at der antages et vilkårligt stort antal registre Interferens Ovenståe problematik med overlap i brug kan formaliseres som begrebet terferens (følge defition er den ultimative defition af terferens som dført af Chait et al. i [CAC + 81] side 55). To virtuelle registre terfererer, hvis der fdes et sted i kildeprogrammet, og en mulig eksekvergsrækkefølge af struktionerne, så der gælder at: 1. Begge virtuelle registre er deferede 2. Begge virtuelle registre bliver brugt 3. Der er forskellige værdier i de to virtuelle registre Registerallokergen skal altså foregå, så tet par af virtuelle registre der terfererer allokeres til samme maskregister. Hvis bare et af de tre punkter ovenfor ikke er opfyldt, kan de to virtuelle registre tildeles samme maskregister på det pågælde punkt, for den pågælde eksekverg af kildeprogrammet der er gen forskel på de to virtuelle registre. På den anden side, hvis alle tre er opfyldte, så er der forskel på de to virtuelle registre, og det vil være forkert at benytte samme maskregister på det punkt, i den pågælde eksekverg. Med ovenståe defition, er det ikke nemt at afgøre, om to virtuelle registre terfererer man skal for samtlige steder i kildeprogrammet og samtlige mulige eksekverger af dette undersøge de tre punkter. [CAC + 81] bemærker, at dette i det generelle tilfælde er uafgørligt. Derfor benyttes en anden defition af, om de virtuelle 1 For at undgå forvirrg med de fysiske registre, vil vi betegne disse som maskregistre, hvor det er nødvigt for at undgå misforståelser.

9 2.2 Defition af problemet 8 registre terfererer ved en struktion, som tilnærmer de tre punkter. Denne er vist i defition 2.1. Defition 2.1 Interferens To virtuelle registre u og v terfererer ved en struktion i, hvis 1. u og v begge er tilgængelige. Det vil sige, der fdes en vej fra en defition af u til i, og en vej fra en defition af v til i. 2. u er leve ved en defition af v (eller omvt). Hvor en variabel v er leve ved en struktion i, hvis der fdes en vej fra i til en struktion der læser v, og der ikke er nogen skrivng til v på vejen. Denne defition af terferens er naturligvis et konservativt estimat af den ultimative defition, så der vil være tilfælde, hvor virtuelle registre tildeles forskellige maskregistre, selvom de kunne have delt et maskregister. Fordelen er dog, at denne defition af terferens kan implementeres forholdsvis let. Dette gøres ved hjælp af liveness-analyse, der fder ud af hvilke virtuelle registre, der er leve på de forskellige punkter i kildeprogrammet. Dette er kort beskrevet i afsnit 2.9. Alt i alt er registerallokerg altså det problem, at konstruere en afbildng fra de virtuelle registre til maskregistrene, således at to virtuelle registre der terfererer på noget punkt i kildeprogrammet, ikke tildeles samme maskregister. Da der kan være et vilkårligt stort antal virtuelle registre, men kun et fast (lille) antal maskregistre, kan man naturligvis ikke forvente, at det altid kan lade sig gøre at konstruere afbildngen fra virtuelle- til maskregistre. Hvis dette er tilfældet, må man opbevare dholdet af et eller flere virtuelle registre i hukommelsen - man spiller registret. Den kode der skal sørge for at dlæse og skrive registret tilbage til hukommelsen kaldes spill kode. Briggs nævner i [Bri92], at prcippet med adskillelsen af registerallokerg fra resten af oversættelsesprocessen er en god idé, hvis der er tilstrækkeligt mange registre til rådighed, men ikke nødvigvis, hvis der er meget få registre. Vi vil dog (jvf. antagelsen i afsnit 2.1) behandle registerallokergen som beskrevet i afsnit Med dette valg, er der forskellige måder at foretage registerallokergen på: der kan for eksempel udføres registerallokerg for hvert udtryk (se for eksempel [App99] afsnit 11.4), for hver procedure eller for et helt program. Registerallokerg for en procedure af gangen kaldes global registerallokerg 2, og er den metode vi vil undersøge En dskrænkng Briggs bemærker i [Bri92] (afsnit 2.2.1), at et virtuelt register v kan bruges til flere forskellige opgaver i løbet af en procedure, og at det ikke er nødvigt at tildele det samme maskregister til alle disse forskellige opgaver. Dette benyttes til at defere begrebet live range, som altså er disjunkte sekvenser af struktioner høre til forskellige opgaver for et virtuelt register. Hvis man i løbet af oversættelsen dfører rigeligt af virtuelle registre - det vil sige et for hver opgave, kan man opnå, at der kun er én live range for hvert virtuelt register. På denne måde kan man nøjes med at behandle virtuelle registre under registerallokergen, og ikke live ranges. Dette kræver naturligvis også, at det oprdelige program er skrevet på denne måde - for eksempel, at man 2 Se for eksempel [Bri92] afsnit 1.2.

10 2.3 Formulerg som graffarvng 9 ikke bruger samme variabel i til to helt forskellige opgaver denfor samme procedure, men derimod deferer en variabel per opgave. Vi vil dskrænke os til at behandle virtuelle registre under registerallokergen, og ikke live ranges. Dette svarer til, at vi lader et virtuelt register og en live range være samme tg. Dette valg begrænser ikke mulighederne for resten af registerallokergen hvis processen ønskes udvidet med live ranges, kan der dføres et separat tr der identificerer live ranges i kildeproceduren (se for eksempel [CH90] afsnit 4.1) Optimalitet I den hidtidige beskrivelse har vi været lidt vage omkrg hvad der forstås ved at udnytte maskregistrene bedst muligt. Målet med registerallokergen er at foretage tildelgen af virtuelle registre til maskregistre, så kildeprogrammets semantik bevares (ved hjælp af terferens-begrebet), og så antallet af hukommelsestilgange i det resultere program mimeres. Hvis det på nogen måde er muligt at foretage allokergen, så der ikke spilles, så er en optimal registerallokerg en, der opnår dette. Hvis det ikke er muligt, er en optimal registerallokerg, en, der giver det laveste antal hukommelsestilgange som følge af spill kode. Registerallokergsproblemet kan reduceres til et graffarvngsproblem (se afsnit 2.3). Ifølge [CAC + 81] er graffarvngsproblemet N P-hårdt. Det vil sige registerallokergsproblemet er også N P-hårdt. Det betyder, at man ikke skal regne med at kunne konstruere en registerallokator der udfører optimal registerallokerg denfor overskuelig tid i samtlige tilfælde. 2.3 Formulerg som graffarvng Den klassiske metode til at behandle registerallokerg på, er ved at reducere det til et graffarvngsproblem. Det var Chait et al. der i i [CAC + 81] først beskrev en implementation af en registerallokator bygget ud fra formulergen af registerallokergsproblemet som et graffarvngsproblem Graffarvng Givet et graf G = (V, E) kan graffarvng betyde to forskellige tg: enten er det kanterne i E, der skal farves, eller også er det knuderne i V der skal farves (se for eksempel [Bry92]). I forbdelse med registerallokerg benyttes udtrykket graffarvng om knudefarvngsproblemet. En farvng af G er en tildelg af en farve til hver af knuderne i V, således, at tet par af knuder, der er forbundne af en kant i E, får samme farve. Det mdste antal farver som kan bruges til at farve G, kaldes det knude-kromatiske tal (eller blot det kromatiske tal) for G Interferensgrafen Antag nu, at vi skal udføre registerallokerg for en procedure P fra et givent kildeprogram 3. Vi skal (som beskrevet i afsnit 2.2.3) tildele hvert virtuelt register et maskregister. Vi kan modellere dette ved at konstruere en terferensgraf, hvor der er en knude for hvert virtuelle register i P, og hvor der er en kant imellem to knuder, hvis 3 Som nævnt i afsnit på side 8 vil vi undersøge global registerallokerg, så vi behandler hver procedure for sig.

11 2.3 Formulerg som graffarvng 10 de terfererer (se afsnit for en diskusion af begrebet terferens). Desuden er der én knude for hvert maskregister, og disse terfererer alle med handen - de udgør altså en k-klike, hvis der er k maskregistre. De knuder der svarer til maskregistre betegnes præfarvede knuder - at de terfererer med handen skyldes, at de naturligt nok ikke kan være i det samme maskregister. En fordel ved at medtage præfarvede knuder i terferensgrafen er, at tg der er specifikke for maskarkitekturen kan dkodes i grafen. For eksempel nævner [CAC + 81] at i maskkoden til IBM System/370 kan base-registret til en LOAD-struktion ikke placeres i registret R0. Denne type formation er yderst specifik for den givne arkitektur, men ved at lade alle virtuelle registre i kildeprogrammet der benyttes som base-registre til load-struktioner terferere med det præfarvede register R0, kan formationen puttes d i terferensgrafen, og behandles på samme måde som alle andre terferenser. Interferensgrafen kan på denne måde benyttes til at abstrahere mange detaljer omkrg arkitekturen Registerallokerg som graffarvng Hvis der er k maskregistre, og vi kan graffarve terferensgrafen med k farver, svarer det til en allokerg af registrene: hvert virtuelle register er tildelt et maskregister (det vil sige har fået en farve), og hvis to virtuelle registre på noget punkt i kildeproceduren terfererer (det vil sige de er kantforbundne i grafen), så sørges der for, at de tildeles forskellige maskregistre (det vil sige, får forskellig farve). En optimal løsng af graffarvngsproblemet er altså, at fde en farvng, der benytter et antal farver, der svarer til det kromatiske tal for grafen. Det vil sige, vi omformulerer registerallokergsproblemet til et problem, der mimerer antallet af brugte registre for kildeproceduren. Registerallokergsproblemet søgte (se afsnit 2.2.5), at mimere antallet af hukommelsetilgange i det resultere program. Dette er et svært problem, da mange faktorer spiller d på antallet af hukommelsetilgange i det køre program. Vi omformulerer altså problemet til det mere håndgribelige, at mimere antallet af brugte registre. Den normale formulerg af graffarvngsproblemet er: fd det kromatiske tal for grafen. At fde en farvng der benytter dette antal farver er det vi søger. Afgørlighedsproblemet: Kan grafen farves med k farver? er ifølge [CAC + 81] N P-fuldstændigt. Det vil sige, vi skal ikke forvente at kunne fde en farvng af terferensgrafen, der benytter det færrest mulige antal farver. Når det handler om registerallokerg er det altså ikke så teressant at fde det kromatiske tal for grafen der ønskes farvet. Hvis vi givet et antal maskregistre k kan fde en farvng, der højst benytter k farver, er vi tilfredse. Bemærk her, at da de præfarvede knuder udgør en klike i grafen, vil det kromatiske tal altid være mdst k (se for eksempel [Bry92] kap. 11). Det der er relevant er altså hvor få farver vi kan klare os med, hvis vi ser bort fra de præfarvede knuder. Dette svarer til, at vi ikke kan sikre at vi benytter det færrest mulige antal maskregistre, men stiller os tilfredse med at kunne have plads til alle virtuelle registre i maskregistre dog forsøger vi at mimere antallet af benyttede maskregistre. Sammenfattet kan formulergen som graffarvng beskrives som angivet i defition 2.2. Defition 2.2 Registerallokerg ved graffarvng Givet en procedure P fra et kildeprogram og antallet af registre på den pågælde maskarkitektur, k, ønsker vi at fde en k-farvng af terferens-grafen for P. I beskrivelsen af registerallokerg som graffarvng i defition 2.2, har vi ignore-

12 2.4 Grundlægge metode 11 ret den mulighed, at den konstruerede terferensgraf har et kromatisk tal, der er højere det antal registre der er til rådighed (k). Hvis det er tilfældet, kan der naturligvis ikke fdes en k-farvng af grafen, og man siger at grafen ikke er farvelig. Dette svarer til at med formationen fra terferensgrafen er der ikke plads til de virtuelle registre i maskregistrene. Der må derfor dsættes spill-kode (se side 8). Da graffarvngsproblemet er N P-fuldstændigt, kan man heller ikke afgøre om den givne terferensgraf er farvelig. Det vil sige, der vil være grafer der erklæres som ikke farvelige, selvom de rent faktisk er det 4. Da terferensgrafen kun er et konservativt estimat af, hvordan de virtuelle registre terfererer (se afsnit 2.2.3), vil der ligeledes være kildeprogrammer for hvilke terferensgrafen vil blive angivet som ikke farvelig, selvom der godt kunne have været plads til de virtuelle registre i maskregistrene. Der er altså tilfælde hvor der spilles, selvom det ikke er nødvigt. I forhold til semantikken af kildeprogrammet er dette ikke noget problem - vi skal alligevel kunne håndtere at registre skal spilles. 2.4 Grundlægge metode I de foregåe afsnit har vi kun beskæftiget os med formulergen af registerallokerg. Nu vil vi beskrive en metode til rent faktisk at foretage allokergen udfra den givne beskrivelse af problemet. Den grundlægge algoritme for registerallokerg ved graffarvng stammer fra forskerholdet fra IBM Watson Research Center 5. Denne allokator er også kt som Yorktown allokatoren, eftersom IBM s ovennævnte forskngsafdelg befder sig i Yorktown Heights, New York. I den oprdelige artikel af Chait et al. ([CAC + 81]) er behandlgen af spill ret ad hoc-præget. Dette kommenteres i slutngen af artiklen, hvor der foreslås en anden metode til at håndtere spill, som tager udgangspunkt i terferensgrafen. Denne idé blev taget op, og i [Cha82] præsenteres den modificerede algoritme. Det er denne algoritme vi vil beskrive i det følge. Et overblik over algoritmen er afbilledet i figur 2.1. Betegnelserne for de enkelte tr vil ikke kunne fdes direkte i [CAC + 81] og [Cha82], men er dført af Briggs i [Bri92] i hans tolkng af artiklerne af Chait. Vi vil i det følge gennemgå de enkelte tr. Figur 2.1 Yorktown allokergs-algoritmen 4 I [CAC + 81] er det vist, at enhver graf kan opstå som terferensgraf for en kildeprocedure, hvilket viser eksistensen af de nævnte grafer. 5 Det vil sige, Chait et al. som beskrevet i [Cha82]

13 2.4 Grundlægge metode Renumberg Dette første tr går ud på at ddele brugen af de virtuelle registre i live ranges 6, som er beskrevet i afsnit Det er disse live ranges som dsættes i terferensgrafen. Hvordan man fder de forskellige live ranges i kildeproceduren er blandt andet beskrevet i [Bri92]. Som nævnt i afsnit vil vi begrænse os til kun at have én live range for hvert virtuelt register. Derfor er dette tr ikke så relevant for vores gennemgang Build Denne fase konstruerer terferensgrafen, der skal farvelægges i de næste tr af algoritmen. Hvordan grafen i praksis opbygges er beskrevet i for eksempel [Cha82] eller [App99] Coalesce Det overordnede prcip om at behandle registerallokerg som en separat del af oversættelsen (se afsnit 2.2.1) betyder som nævnt, at de tidligere faser i oversættelsesprocessen kan benytte et ubegrænset antal virtuelle registre, og der kan (se for eksempel [GA96] afsnit 1) være ganske mange MOVE-struktioner mellem sådanne virtuelle registre. Hvis antagelsen om at der er virkårligt mange registre til rådighed under kodegenerergen ikke skal resultere i unødvigt mange register-kopierger, må det kræves, at registerallokatoren er opmærksom på at fjerne overflødige register-til-register MOVE-struktioner. Det vil sige, hvis de to virtuelle registre v i og v j for en MOVEstruktion ikke terfererer, kan de slås sammen til ét og samme virtuelle register, som vi navngiver v ij, hvorved MOVE-struktionen ikke længere er nødvig dette betegnes coalescg. Når to virtuelle registre slås sammen til et, skal terferensgrafen naturligvis ændres. Det mest iøjnefalde resultat er, at to af knuderne i grafen er slået sammen til én. Hvis denne nye knude sættes til at terferere med alle knuder, som terfererede med mdst en af de oprdelige knuder, fås et konservativ estimat for hvilke knuder der terfererer med den nye knude. Grunden til at formationen ikke nødvigvis er præcis er, at der er fjernet en MOVE-struktion, og under opbygnigen af terferensgrafen tilføjes terferenser for hver struktion i kildeproceduren. I [Bri92] er der i afsnit angivet et eksempel, hvor den nye terferensgraf ikke er præcis. En løsng er at genopbygge terferensgrafen hver gang der fjernes en MOVE-struktion. Dette er dog ret dyrt, så normalt gås hele koden for kildeproceduren igennem, og der fjernes eventuelt flere MOVE-struktioner, og undervejs opdateres terferensgrafen konservativt, som beskrevet ovenfor. Hvis der efter et sådant gennemløb er fjernet nogle MOVE-struktioner returnerer vi til Build-stadiet, og gentager processen. Ifølge [BCT94] vil denne Build-Coalesce cyklus i praksis kun blive gentaget nogle få gange Spill Costs Dette skridt er optret til at farve grafen. For hvert virtuelt register i terferensgrafen, udregnes en omkostngsværdi for hvor dyrt det vil være at spille denne. Denne værdi bruges til at vælge hvilke virtuelle registre der skal spilles, hvis det skulle være nødvigt (se afsnit 2.4.5). 6 I Chait s formulerg kaldes de blot names.

14 2.4 Grundlægge metode 13 Overordnet er målet naturligvis at vælge at spille det register, som giver den mdste stigng i antallet af udførte LOAD-STORE struktioner for det resultere program. Dette estimeres ved at tildele spill costs, og foretage grådige valg, hvis det besluttes at der skal spilles. Den mest naive måde at dsætte spill-kode for et virtuelt register v der skal spilles, er at dsætte en LOAD-struktion før hver struktion der læser v, og efter hver skrivng til v at dsætte en STORE-struktion der kopierer v til hukommelsen. På denne måde kan prisen for at spille et virtuelt register v sættes til antallet af gange der læses og skrives til v. Dette antal kan ikke afgøres præcist, men ved at antage at en struktion udføres 10 gange så ofte hvis den er placeret i en løkke, kan det approksimeres. I Yorktown allokatoren benyttes groft sagt ovenståe metode til dsættelse af spill-kode, og den nævnte defiton af spill cost. Der er dog nogle forbedrger som er beskrevet i [Cha82]. Dette er en simpel måde at udregne ulempen/fordelen ved at spille det pågælde register. I afsnit 2.7 behandles andre måder at udregne spill costs Simplify Observationen der benyttes til at farve grafen er: lad G være en graf, som vi ønsker at farve med k farver, og antag at der fdes en knude v i G, af grad < k. Lad G være den graf der fås ved at fjerne v og alle kanter cidente med v fra G. Så gælder: G kan farves med k farver G kan farves med k farver Implikationen mod højre er oplagt. Antag at der er fundet en k-farvng af G. Da G er konstrueret fra G ved at fjerne en knude v at grad < k, vil der altid være mdst en farve ledig til også at farve v i G, som hermed altså også kan k-farves. Simplify processen undersøger repetativt knuderne i grafen G og alle knuder af grad < k, bliver lagt på en stak, samt fjernet fra grafen sammen med alle d- og udgåe kanter. Såfremt der kun er knuder, hvis grad er k tilbage i G, udvælges en af disse til at skulle spilles. Hvilken knude der vælges her afhænger af den valgte metode til at udregne spill omkostng se afsnit 2.7. I prcippet burde man her dsætte den nødvige spill-kode, og starte hele processen forfra. I stedet fortsættes med simplify processen, dtil grafen G er tom denne metode er billigere i køretid for registerallokergen. Hvis der er knuder der undervejs blev markeret til spill, genereres nu spill-kode for disse, og registerallokergen starter forfra. Hvis det ikke er tilfældet, fortsættes til næste fase: select Spill Code Såfremt en eller flere knuder i grafen er blevet markeret til spill, vil dette tr gennemgås. For hvert virtuelt register v der skal spilles, dsættes spill-kode. Den grundlægge metode til dette er (se for eksempel [Mog00] afsnit 8.6): i hver struktion i, der enten læser eller skriver v, erstattes v af v i. Efter hver struktion i der skriver til v dsættes en STORE-struktion der skriver værdien af v i til hukommelsen. Før hver struktion i der læser v, dsættes en LOAD-struktion der henter værdien fra hukommelsen til v i. Der dføres altså en masse nye virtuelle registre, som har kort levetid, i stedet for det register der skulle spilles. Dette er som også tidligere nævnt den mest grundlægge metode til at dsætte spill-kode i afsnit 2.8 behandles mere avancerede måder at dsætte spill-kode på.

Gruppe 7 Toke Høiland-Jørgensen Morten Brandrup Mads Hald Jørgensen Thomas Petersen Bluhme. Vejleder Torben Braüner

Gruppe 7 Toke Høiland-Jørgensen Morten Brandrup Mads Hald Jørgensen Thomas Petersen Bluhme. Vejleder Torben Braüner LEGO OG LABYRINTER Gruppe 7 Toke Høiland-Jørgensen Morten Brandrup Mads Hald Jørgensen Thomas Petersen Bluhme Vejleder Torben Braüner 4. semester, forår 2008 NatBas RUC Abstrakt Vi har undersøgt hvilken

Læs mere

Forord. Aalborg Universitet, d. 5. januar 2001. Nikolaj Kolbe. Mike H. Hougaard. Flemming N. Larsen

Forord. Aalborg Universitet, d. 5. januar 2001. Nikolaj Kolbe. Mike H. Hougaard. Flemming N. Larsen Forord Denne rapport er skrevet af projektgruppe N4-211 ved Aalborg Universitet, afdeling for datalogi. Rapporten er baseret på gruppens arbejde foretaget ved VR-Center Nord og med brug af dette centers

Læs mere

Brugervenlig enheds-ai, til at minimere påkrævet opmærksomhed i RTS-spil

Brugervenlig enheds-ai, til at minimere påkrævet opmærksomhed i RTS-spil Brugervenlig enheds-ai, til at minimere påkrævet opmærksomhed i RTS-spil 25/01/2011 DoTA AI m. fl. Nexus Wars, Income Wars m. fl. Majesty Diner Dash Hastighed Liv og skade Iteration Relaterede AI-projekter

Læs mere

SØGEORDSANALYSE EBOGEN. Søgeordsanalyse ebogen Nikolaj Mogensen

SØGEORDSANALYSE EBOGEN. Søgeordsanalyse ebogen Nikolaj Mogensen SØGEORDSANALYSE EBOGEN Side 1 af 43 EBOGEN OM SØGEORDSANALYSE Det er efterhånden mange år siden, at jeg første gang hørte om begrebet søgeordsanalyse. Disciplinen søgeordsanalyse hænger tæt sammen med

Læs mere

P2P-netværk. Optimering og samarbejde. Daniel Grøndal Sangill. Jens Taarnhøj. Omkostningsfordeling og spilteori. Afleveringsdato: 1.

P2P-netværk. Optimering og samarbejde. Daniel Grøndal Sangill. Jens Taarnhøj. Omkostningsfordeling og spilteori. Afleveringsdato: 1. P2P-netværk Optimering og samarbejde Navne: Daniel Grøndal Sangill Jens Taarnhøj Specialevejleder: Specialefag: Uddannelse: Jens Leth Hougaard Omkostningsfordeling og spilteori CBS, Cand.Merc.Mat Afleveringsdato:

Læs mere

Kunstigt liv. Bachelorprojekt 21. juni 2005. Mikkel Boje mikkel@diku.dk. Datalogisk Institut Københavns Universitet

Kunstigt liv. Bachelorprojekt 21. juni 2005. Mikkel Boje mikkel@diku.dk. Datalogisk Institut Københavns Universitet Kunstigt liv Bachelorprojekt 21. juni 2005 Mikkel Boje mikkel@diku.dk Datalogisk Institut Københavns Universitet Forord Denne rapport er resultatet af et bachelorprojekt udført ved Datalogisk Institut

Læs mere

RSA-kryptosystemet. RSA-kryptosystemet Erik Vestergaard

RSA-kryptosystemet. RSA-kryptosystemet Erik Vestergaard RSA-kryptosystemet RSA-kryptosystemet Erik Vestergaard Erik Vestergaard www.matematikfysik.dk Erik Vestergaard, 007. Billeder: Forside: istock.com/demo10 Erik Vestergaard www.matematikfysik.dk 3 1. Indledning

Læs mere

Undersøgelse af en genetisk algoritme

Undersøgelse af en genetisk algoritme Undersøgelse af en genetisk algoritme Study of a genetic algorithm Gruppe 2, hus 13.2 Gruppemedlemmer: Sanne Bjerg Tanja Josefsen Pernille Hviid Petersen Claus Daldorph Nielsen Rasmus Rasmussen Vejleder:

Læs mere

Poly. - Javapakke til behandling af polynomier

Poly. - Javapakke til behandling af polynomier Poly - Javapakke til behandling af polynomier z 3 x y x 2 3 x -3 Skrevet af Susanne Nykjær Knudsen, John Thystrup Jensen, Jens Lykke Brandt, Troels C. Damgaard, Jacob W. Winther og Mikkel Bundgaard Vejleder:

Læs mere

Rejseplanen. Denne rapport er udarbejdet af: Asbjørn Hansen Morten Dalgaard Johansen Lauge Bro Lilleås Johan Schnack Mertz & Christian Poulsen

Rejseplanen. Denne rapport er udarbejdet af: Asbjørn Hansen Morten Dalgaard Johansen Lauge Bro Lilleås Johan Schnack Mertz & Christian Poulsen 2010 Rejseplanen Roskilde Universitet, RUC Hum-Tek, Hus 08.1, Gruppe 4 Vejleder: Niels Jørgensen Tegn u. mellemrum: 121.531 Dato: 21-12-2010 Denne rapport er udarbejdet af: Asbjørn Hansen Morten Dalgaard

Læs mere

HÅNDBOG I SUND FORMIDLING Et indblik i forskningens verden

HÅNDBOG I SUND FORMIDLING Et indblik i forskningens verden HÅNDBOG I SUND FORMIDLING Et indblik i forskningens verden Siff Malue Nielsen & Ole Nørgaard Et indblik i forskningens verden 1. udgave, 2014 Udgivet af Vidensråd for Forebyggelse i samarbejde med Ugeskrift

Læs mere

Simulering af Poker Gruppe 8

Simulering af Poker Gruppe 8 Simulering af Poker Gruppe 8 Kasper Emil Dueholm Freiman Roy Bergholdt Christian Arentsen Morten Egedal Allan Laursen Johan Følsgaard Rasmus Kristoffer Pedersen Under vejledning af: Maja Tønnesen Roskilde

Læs mere

Speciale CLM spansk. Forfatter: May-Britt Hestehauge Studienummer: 243541. Vejleder: Lektor Sven Tarp Fakultet for sprog og erhvervskommunikation

Speciale CLM spansk. Forfatter: May-Britt Hestehauge Studienummer: 243541. Vejleder: Lektor Sven Tarp Fakultet for sprog og erhvervskommunikation Speciale CLM spansk Forfatter: May-Britt Hestehauge Studienummer: 243541 Vejleder: Lektor Sven Tarp Fakultet for sprog og erhvervskommunikation En eksemplarisk metode for, hvordan man kan anvende internettet

Læs mere

System til vagtplanlægning

System til vagtplanlægning System til vagtplanlægning Virkelighed og modeller Gruppe A312, Software Det Teknisk- Naturvidenskabelige Basisår Aalborg Universitet 19. december 2005 Det Teknisk-Naturvidenskabelige Basisår Software

Læs mere

En Introduktion til Sandsynlighedsregning

En Introduktion til Sandsynlighedsregning En Introduktion til Sandsynlighedsregning 4. Udgave Michael Sørensen 26. juni 2003 0 Forord Til 2. udgave Disse forelæsningsnoter trækker i betydelig grad på noter udarbejdet af en række kolleger. Det

Læs mere

NOTAT Inspiration til valg af emne August 2008

NOTAT Inspiration til valg af emne August 2008 Inspiration til emnevalg til kandidatafhandlingen Af Vibeke Ankersborg, Kandidatafhandlingskonsulent Dette notat er en bearbejdet udgave af kapitel 3 i Ankersborg, Vibeke (2011): Specialeprocessen! Tag

Læs mere

Klagesager i udbudsprocesser hvordan undgår man dem?

Klagesager i udbudsprocesser hvordan undgår man dem? Klagesager i udbudsprocesser hvordan undgår man dem? September 2012 Udbudsportalen.dk Weidekampsgade 10 2300 København S Post@udbudsportalen.dk Tidligere på året offentliggjorde Udbudsrådet en analyse

Læs mere

Matematiske emner SPIL. Sandsynligheder og Strategier

Matematiske emner SPIL. Sandsynligheder og Strategier Matematiske emner SPIL Sandsynligheder og Strategier Ole Witt-Hansen Køge Gymnasium 2006 INDHOLD Kap. Sandsynligheder ved spil.... Lotto... øvelser...2 2. Poker...3 3. Ruinsandsynligheder ved Roulette

Læs mere

SO-projekt Marts 2014

SO-projekt Marts 2014 SO-projekt Marts 2014 Matematik A - IT B Kaffeafkøling Lavet af: Mads Hougaard, Philip Elbek og Frederik Bagger Under vejledning af: Jørn Christian Bendtsen og Karl Bjarnason Indholdsfortegnelse Forord...

Læs mere

Planlægning af it-undervisning

Planlægning af it-undervisning Planlægning af it-undervisning IT- & Telestyrelsen, juni 2009. Planlægning af it-undervisning Udgivet af: IT- & Telestyrelsen Publikationen kan hentes på IT- & Telestyrelsens hjemmeside: www.itst.dk ISBN

Læs mere

Start med Excel 2000. www.knowware.dk www.knowwareglobal.com. KnowWare

Start med Excel 2000. www.knowware.dk www.knowwareglobal.com. KnowWare 2 KnowWare Start med Excel 2000 Palle Grønbæk, partner@email.dk 1. udgave, 1. oplag, nov. 1999 ISBN 87-90785-31-2 Copyright 1999 forfatter og KnowWare, mm@knowware.dk Printed by OTM in Denmark 1999 Published

Læs mere

Motivation når ledelsen ikke motiverer

Motivation når ledelsen ikke motiverer Motivation når ledelsen ikke motiverer Bacheloropgave HA 6.semester 2011 Søren Riisager Gruppe nr. 61 1 Motivation når ledelsen ikke motiverer Af Søren Riisager Erhvervsøkonomisk Bachelorprojekt 2011 Aalborg

Læs mere

- gode råd og praktiske oplysninger om personalepolitiske samarbejdsprojekter

- gode råd og praktiske oplysninger om personalepolitiske samarbejdsprojekter Amtsrådsforeningen Kommunale Tjenestemænd og Overenskomstansatte (KTO) De 7små bjerge - gode råd og praktiske oplysninger om personalepolitiske samarbejdsprojekter De 7 små bjerge 1 INDHOLDSFORTEGNELSE

Læs mere

Opgave i menneske-maskine interaktion: Evaluering af Skype med fokus på virksomhedsteorien

Opgave i menneske-maskine interaktion: Evaluering af Skype med fokus på virksomhedsteorien Opgave i menneske-maskine interaktion: Evaluering af Skype med fokus på virksomhedsteorien Peter Sejersen (20031122), Tue Toft Nørgård (20042377) og Asger Norskov Bak (20053831) Samlet opgave i Menneske-maskine

Læs mere

SEO træet - En komplet guide til SEO

SEO træet - En komplet guide til SEO SEO træet - En komplet guide til SEO Linkværdi Ankertekst Billeder og alt tags Overskrifter Meta titler Tekst SMM URL adressen IP Diversitet Autoritet Indhold Indho Meta beskrivelser Typer af links Duplicate

Læs mere

PROBLEMSTILLING 4 BEGRÆNSNINGER 7 OVERORDNET INDLEDNING 8 WORLD WIDE WEB STRATEGISKE OVERVEJELSER 9

PROBLEMSTILLING 4 BEGRÆNSNINGER 7 OVERORDNET INDLEDNING 8 WORLD WIDE WEB STRATEGISKE OVERVEJELSER 9 PROBLEMSTILLING 4 SKIVE EDB CENTERETS KRAV/ØNSKER 4 PROBLEMFORMULERING 4 PROBLEMDISKUSSION 5 BEGRÆNSNINGER 7 OVERORDNET INDLEDNING 8 WORLD WIDE WEB STRATEGISKE OVERVEJELSER 9 HVORDAN ER WORLD WIDE WEB

Læs mere

Start med Excel 2000

Start med Excel 2000 Start med Excel 2000 Acrobat Reader: tips... F5/F6 åbner/lukker Bogmærker I Menuen Vis indstiller du, hvordan filen vises på skærmen CTRL+0 = Hele siden CTRL+1 = Originalstørrelse CTRL+2 = Vinduesbredde

Læs mere

Excel 2010 Videregående

Excel 2010 Videregående Excel 2010 Videregående Velkommen på vores Excel Videregående kursus Vi håber at du vil finde dig godt tilrette på kurset og at du vil få mange gode og konkrete ting med dig herfra. Du kan være sikker

Læs mere

Mønstre en indføring i analyse-, design- og arkitekturmønstre

Mønstre en indføring i analyse-, design- og arkitekturmønstre Mønstre en indføring i analyse-, design- og arkitekturmønstre COT/4-07-V2.2 C * O T Center for Revisionshistorie: 12.01.99 v.0 Første udgave 9.02.99 v.1.0 Anden udgave 27.04.99 v.2 Endelig version 10.05.99

Læs mere

Digitalt Fotoarkiv. tok@itu.dk Troels Krogh mads@danquah.dk Mads Danquah. Vejleder: panic@itu.dk Arne John Glenstrup. 27. maj 2004

Digitalt Fotoarkiv. tok@itu.dk Troels Krogh mads@danquah.dk Mads Danquah. Vejleder: panic@itu.dk Arne John Glenstrup. 27. maj 2004 Digitalt Fotoarkiv tok@itu.dk Troels Krogh mads@danquah.dk Mads Danquah Vejleder: panic@itu.dk Arne John Glenstrup 27. maj 2004 IT-Universitet i København Internet- og softwareteknologi 2 3 Abstract Rapporten

Læs mere