Grådige algoritmer. Et generelt algoritme-konstruktionsprincip ( paradigme ) for optimeringsproblemer.

Relaterede dokumenter
Grådige algoritmer. Et generelt algoritme-konstruktionsprincip ( paradigme ) for optimeringsproblemer.

Grådige algoritmer. Et algoritme-konstruktionsprincip ( paradigme ) for optimeringsproblemer.

Grådige algoritmer. Et generelt algoritme-konstruktionsprincip ( paradigme ) for optimeringsproblemer.

Et generelt algoritme-konstruktionsprincip ( paradigme ) for optimeringsproblemer. Ideen er simpel:

Prioritetskøer og hobe. Philip Bille

Sortering. Eksempel: De n tal i sorteret orden

Minimum udspændende Træer (MST)

Sammenhængskomponenter i grafer

Sortering. Eksempel: De n tal i sorteret orden

Sortering. De n tal i sorteret orden. Eksempel: Kommentarer:

Sortering af information er en fundamental og central opgave.

Prioritetskøer. Prioritetskøer Træer og hobe Repræsentation af hobe Algoritmer på hobe Hobkonstruktion Hobsortering. Philip Bille

Sortering af information er en fundamental og central opgave.

Datastrukturer (recap)

Invarianter. Invariant: Et forhold, som vedligeholdes af algoritmen gennem (dele af) dens udførelse. Udgør ofte kernen af ideen bag algoritmen.

Prioritetskøer. Prioritetskøer. Prioritetskøer. Prioritetskøer

Prioritetskøer. Prioritetskøer. Prioritetskøer. Prioritetskøer

Datastrukturer (recap)

DM507 Algoritmer og datastrukturer

Korteste veje i vægtede grafer. Længde af sti = sum af vægte af kanter på sti.

Danmarks Tekniske Universitet

Korteste veje i vægtede grafer. Længde af sti = sum af vægte af kanter på sti.

Datastrukturer (recap) Datastruktur = data + operationer herpå

Danmarks Tekniske Universitet

DM507 Algoritmer og datastrukturer

DM507 Algoritmer og datastrukturer

Binære søgetræer. Binære søgetræer. Nærmeste naboer. Nærmeste nabo

Danmarks Tekniske Universitet

Danmarks Tekniske Universitet

Mindste udspændende træ. Mindste udspændende træ. Introduktion. Introduktion

Dynamisk programmering

Skriftlig Eksamen Algoritmer og Datastrukturer (DM507)

DM507 Algoritmer og datastrukturer

Binære søgetræer. Nærmeste naboer Binære søgetræer Indsættelse Predecessor og successor Sletning Trægennemløb. Philip Bille

Algoritmeanalyse. Øvre grænse for algoritme. Øvre grænse for problem. Nedre grænse for problem. Identificer essentiel(le) operation(er)

Danmarks Tekniske Universitet

Skriftlig Eksamen DM507 Algoritmer og Datastrukturer

22 Hobe. Noter. PS1 -- Hobe. Binære hobe. Minimum-hob og maximum-hob. Den abstrakte datatype minimum-hob. Opbygning af hobe. Operationen siv-ned.

Algoritmer og invarianter

Definition : Et træ er en sammenhængende ikke-orienteret graf uden simple kredse. Sætning : En ikke-orienteret graf er et træ hvis og kun hvis der er

Korteste veje i vægtede grafer. Længde af sti = sum af vægte af kanter på sti.

Skriftlig Eksamen DM507 Algoritmer og Datastrukturer

Dynamisk programmering

Danmarks Tekniske Universitet

Grafer og graf-gennemløb

Minimum udspændende Træer (MST)

Mindste udspændende træ. Mindste udspændende træ. Introduktion. Introduktion

Danmarks Tekniske Universitet

Mindste udspændende træ

Forén og find. Introduktion Hurtig find Hurtig forening Vægtet forening Stikompression Dynamiske sammenhængskomponenter.

Danmarks Tekniske Universitet

Danmarks Tekniske Universitet

Grafer og graf-gennemløb

DM507 Algoritmer og datastrukturer

Danmarks Tekniske Universitet

Forén og find. Introduktion Hurtig find Hurtig forening Vægtet forening Stikompression Dynamiske sammenhængskomponenter.

Opskriv følgende funktioner efter stigende orden med hensyn til O-notationen: n 3/2. n logn (3/2) n. 2 3logn (3/2) n

Danmarks Tekniske Universitet

Minimum udspændende Træer (MST)

Binære søgetræer. Binære søgetræer. Nærmeste naboer. Nærmeste nabo

Skriftlig Eksamen Algoritmer og Datastrukturer (DM507)

Grafer og graf-gennemløb

Grafer og graf-gennemløb

Divide-and-Conquer algoritmer

Divide-and-Conquer algoritmer

Danmarks Tekniske Universitet

Danmarks Tekniske Universitet

Danmarks Tekniske Universitet

Dynamisk programmering

Danmarks Tekniske Universitet

INSTITUT FOR DATALOGI, AARHUS UNIVERSITET EKSAMEN. Grundkurser i Datalogi. Algoritmer og Datastrukturer 1 (2003-ordning)

Algoritmer og datastrukturer Course No Cheat Sheet May 15, 2012

Sortering i lineær tid

Opskriv følgende funktioner efter stigende orden med hensyn til O-notationen: (logn) 2 2 n 1/n (logn) n. n 2

Divide-and-Conquer algoritmer

DM13-1. Obligatorisk opgave E.05. Jacob Aae Mikkelsen

Grafer og graf-gennemløb

DM507 Algoritmer og datastrukturer

Intervalsøgning. Algoritmisk geometri. Motivation for intervaltræer. Intervalsøgning. Lad der være givet en database over ansatte i en virksomhed

Korteste veje. Introduktion Egenskaber for korteste veje Dijkstras algoritme Korteste veje på DAGs. Philip Bille

Algoritmisk geometri

Korteste veje. Introduktion Egenskaber for korteste veje Dijkstras algoritme Korteste veje på DAGs. Philip Bille

Opskriv følgende funktioner efter stigende orden med hensyn til O-notationen: 23n log n. 4 n (log n) log n

DM507 Algoritmer og datastrukturer

Divide-and-Conquer algoritmer

Opskriv følgende funktioner efter stigende orden med hensyn til O-notationen: n 2 n (log n) 2. 3 n /n 2 n + (log n) 4

Skriftlig Eksamen Algoritmer og Datastrukturer (dads)

Danmarks Tekniske Universitet

Opskriv følgende funktioner efter stigende orden med hensyn til O-notationen: n 7 n 1 7 7/n. 7nlogn. 7n 7nlogn n7

DATALOGISK INSTITUT, AARHUS UNIVERSITET. Det Naturvidenskabelige Fakultet EKSAMEN. Grundkurser i Datalogi

Opskriv følgende funktioner efter stigende orden med hensyn til O-notationen: 4 n n 3n n 2 /logn 5 n n (logn) 3n n 2 /logn 4 n n 5 n

DM507 Algoritmer og datastrukturer

Skriftlig Eksamen Algoritmer og Datastrukturer (dads)

Dynamisk programmering. Flere eksempler

INSTITUT FOR DATALOGI, AARHUS UNIVERSITET. Det Naturvidenskabelige Fakultet EKSAMEN. Grundkurser i Datalogi

DM507 Algoritmer og datastrukturer

Bevisteknikker. Bevisteknikker (relevant både ved design og verifikation) Matematisk induktion. Matematisk induktion uformel beskrivelse

Mindste udspændende træ

Dynamisk programmering. Flere eksempler

Opskriv følgende funktioner efter stigende orden med hensyn til O-notationen: (logn) 7 n 1/2 2 n /n 3 2logn n 2 /logn

Transkript:

Grådige algoritmer

Grådige algoritmer Et generelt algoritme-konstruktionsprincip ( paradigme ) for optimeringsproblemer.

Grådige algoritmer Et generelt algoritme-konstruktionsprincip ( paradigme ) for optimeringsproblemer. Ideen er simpel: Opbyg løsningen bid for bid ved hele tiden af vælge hvad der lige nu ser ud som bedste valg (uden at tænke på resten af løsningen). Dvs. man håber på at lokal optimering giver global optimering.

Grådige algoritmer Et generelt algoritme-konstruktionsprincip ( paradigme ) for optimeringsproblemer. Ideen er simpel: Opbyg løsningen bid for bid ved hele tiden af vælge hvad der lige nu ser ud som bedste valg (uden at tænke på resten af løsningen). Dvs. man håber på at lokal optimering giver global optimering. Mere præcist kræver metoden en definition af bedste valg (også kaldet grådig valg ), samt et bevis for gentagen brug af dette ender med en optimal løsning.

Grådige algoritmer Et generelt algoritme-konstruktionsprincip ( paradigme ) for optimeringsproblemer. Ideen er simpel: Opbyg løsningen bid for bid ved hele tiden af vælge hvad der lige nu ser ud som bedste valg (uden at tænke på resten af løsningen). Dvs. man håber på at lokal optimering giver global optimering. Mere præcist kræver metoden en definition af bedste valg (også kaldet grådig valg ), samt et bevis for gentagen brug af dette ender med en optimal løsning. Mange grådige algoritmer kan forklares som specialtilfælde af begrebet Matroide (afsnit 16.4, ikke pensum), men vi vil nøjes med at tænke på grådige algoritmer som et løst princip, hvor bedste valg og korrekthedsbevis skal opfindes individuelt fra problem til problem.

Eksempel: et simpelt skeduleringsproblem Input: en samling aktiviteter, hver med en starttid og sluttid. Output: en størst mulig mængde af ikke-overlappende aktivititer.

Eksempel: et simpelt skeduleringsproblem Input: en samling aktiviteter, hver med en starttid og sluttid. Output: en størst mulig mængde af ikke-overlappende aktivititer. Grådigt forslag: Sorter aktiviteter efter stigende sluttid For hver aktivitet a taget i den rækkefølge: If a overlapper allerede valgte aktiviteter: Skip a Else Vælg a... Tid

Analyse Bevis for korrekthed: Flg. invariant vedligeholdes: Lad s være sluttiden for aktiviteten testet i sidst udførte iteration af for-løkken (og lad s = før første iteration). Der findes en optimal løsning, hvis aktiviteter med sluttid s netop er de af algoritmen indtil nu valgte aktiviteter.

Analyse Bevis for korrekthed: Flg. invariant vedligeholdes: Lad s være sluttiden for aktiviteten testet i sidst udførte iteration af for-løkken (og lad s = før første iteration). Der findes en optimal løsning, hvis aktiviteter med sluttid s netop er de af algoritmen indtil nu valgte aktiviteter. Bevis (induktion): Basis: Klart før første iteration af for-løkken (for enhver optimal løsning er aktiviteterne med sluttid de samme som de af algoritmen indtil nu valgte aktiviteter, nemlig ingen).

Analyse Bevis (induktion): Skridt: Hvis udsagnet gælder før en iteration, gælder det også efter: Lad X være den optimale løsning fra induktionsudsagnet før iterationen. If-case: Her overlapper den næste aktivitet a de allerede passerede aktiviteter fra X, så dennne aktivitet kan ikke være en del af X. Da algoritmen ikke vælger a, kan X (gen)bruges i induktionsudsagnet efter iterationen. Else-case: Lad a være den aktivitet i resten af X, som har mindst sluttid. Det er nemt at se, at man kan udskifte a med den af algoritmen valgte a uden at få overlap med andre i X. Da dette ikke ændrer antal aktiviteter i X, er den stadig optimal, og kan bruges i induktionsudsagnet efter iterationen.

Analyse Bevis (induktion): Køretid: Skridt: Hvis udsagnet gælder før en iteration, gælder det også efter: Lad X være den optimale løsning fra induktionsudsagnet før iterationen. If-case: Her overlapper den næste aktivitet a de allerede passerede aktiviteter fra X, så dennne aktivitet kan ikke være en del af X. Da algoritmen ikke vælger a, kan X (gen)bruges i induktionsudsagnet efter iterationen. Else-case: Lad a være den aktivitet i resten af X, som har mindst sluttid. Det er nemt at se, at man kan udskifte a med den af algoritmen valgte a uden at få overlap med andre i X. Da dette ikke ændrer antal aktiviteter i X, er den stadig optimal, og kan bruges i induktionsudsagnet efter iterationen.

Analyse Bevis (induktion): Skridt: Hvis udsagnet gælder før en iteration, gælder det også efter: Lad X være den optimale løsning fra induktionsudsagnet før iterationen. Køretid: Sortering + O(n). If-case: Her overlapper den næste aktivitet a de allerede passerede aktiviteter fra X, så dennne aktivitet kan ikke være en del af X. Da algoritmen ikke vælger a, kan X (gen)bruges i induktionsudsagnet efter iterationen. Else-case: Lad a være den aktivitet i resten af X, som har mindst sluttid. Det er nemt at se, at man kan udskifte a med den af algoritmen valgte a uden at få overlap med andre i X. Da dette ikke ændrer antal aktiviteter i X, er den stadig optimal, og kan bruges i induktionsudsagnet efter iterationen.

Rygsæksproblemet Rygsæk som kan bære W kg. Ting med værdi og vægt. Ting nr. i 1 2 3 4 5 6 7 Vægt w i 4 6 2 15 7 4 5 Værdi v i 45 32 12 50 23 9 15

Rygsæksproblemet Rygsæk som kan bære W kg. Ting med værdi og vægt. Ting nr. i 1 2 3 4 5 6 7 Vægt w i 4 6 2 15 7 4 5 Værdi v i 45 32 12 50 23 9 15 Mål: tag mest mulig værdi med uden at overskride vægtgrænsen.

Rygsæksproblemet Fractional version af problemet (dele af ting kan medtages i rygsækken) kan løses med en grådig algoritme: vælg tingene efter aftagende nytte = værdi/vægt. Et simplet udskiftningsargument viser, at den optimale løsning kun kan være som den af algoritmen valgte.

Rygsæksproblemet Fractional version af problemet (dele af ting kan medtages i rygsækken) kan løses med en grådig algoritme: vælg tingene efter aftagende nytte = værdi/vægt. Et simplet udskiftningsargument viser, at den optimale løsning kun kan være som den af algoritmen valgte. NB: Denne grådige algoritme virker IKKE for 0-1 versionen af problemet (hvor kun hele ting kan medtages):

Rygsæksproblemet Fractional version af problemet (dele af ting kan medtages i rygsækken) kan løses med en grådig algoritme: vælg tingene efter aftagende nytte = værdi/vægt. Et simplet udskiftningsargument viser, at den optimale løsning kun kan være som den af algoritmen valgte. NB: Denne grådige algoritme virker IKKE for 0-1 versionen af problemet (hvor kun hele ting kan medtages):

Rygsæksproblemet Fractional version af problemet (dele af ting kan medtages i rygsækken) kan løses med en grådig algoritme: vælg tingene efter aftagende nytte = værdi/vægt. Et simplet udskiftningsargument viser, at den optimale løsning kun kan være som den af algoritmen valgte. NB: Denne grådige algoritme virker IKKE for 0-1 versionen af problemet (hvor kun hele ting kan medtages): Eksempel på at grådige valg ikke bare kan antages at virke for alle problemer (lokal optimering giver ikke altid global optimering).

Huffman-koder Kodning af sekvens af tegn (fil) via binære koder (for at gemme på disk, sende over netværk,... ). Ønsker kortest mulig fil (kompression).

Huffman-koder Kodning af sekvens af tegn (fil) via binære koder (for at gemme på disk, sende over netværk,... ). Ønsker kortest mulig fil (kompression). Eksempel:

Huffman-koder Kodning af sekvens af tegn (fil) via binære koder (for at gemme på disk, sende over netværk,... ). Ønsker kortest mulig fil (kompression). Eksempel: Fixed-length version: 3 (45.000 + 13.000 + + 5.000) = 300.000 bits Variable-length version: 1 45.000 + 3 13.000 + + 4 5.000 = 224.000 bits

Prefix-kode = træer Kodeord = sti i binært træ: 0 gå til venstre, 1 gå til højre Prefix(-fri) kode: ingen kode for et tegn er starten (prefix) af koden for et andet tegn ( dekodning utvetydig). Så tegn svarer til knuder med nul børn (blade).

Prefix-kode = træer Kodeord = sti i binært træ: 0 gå til venstre, 1 gå til højre Prefix(-fri) kode: ingen kode for et tegn er starten (prefix) af koden for et andet tegn ( dekodning utvetydig). Så tegn svarer til knuder med nul børn (blade). For en givet fil (tegn og deres frekvenser), find bedste variable-length prefix-kode. Dvs. for Cost(tree) = kodet fil, find træ med lavest cost.

Prefix-kode = træer Kodeord = sti i binært træ: 0 gå til venstre, 1 gå til højre Prefix(-fri) kode: ingen kode for et tegn er starten (prefix) af koden for et andet tegn ( dekodning utvetydig). Så tegn svarer til knuder med nul børn (blade). For en givet fil (tegn og deres frekvenser), find bedste variable-length prefix-kode. Dvs. for Cost(tree) = kodet fil, find træ med lavest cost. Optimale træer kan ikke have knuder med kun ét barn (alle tegn i undertræet for en sådan knude kan forkortes med en bit, jvf. (a) ovenfor). Så kun knuder med to eller nul børn findes.

Huffmans algoritme Byg op nedefra (fra mindste til største frekvenser) ved hele tiden at lave flg. grådige valg : slå de to deltræer med de to mindste samlede frekvenser sammen:

Køretid Givet en en tabel med n tegn og deres frekvenser laver Huffmans algoritme n 1 iterationer. (Der er n træer til start, ét træ til slut, og hver iteration mindsker antallet med præcis én.)

Køretid Givet en en tabel med n tegn og deres frekvenser laver Huffmans algoritme n 1 iterationer. (Der er n træer til start, ét træ til slut, og hver iteration mindsker antallet med præcis én.) Ved at bruge en (min-)prioritetskø, f.eks. implementeret ved en heap, kan hver iteration udføres med: to ExtractMin-operationer én Insert-operation O(1) andet arbejde.

Køretid Givet en en tabel med n tegn og deres frekvenser laver Huffmans algoritme n 1 iterationer. (Der er n træer til start, ét træ til slut, og hver iteration mindsker antallet med præcis én.) Ved at bruge en (min-)prioritetskø, f.eks. implementeret ved en heap, kan hver iteration udføres med: to ExtractMin-operationer én Insert-operation O(1) andet arbejde. Hver prioritetskø-operation tager hver O(log n) tid.

Køretid Givet en en tabel med n tegn og deres frekvenser laver Huffmans algoritme n 1 iterationer. (Der er n træer til start, ét træ til slut, og hver iteration mindsker antallet med præcis én.) Ved at bruge en (min-)prioritetskø, f.eks. implementeret ved en heap, kan hver iteration udføres med: to ExtractMin-operationer én Insert-operation O(1) andet arbejde. Hver prioritetskø-operation tager hver O(log n) tid. Så samlet køretid for de n iterationer er O(n log n).

Korrekthed Huffman algoritme slår i første skridt de to mindste tegn sammen. Mere præcist: For en eller anden nummerering c 1, c 2, c 3,..., c n af tegnene i inputalfabetet, for hvilken der gælder at de tilsvarende frekvenser er ikke-faldende f 1 f 2 f 3 f n, slår Huffmans algoritme tegn c 1 og c 2 sammen. Denne formulering dækker alle mulige valg af de to mindste tegn, også for input såsom disse tre: Tegn a b c d e f g Frekvens 7 3 6 3 3 7 5 Frekvens 7 3 6 5 7 5 5 Frekvens 3 3 3 3 3 3 3

Korrekthed Eksempel: Hvis input er Tegn a b c d e f g Frekvens 7 3 6 3 3 7 5 er følgende rækkefølger (samt en del yderligere) alle mulige: Tegn b d e g c f a Frekvens 3 3 3 5 6 7 7 Tegn e d b g c f a Frekvens 3 3 3 5 6 7 7 Tegn e d b g c a f Frekvens 3 3 3 5 6 7 7 Huffman vælger én af dem, og slår de to første tegn sammen.

Korrekthed Lemma: For ethvert input (n 2) med Tegn c 1 c 2 c 3... c n Frekvens f 1 f 2 f 3... f n f 1 f 2 f 3 f n, findes et optimalt træ hvor bladene for tegnene c 1 og c 2 er søskende.

Korrekthed Lemma: For ethvert input (n 2) med Tegn c 1 c 2 c 3... c n Frekvens f 1 f 2 f 3... f n f 1 f 2 f 3 f n, findes et optimalt træ hvor bladene for tegnene c 1 og c 2 er søskende. Bevis: Lad T være et optimalt træ. Se på et blad af størst dybde i T. Da n 2, har bladet en forælder. Denne forælder har mere end nul undertræer, altså har den to (i optimale træer har ingen knuder ét undertræ, se tidligere). Dens andet undertræ må være blot et blad, ellers er det første blad ikke et dybeste blad.

Korrekthed Lemma: For ethvert input (n 2) med Tegn c 1 c 2 c 3... c n Frekvens f 1 f 2 f 3... f n f 1 f 2 f 3 f n, findes et optimalt træ hvor bladene for tegnene c 1 og c 2 er søskende. Bevis: Lad T være et optimalt træ. Se på et blad af størst dybde i T. Da n 2, har bladet en forælder. Denne forælder har mere end nul undertræer, altså har den to (i optimale træer har ingen knuder ét undertræ, se tidligere). Dens andet undertræ må være blot et blad, ellers er det første blad ikke et dybeste blad. Altså findes to blade som er søskende og begge er af størst dybde. Lad deres tegn være c i og c j, med i < j.

Korrekthed Mulige situationer: c 1 c 2 c 3... Handling: c i c j Ingen c i c j Byt c 2 og c j c i c j Byt c 1 og c j c i c j Byt c 1 og c i, samt c 2 og c j

Korrekthed Mulige situationer: c 1 c 2 c 3... Handling: c i c j Ingen c i c j Byt c 2 og c j c i c j Byt c 1 og c j c i c j Byt c 1 og c i, samt c 2 og c j c 1 c 2 d c 2 c i c i c j c 1 c j

Korrekthed Mulige situationer: c 1 c 2 c 3... Handling: c i c j Ingen c i c j Byt c 2 og c j c i c j Byt c 1 og c j c i c j Byt c 1 og c i, samt c 2 og c j c 1 c 2 d c 2 c i c i c j c 1 c j Lad d være c i s blads dybde minus c 1 s blads dybde. Da er ændringen af filens længde ved byt af c 1 og c i lig d f 1 d f i = d (f 1 f i ).

Korrekthed Mulige situationer: c 1 c 2 c 3... Handling: c i c j Ingen c i c j Byt c 2 og c j c i c j Byt c 1 og c j c i c j Byt c 1 og c i, samt c 2 og c j c 1 c 2 d c 2 c i c i c j c 1 c j Lad d være c i s blads dybde minus c 1 s blads dybde. Da er ændringen af filens længde ved byt af c 1 og c i lig d f 1 d f i = d (f 1 f i ). Eftersom d 0 (da c i s blad var af størst dybde) og f 1 f i 0 (da i 1, se tabel ovenfor), kan filens længde ikke blive større. Dvs. træet kan ikke blive dårlige ved byt af c 1 og c i.

Korrekthed Mulige situationer: c 1 c 2 c 3... Handling: c i c j Ingen c i c j Byt c 2 og c j c i c j Byt c 1 og c j c i c j Byt c 1 og c i, samt c 2 og c j c 1 c 2 d c 2 c i c i c j c 1 c j Lad d være c i s blads dybde minus c 1 s blads dybde. Da er ændringen af filens længde ved byt af c 1 og c i lig d f 1 d f i = d (f 1 f i ). Eftersom d 0 (da c i s blad var af størst dybde) og f 1 f i 0 (da i 1, se tabel ovenfor), kan filens længde ikke blive større. Dvs. træet kan ikke blive dårlige ved byt af c 1 og c i. Tilsvarende kan vises for et byt af c 1 og c j, og for et byt af c 2 og c j.

Korrekthed Mulige situationer: c 1 c 2 c 3... Handling: c i c j Ingen c i c j Byt c 2 og c j c i c j Byt c 1 og c j c i c j Byt c 1 og c i, samt c 2 og c j c 1 c 2 d c 2 c i c i c j c 1 c j Lad d være c i s blads dybde minus c 1 s blads dybde. Da er ændringen af filens længde ved byt af c 1 og c i lig d f 1 d f i = d (f 1 f i ). Eftersom d 0 (da c i s blad var af størst dybde) og f 1 f i 0 (da i 1, se tabel ovenfor), kan filens længde ikke blive større. Dvs. træet kan ikke blive dårlige ved byt af c 1 og c i. Tilsvarende kan vises for et byt af c 1 og c j, og for et byt af c 2 og c j. Da træet var optimalt før byt, er det også efter. Og c 1 og c 2 er nu søskende.

Korrekthed Sætning: Huffmans algoritme returnerer et optimalt træ.

Korrekthed Sætning: Huffmans algoritme returnerer et optimalt træ. Bevis: Vi vil vise via induktion at det gælder for input med n tegn, for alle n 2.

Korrekthed Sætning: Huffmans algoritme returnerer et optimalt træ. Bevis: Vi vil vise via induktion at det gælder for input med n tegn, for alle n 2. Basis n = 2: Da knuder i optimale træer enten har to eller nul børn, er der præcis ét træ for n = 2 (en rod og to blade), hvilket dermed er det optimale træ. Det er netop træet returneret af Huffmans algoritme når n = 2.

Korrekthed Sætning: Huffmans algoritme returnerer et optimalt træ. Bevis: Vi vil vise via induktion at det gælder for input med n tegn, for alle n 2. Basis n = 2: Da knuder i optimale træer enten har to eller nul børn, er der præcis ét træ for n = 2 (en rod og to blade), hvilket dermed er det optimale træ. Det er netop træet returneret af Huffmans algoritme når n = 2. Induktionsskridtet n > 2: Lad input I være og se på input I Tegn c 1 c 2 c 3... c n Frekvens f 1 f 2 f 3... f n med f 1 f 2 f 3 f n, Tegn z c 3... c n Frekvens f 1 + f 2 f 3... f n

Korrekthed Lad T være Huffmans output på input I. Lad T være Huffmans output på input I (optimalt træ pr. induktionsantagelse, da antal tegn i dette input er n 1). Lad T være et optimalt træ på input I hvor bladene for tegnene c 1 og c 2 er søskende (et sådant optimalt træ eksisterer iflg. lemma). Lad T være T hvor bladene for tegnene c 1 og c 2 samt deres forælder er erstattet af bladet z (med frekvens f 1 + f 2 ).

Korrekthed Lad T være Huffmans output på input I. Lad T være Huffmans output på input I (optimalt træ pr. induktionsantagelse, da antal tegn i dette input er n 1). Lad T være et optimalt træ på input I hvor bladene for tegnene c 1 og c 2 er søskende (et sådant optimalt træ eksisterer iflg. lemma). Lad T være T hvor bladene for tegnene c 1 og c 2 samt deres forælder er erstattet af bladet z (med frekvens f 1 + f 2 ). For et træ τ for input I, lad Expand(τ) være τ med bladet med tegnet z erstattet af et træ med en rod og to blade med tegnene c 1 og c 2.

Korrekthed Lad T være Huffmans output på input I. Lad T være Huffmans output på input I (optimalt træ pr. induktionsantagelse, da antal tegn i dette input er n 1). Lad T være et optimalt træ på input I hvor bladene for tegnene c 1 og c 2 er søskende (et sådant optimalt træ eksisterer iflg. lemma). Lad T være T hvor bladene for tegnene c 1 og c 2 samt deres forælder er erstattet af bladet z (med frekvens f 1 + f 2 ). For et træ τ for input I, lad Expand(τ) være τ med bladet med tegnet z erstattet af et træ med en rod og to blade med tegnene c 1 og c 2. T = Expand(T ) (pga. definition af T ). Cost(Expand(τ)) = Cost(τ) + f 1 + f 2 (koder for c 1 og c 2 forlænges med én). T = Expand(T ) (pga. Huffman-algoritmens virkemåde).

Korrekthed Lad T være Huffmans output på input I. Lad T være Huffmans output på input I (optimalt træ pr. induktionsantagelse, da antal tegn i dette input er n 1). Lad T være et optimalt træ på input I hvor bladene for tegnene c 1 og c 2 er søskende (et sådant optimalt træ eksisterer iflg. lemma). Lad T være T hvor bladene for tegnene c 1 og c 2 samt deres forælder er erstattet af bladet z (med frekvens f 1 + f 2 ). For et træ τ for input I, lad Expand(τ) være τ med bladet med tegnet z erstattet af et træ med en rod og to blade med tegnene c 1 og c 2. T = Expand(T ) (pga. definition af T ). Cost(Expand(τ)) = Cost(τ) + f 1 + f 2 (koder for c 1 og c 2 forlænges med én). T = Expand(T ) (pga. Huffman-algoritmens virkemåde). Cost(T ) Cost(T ) = Cost(Expand(T )) = Cost(T ) + f 1 + f 2 Cost(T ) + f 1 + f 2 = Cost(Expand(T )) = Cost(T ).

Illustration Input: I Input: I T Expand Contract T Expand T T Contract Contract(τ) er her det omvendte af Expand() [kun mulig når c 1 og c 2 er søskende i τ]. Argument igen: Cost(T ) Cost(T ) = Cost(Expand(T )) = Cost(T ) + f 1 + f 2 Cost(T ) + f 1 + f 2 = Cost(Expand(T )) = Cost(T ). Så Cost(T ) = Cost(T ), hvilket beviser at Huffman leverer et optimalt træ for input I.