Skriftlig prøve, den 6. december 20. Kursus navn: Billedanalyse, vision og computer grafik. Tilladte hjælpemidler: Alle hjælpemidler er tilladt. Varighed: Vægtning: 4 timer Alle opgaver vægtes ligeligt. NAVN :.................................................. Underskrift :.................................................. Bord nr. :.................................................. Ogave 2 3 4 5 6 7 8 9 0 2 3 4 5 Svar Opgave 6 7 8 9 20 2 22 23 24 25 Svar Svarmulighederne for hvert spørgsmål er nummereret fra til 6. For hvert spørgsmål skal nummeret på den valgte svarmulighed indføres i skemaet ovenfor. Indføres et forkert nummer i skemaet kan dette rettes ved at "sværte" det forkerte nummer over og anføre det rigtige nummer nedenunder. Er der tvivl om meningen med en rettelse, betragtes spørgsmålet som ubesvaret. KUN FORSIDEN SKAL AFLEVERES. Afleveres blankt eller forlades eksamen i utide, skal forsiden alligevel afleveres. Kladde, mellemregninger og bemærkninger tillægges ingen betydning, kun tallene indført ovenfor registreres. Det gives 5 points for et korrekt svar og - for et ukorrekt svar. Ubesvarede spørgsmål eller et 6 -tal (svarende til "ved ikke" ) giver 0 points. Det antal points, der kræves for, at et sæt anses for tilfredsstillende besvaret, afgøres endeligt ved censureringen af sættene. Husk at forsyne opgaveteksten med navn, underskrift og bord nummer.
2 OPGAVE. Et givet billede består af én kant. Den til billedet tilhørende Hough transformation ser ud som vist i figuren, og har maksimum i r=50 og θ=-45 grader. Hvad er linjen i billedet svarende til dette maksimum i Hough transformationen? Linjen er givet i homogene koordinater.. [45 45 50] 2. [ 0-50] 3. [0.7854 0.7854 45] 4. [0.707-0.707-50] 5. [0.6428 0.7660 50]
3 OPGAVE.2 Dybden i et billede måles for hver pixel angivet som afstanden fra kameraet til punktet svarende til hver pixel. Dybde-informatonen skal kodes med en tabsfri kode af hensyn til de efterfølgende beregninger. Der vælges en differentiel kodning (DPCM). Vi betragter nu DPCM kodning af dybde-informationen kodet som et billede, f, med 8 bits per pixel. For hver pixel prædikteres en værdi, f (i,j), baseret på de forudgående værdier. Differencen efter prædiktion er givet ved d(i,j) = f(i,j) - f (i,j). Lad nu d betegne d(i,j) for en given pixel i position (i,j). Værdierne af d kodes ved hjælp af nogle symboler, s. Da værdien d = 0 er meget hyppig og ofte efterfølges af endnu et 0, indføres et symbol for to 0 er, s = 0;0 samt et symbol for d=0 efterfulgt af en anden værdi, s= 0;esc. Hændelserne d = og d = - kodes med s =. Hændelserne d = 2 og d = -2 med s = 2. (For s = og s = 2 kodes fortegnet efterfølgende med en bit, men det ses der bort fra i denne opgave.) For d > 2 kodes en escape karakter, esc. De mulige værdier af s og tilhørerende sandsynligheder, P(s), er givet i tabellen sammmen med fem forslag til binære koder for s. Der skal vælges en optimal binær kode til kodning af s. s P(s) Kode Kode 2 Kode 3 Kode 4 Kode 5 0;0 /2 00 0 00 000 0 0;esc /4 0 0 0 00 00 /8 0 0 0 00 0 2 /6 0 0 0 0 0 esc /6 00 Hvilken kode giver den mindste gennemsnitlige kodelængde, samtidig med at koden giver entydig dekodning? (Hint: Den optimale kode er en Huffman kode.). Kode 2. Kode 2 3. Kode 3 4. Kode 4 5. Kode 5
4 OPGAVE.3 I et klassifikationsproblem med 5 populationer måles en todimensional feature vektor. Fordelingerne er givet ved. N 3, 0 0 2. N 3, 0 3. N 3, 0 4. N 3, 0 5. N 3, 0 Vink: den inverse matrix til 3 er 2 3 2 2 2. Tabsfunktionen er symmetrisk og a priori sandsynlighederne er ens. Hvilken af de fem populationer vil observationen klassificeres som, når der anvendes en Bayes classifier?. Population 2. Population 2 3. Population 3 4. Population 4 5. Population 5
5 OPGAVE.4 Herunder er vist to billeder af en kasse (kubus) Billedet til venstre er tegnet med følgende TOGL program: Perspective 30 00 LookAt 45 36 30 0 0 0 0 0 Scale 0 0 0 Box For at opnå billedet til højre skal man a) Øge field of view angle b) Reducere field of view angle c) Flytte kameraet nærmere kassen d) Flytte kameraet længere væk Hvilke af ovenstående handlinger eller kombination af handlinger er påkrævede for at opnå billedet til højre:. a og d 2. a og c 3. c 4. det er ikke muligt at opnå billedet med disse handlinger. 5. b og c.
6 OPGAVE.5 Der er givet et sæt punkter i 2D, hvortil der skal estimeres en linje ved hjælp af Ransac. Følgende linje hypotese, l, er genereret i homogene koordinater: l = [7.07 7.07 200.0000] Hvilke a følgende 4 punkter a. (-28.3, 0.5) b. ( 0.5, -28.3) c. ( -4., -4.) d. ( -23, -40) er outlier(s) i forhold denne hypotese, l, givet at tærskel værdien er, at de skal have en afstand på mindre end én?. a og b 2. a, b og d 3. c 4. c og d 5. d
7 OPGAVE.6 Om to kameraer oplyses det, at den fundamentale matrice er givet ved I forbindelse med billedtracking skal korrespondencen til 2D punktet q=[ 550 723]^T i billede findes i billede 2. Hvilke af følgende er mulige kandidater?. (430, 203) 2. (33.5, 250) 3. (203, 430) 4. (500.5, 0) 5. (34, 705.5)
8 OPGAVE.7 I nedenstående tabel er angivet cumulative model histogram for en ønsket gråtonefordeling og det faktiske cumulative histogram for et inputbillede. Hvilken pixelværdi afbildes 0.6 i ved en histogram matching af inputbilledet? Pixel value Cumulative model histogram Cumulative image histogram 0.0 0.0 0.00 0. 0. 0.05 0.2 0.2 0.2 0.3 0.3 0.5 0.4 0.4 0.22 0.5 0.5 0.29 0.6 0.6 0.37 0.7 0.7 0.7 0.8 0.8 0.89 0.9 0.9 0.95.0.0.00. 0.4 2. 0.5 3. 0.6 4. 0.7 5. 0.8
9 OPGAVE.8 To kamera er, P og P2, kan beskrives ved følgende pinhole kamera model (Bemærk at den eneste forskel mellem matricerne er fortegnet på 4000): Et 3D punkt, Q, er observeret i (300, 350) i billede og i (300,550) i billede 2. Hvad er koordinaterne af 3D punktet Q?. (2 0 20) 2. (2 0 0) 3. (300 550 350) 4. (0 2 40) 5. (0 4000 0)
0 OPGAVE.9 Lad der være givet en trekant i homogene 3D koordinater med hjørnerne p0 = [0,0,-,], p = [,0,-,], p2 = [0,,-,]. Til hvert hjørne er der knyttet en teksturkoordinat [u 0,v 0 ] = [0,0], [u,v ]=[0.5,0], [u 2,v 2 ]=[0,0.5]. Vi har en projektionsmatrix M givet ved Vi husker at man projicerer et punkt ved at gange på projektionsmatricen fra højre og dernæst dividere med den resulterende vektor med sin egen w koordinat (3. koordinat). Hjørnerne i trekanten projiceres ved hjælp af matricen M. Dernæst udregnes trekantens barycentriske koordinater for en pixel med centrum i [0.5, 0.5]. Med de barycentriske koordinater interpoleres teksturkoordinaterne (uden perspektivkorrektion). Vi får endeligt en farve ved at benytte funktionen T(u,v) = (max(0, sin(0uπ )sin(0vπ))) 0.25 på de interpolerede teksturkoordinater. Farven er altså blot et tal. Hvad er farven?. 0 2. 0.5 3. 0.6666667 4. 0.25 5.
OPGAVE.0 Hvilket af følgende LSI filtre fremhæver mest specifikt tynde vandrette linier?. -2-2 4-2 -2 2. 3. 4. - 2-2 4 2-2 - - 0-2 0 2-0 - -2-2 4 2 - -2-5. -2 4-4 4-2
2 OPGAVE. På mængden af sorte pixels i ovenstående billede udføres den morfologiske operation X A B X B, hvor (((( ) ) ) ) X A= * 0 * 0 * 0 * B er et 3x3 struktur element med origo i midten. Omkring randen af billedet antages der at være hvide pixels. Hvor mange sorte pixels er der i resultatbilledet?. 2. 2 3. 3 4. 4 5. 5
3 OPGAVE.2 Det følgende spørgsmål omhandler dybdebufferen a) Hvis dybdebufferen ikke benyttes ser man for hver pixel blot den trekant, der sidst er tegnet og som dækkede den givne pixel. b) Depth fighting opstår, hvis man ikke bruger perspektivkorrekt interpolation. c) Near plane skal være så langt fra øjet som muligt, hvis vi skal undgå depth fighting. d) Perspektivkorrekt interpolation er ikke lineær i skærmkoordinater. Hvilke af ovenstående udsagn er sande?. a og c 2. b 3. alle 4. ingen 5. a,c og d
4 OPGAVE.3 Et Pinhole kamera, P=A[R t], er defineret ved (iflg. notationen i pensum): R lig enheds matricen. t=[0 0 0]^T Focal længden, f=00. Den optiske akse skærer billedplanet i (x,y)=(480,640) Derudover oplyses det, at pixelene i kameraet er retvinklet og kvadratiske, dvs. at α= og β=0. Hvortil projiceres 3D punktet Q=[0 0 5]^T?. (7200, 9600) 2. (9600,5) 3. (,0) 4. (480,640) 5. (0,0)
5 OPGAVE.4 Hvad er energien af en foton med bølgelængden 400 nm?. 9.76*0-6 J 2..88*0-8 J 3. 7.23*0-2 J 4. 3.4*0-24 J 5. 4.97*0-9 J
6 OPGAVE.5 Hvilken af nedenstående sorte objekter har den spatielle dispersionsmatrix 4 0 0 6?. 2. 3. 4. 5.
7 OPGAVE.6 Et kamera kan beskrives ved følgende pinhole kamera model Dette kamera ser på et plan med et lokalt koordinat system [A,B,C], således at et punkt i planets lokale koordinatsystem (x,y) har følgende globale 3D koordinat Q=Ax+By+C. Her er A=[ 0]^T B=[ - 0]^T C=[2 2 20]^T Hvilke af følgende matricer beskriver den homogene transformation fra planets lokale koordinat system til billedet?
8 OPGAVE.7 For nedenstående tekstur udregnes en cooccurrence matrix for forskydningen h=(0,2). 3 2 2 3 3 2 2 2 3 2 2 2 3 3 2 2 2 3 2 2 3 3 2 2 2 3 Cooccurrence matricen er. 2. 3. 4. 5. 2 3 6 2 4 2 5 3 2 3 0 2 3 2 4 6 2 3 2 3 2 3 2 3 3 5 2 2 2 3 3 3 4 2 0 2 3 7 0 2 4 3 2 3 4 2 2 3 2 2 4 2 3 5 2 3 2 3
9 OPGAVE.8 3 2 2 3 2 2 2 3 4 2 3 3 4 3 2 3 5 4 3 2 2 3 3 3 4 2 2 2 3 4 5 Hvilken værdi fås i den markerede pixel efter filtrering af ovenstående billede med det nedenstående 5x5 LSI filter? - - 0 - - - 0 2 0-0 2 4 2 0-0 2 0 - - - 0 - -. 5 2. 8 3. 20 4. 2 5. 24
20 OPGAVE.9 Et featuredetektionsfilter er kørt på et billede (f.eks R beregnet i forbindelse med Harris Corner Detector), med følgende resultat. På bagrund af dette skal features (f.eks. hjørner) findes ved at benytte et threshhold på 5, dvs. features skal have en værdi x for hvilket det gælder at x>5. Endvidere skal der anvendes non-maximum-supression med et fire naboskab. Hvor er der features (markeret med et x)?
2 OPGAVE.20 Hvilket af følgende udsagn er forkert?. Korrelation mellem billede stykker er invariant overfor rotation af billederne. 2. Man kan tilnærme et Laplace filter godt vha. forskellen mellem to Gauss filtre. 3. Non-maximum suppression indgår i Canny edge detection. 4. Histogram udregning er en del af SIFT descriptor algoritmen. 5. Det kan ofte være en fordel at regularisere med billedgeometri, når man udregner punktkorrespondencer mellem billedpar.
22 OPGAVE.2 Nedenstående billede er genereret med TOGL Herunder følger tre programmer Program : Perspective 30 00 LookAt 2 30 9 0 2 0 0 0 BeginList Segment Sphere Scale 5 Translate 0 0.5 0 Box EndList CallList Segment Translate 0 5 0 Rotate 60 0 0 CallList Segment { Translate -0.5 5 0 Rotate 60 0 0 Scale 0.5 0.5 0.5 CallList Segment } Translate 0.5 5 0 Rotate -60 0 0 Scale 0.5 0.5 0.5 CallList Segment Program 2: Perspective 30 00 LookAt 2 30 9 0 2 0 0 0 BeginList Segment { Sphere Scale 5 Translate 0 0.5 0 Box } EndList CallList Segment Translate 0 5 0 Rotate 60 0 0 CallList Segment { Translate -0.5 5 0 Rotate 60 0 0 Scale 0.5 0.5 0.5 CallList Segment } Translate 0.5 5 0 Rotate -60 0 0 Scale 0.5 0.5 0.5 CallList Segment Program 3: Perspective 30 00 LookAt 2 30 9 0 2 0 0 0 BeginList Segment { Sphere Translate 0 0.5 0 Scale 5 Box } EndList CallList Segment Translate 0 5 0 Rotate 60 0 0 CallList Segment { Translate -0.5 5 0 Rotate 60 0 0 Scale 0.5 0.5 0.5 CallList Segment } Translate 0.5 5 0 Rotate -60 0 0 Scale 0.5 0.5 0.5 CallList Segment
23 Spørgsmålet er nu hvilket eller hvilke (om nogen) af programmerne, der har genereret billedet?. Ingen af programmerne genererer det viste billede 2. Program 3. Program 3 4. Program 2 5. De genererer alle samme billede
24 OPGAVE.22 0 x y 0 2 2 2 3 3 3 2 3 4 4 5 4 3 2 3 4 5 3 2 2 3 5 5 4 2 3 2 4 3 4 3 2 Ovenstående billede translateres med vektoren (xt,yt)=(.5, 0.5). Der anvendes bilineær resampling og pixels uden for billedfeltet i input billedet sættes til værdien 0. Hvad er den største pixelværdi i outputbilledet?. 4.5 2. 4.25 3. 5 4. 4 5. 4.45
25 OPGAVE.23 Hvilet af følgende udsagn er forkert?. Visse lineære filtre kan fremhæve linier og kanter i en bestemt orientering. 2. Visse morfologiske operatorer kan fylde huller i forgrunden af et binært billede. 3. Visse spatielle momenter kan tælle objekter i et binært billede. 4. Visse gamma afbildninger kan gøre et billede mørkere. 5. Visse GLCM features kan fortælle noget om autocorrelationen i et billede.
26 OPGAVE.24 Der er placeret to kameraer på to målestationer placeret i henholdsvis (0,0,0) og (0,5,0). Hvis alt andet er lige, hvilket af følgende punkter kan du så måle mest nøjagtigt, vha. af disse kameraer? (Det antages at kameraerne stilles således at punkterne er i field of view.). (0,60,0) 2. (60,0,0) 3. (0,3,0) 4. (0,,0.) 5. (-60,5,0)
27 OPGAVE.25 Et kamera har følgende data: CCD-chip Opløsning: Pixelstørrelse: Pixelafstand: 3296 pixels horisontalt * 2472 pixels vertikalt 5.5 μm * 5.5 μm 5.5 μm (center til center) Kameraet er monteret med en arbejdsafstand på 40 cm over et vandret transportbånd. Kameraets optiske akse er lodret. Linsen har en brændvidde (eng. focal length) på 35 mm. På transportbåndet ligger en kaffebønne med længden 7.7 mm. Hvad er længden af kaffebønnen i pixels på kamera-chippen?. 25 pixels 2. 30 pixels 3. 32 pixels 4. 35 pixels 5. 39 pixels