Henrik Bulskov Styltsvig
|
|
- Olivia Jessen
- 6 år siden
- Visninger:
Transkript
1 Data Mining Henrik Bulskov Styltsvig Datalogiafdelingen, hus 42.1 Roskilde Universitetscenter Universitetsvej 1 Postboks Roskilde Telefon: Fax:
2 Målsætning Data Mining Forudsigelse Beskrivelse Klassifikation Temporale serier Regression Clustering Sekvenser Associationsregler Henrik Bulskov Styltsvig 2
3 Forudsigelse Ved at tage udgangspunkt i kendt viden ønskes viden om fremtidige mønstre Hvis man skal markedsføre et nyt produkt, hvem er så målgruppen? Hvilke varer skal placeres tæt på hinanden i et supermarked? Hvornår på året er det bedst at reklamere for et bestemt produkt? Henrik Bulskov Styltsvig 3
4 Forudsigelse - Nøjagtighed og dækning Nøjagtighed (accuracy) og dækning (coverage) bruges til at beskrive sikkerheden i forudsigelsen. Nøjagtighed beskriver hvor ofte de behandlede data opfylder forudsigelsen når betingelsen er opfyldt. Dækning beskriver hvor stor del af en gruppering der dækkes. IF opsparing = ja & alder = & indkomst = 40-59K THEN gruppering 1 {nøjagtighed = 0.8, dækning = 0.5} Henrik Bulskov Styltsvig 4
5 Beskrivelse Ønsket om at forstå eksisterende informationer på en ny måde At udlede viden/mønstre fra eksisterende informationer, som ikke er allerede er kendt Associationerne mellem emneord i afleveringsopgaven er et eksempel på dette Henrik Bulskov Styltsvig 5
6 Similaritet For at kunne udføre data mining er det nødvendigt med en mulighed for at afgøre om/hvor meget to elementer ligner hinanden. Numeriske værdier er naturligvis simple, men for booleske værdier og kategoriseringer skal der dannes mulighed for similaritet. Henrik Bulskov Styltsvig 6
7 Indlæring Kontrolleret indlæring Læring hvor indlæringsprocessen kontrolleres og tilpasses facit Målet er at danne den model der bedst beskriver de givne informationer Ukontrolleret indlæring Læring hvor resultatet ikke er kendt på forhånd Målet er en model der beskriver ny viden over de givne informationer Henrik Bulskov Styltsvig 7
8 Nearest Neighbor Nærmeste nabo er en af de simpleste former for data mining. Den tager sit udgangspunkt i at noget der er placeret tæt på hinanden også har noget til fælles. Danner ikke generelle beskrivelser, men gruppere instanser. Henrik Bulskov Styltsvig 8
9 Nearest Neighbor Nærmeste nabo er en af de simpleste former for data mining. Den tager sit udgangspunkt i at noget der er placeret tæt på hinanden også har noget til fælles. Danner ikke generelle beskrivelser, men gruppere instanser. A B Henrik Bulskov Styltsvig 9
10 Nearest Neighbor Nærmeste nabo er en af de simpleste former for data mining. Den tager sit udgangspunkt i at noget der er placeret tæt på hinanden også har noget til fælles. Danner ikke generelle beskrivelser, men gruppere instanser. Henrik Bulskov Styltsvig 10
11 Nearest Neighbor Nærmeste nabo er en af de simpleste former for data mining. Den tager sit udgangspunkt i at noget der er placeret tæt på hinanden også har noget til fælles. Danner ikke generelle beskrivelser, men gruppere instanser. Henrik Bulskov Styltsvig 11
12 Nearest Neighbor Nærmeste nabo er en af de simpleste former for data mining. Den tager sit udgangspunkt i at noget der er placeret tæt på hinanden også har noget til fælles. Danner ikke generelle beskrivelser, men gruppere instanser. A B Henrik Bulskov Styltsvig 12
13 K-nearest neighbor Løsningen er ikke kun at kigge på den nærmeste nabo, men at udvælge k naboer som grundlag for bestemmelse af naboskabet. A B Henrik Bulskov Styltsvig 13
14 Nearest Neighbor Kan ikke bruges til at afgøre hvilke attributter der skal anvendes. Er meget følsom for irrelevante attributter. Er forholdsvis beregnings tung, hvilket dog kan optimeres ved at anvende prototypiske instanser som beskrivelse. Giver ikke en generalisering af data, men der kan dannes generelle beskrivelser af klasserne ved at betragte en mængde af de mest typiske instanser i klasserne. Henrik Bulskov Styltsvig 14
15 Clustering Clustering er en metode til gruppering af data, uden på forhånd at kende noget til data. Ofte anvendes clustering når der ønskes et overblik over en given datamængde. Målet for en clustering kan både være at samle similar elementer i segmenter, eller at finde elementer der ikke passer ind skiller sig ud. Henrik Bulskov Styltsvig 15
16 Clustering formel definition Database D = {t 1, t 2,, t n } K = antallet af clusters ƒ : D {1,, k} hvor hver t i er indeholdt i cluster K j, 1 j k. Et cluster k j indeholder netop de tupler som kan tildeles med ƒ, hvilket er k i = {t i ƒ(t i ) = k j, 1 j k og t i D}. Henrik Bulskov Styltsvig 16
17 Clustering Clustering Hierarkisk Partition Sammenhobning opsplitning Henrik Bulskov Styltsvig 17
18 Clustering - similaritet centroid radius R m C m n å i 1 n å i 1 ( t ) mi ( t - C ) mi n n m 2 diameter D m n n åå i 1 j 1 ( t - t ) mi ( n)( n -1) mj 2 Henrik Bulskov Styltsvig 18
19 Clustering - centrum Centroid Mediod Henrik Bulskov Styltsvig 19
20 Clustering - similaritet Single Link Mindste afstand mellem et element i en cluster og et element i en anden. Complete Link Største afstand mellem et element i en cluster og et element i en anden. Average Den gennemsnitlige afstand mellem et element i en cluster og et element i en anden. Centroid Afstanden mellem centrum i en cluster og centrum i en anden. Mediod Afstanden mellem centerelementet i en cluster og centerelementet i en anden Henrik Bulskov Styltsvig 20
21 Clustering - Hierarkisk Sammenhobning opsplitning Henrik Bulskov Styltsvig 21
22 Clustering - partition Giver kun en mængde af clusters. Der gives det antal clusters der ønskes. 19 elementer kan deles i 4 clusters på måder!!! Squared error K-Means Nearest neighbor PAM(partition around mediods) Henrik Bulskov Styltsvig 22
23 Decision Trees DT er ofte anvendt til klassifikation. Udgangspunktet er en database med {A 1,, A n } attributter og {K 1,, k n } klasser. Hver knude (ikke blade) har en attribut som etiket. Hver kant er et prædikat der kan tildeles til forældre knudens attribut. Hver blad-knude har en klasse som etiket. Henrik Bulskov Styltsvig 23
24 Decision Trees Målet med DT er at hver knude deler søgemulighederne i to lige store dele. Valg af splittende attributter Valget af hvilke attributter der skal anvendes til at opdele efter kræver analyse af træningsdata og ofte inddragelse af ekspert viden. Rækkefølgen af splittende attributter Rækkefølgen er vigtig, idet rækkefølgen bestemmer dybden af træet. Henrik Bulskov Styltsvig 24
25 Decision Trees Antallet af gang der skal opdeles Ved simple attributter, såsom køn, er det oplagt hvor mange delinger en given attribut behøver, men ved mere komplekse domæner kan det være meget vanskeligt at afgøre. Træ strukturen Et balanceret træ med mindst højde er at fortrække Stop betingelser Optimalt skal der først stoppes når træningsdata er perfekt klassificeret, men det kan være nødvendigt at stoppe før ved store træer. Henrik Bulskov Styltsvig 25
26 Decision Trees Træningsdata Strukturen i DT bestemmes af træningsdata, er disse for små er træet måske ikke generelt nok, mens det hvis datamængden er for stort måske bliver overfittet. Beskæring Efter dannelse af et DT kan det være nødvendigt at modificere strukturen af optimeringshensyn. Henrik Bulskov Styltsvig 26
27 Neural Networks NN bliver ofte brugt til klassifikation. Målet er at afgøre hvilket output der kan forventes fra et givent input. NN skal oplæres med træningsdata. NN er robust overfor støj og manglende input NN kan fortsætte med at lære efter den egentlig træningsfase. For at benytte NN skal antallet af output knuder afgøres, og hvilke attributter der skal benyttes i input. Henrik Bulskov Styltsvig 27
28 Neural Networks En simple neuron kan modtage flere input giver et enkelt output. Henrik Bulskov Styltsvig 28
29 Neural Networks I McCulloch and Pitts model vægtes input. Det er netop disse vægte der benyttes under indlæring. Henrik Bulskov Styltsvig 29
30 Neural Networks Et neuralt netværk er normalt opbygget af input og output neuroner samt et eller flere skjulte lag af neuroner. Henrik Bulskov Styltsvig 30
31 Neural Networks Henrik Bulskov Styltsvig 31
32 Neural Networks Aktiveringsfunktion Aktiveringsfunktionen bestemmer hvilke mønstre det neurale netværk kan genkende. Ofte anvendes logistiske funktioner. Læringsrate Læringsraten bestemmer hvor store udsving der kan være i indlæringsprocessen. Små udsving betyder en længere læringsproces og fare for at finde lokale minimum, for store udsving fare for at overse mønstret. Antal neuroner Antallet af neuroner bestemmer hvor mange attributter netværket kan inddrage. Problemet med for mange er overfitting, mens for få kan give et for generelt netværk. Henrik Bulskov Styltsvig 32
33 Neural Networks NN er vanskelige at forstå og overskue. Det er vanskeligt at udlede regler fra NN. Input skal være numerisk. Testning af NN er omfattende Det er vanskeligt at verificere NN Det er måske ikke mulig at få et NN til at konvergere Det kan være kostbart at anvende NN Henrik Bulskov Styltsvig 33
34 Associationsregler Associationsregler er implikationer. Implikationerne kan være komplekse IF A & B & C Z IF A & B X & Z & Q Selvom associationsregler er implikationer er disse ikke kausale. Henrik Bulskov Styltsvig 34
35 Associationsregler Nøjagtighed Dækning Regel If breakfast cereal purchased then milk purchased. If bread purchased then Swiss cheese purchased. If 42 years old and purchased pretzels and purchased dry roasted peanuts then beer will be purchased. Nøjagtighed 85% 15% 95% Dækning 20% 6% 0,01% Henrik Bulskov Styltsvig 35
36 Associationsregler Beskrivelse Makroniveau kan beskrive sammenhænge mellem attributter og kan opsummere. Mikroniveau Meget detaljerede regler kan udledes og specifikke konsekvenser undersøges. Forudsigelser Regler kan også benyttes til forudsigelser. Hver regel kan benyttes til forudsigelse og konsekvensen og nøjagtigheden definere udfaldet og forudsigelsens nøjagtighed. Henrik Bulskov Styltsvig 36
Henrik Bulskov Styltsvig
Regelbaserede ekspertsystemer Henrik Bulskov Styltsvig Datalogiafdelingen, hus 42.1 Roskilde Universitetscenter Universitetsvej 1 Postboks 260 4000 Roskilde Telefon: 4674 2000 Fax: 4674 3072 www.dat.ruc.dk
Læs mereHenrik Bulskov Styltsvig
Introduktion til Fuzzy logik Henrik Bulskov Styltsvig Datalogiafdelingen, hus 42.1 Roskilde Universitetscenter Universitetsvej 1 Postboks 260 4000 Roskilde Telefon: 4674 2000 Fax: 4674 3072 www.dat.ruc.dk
Læs mereInformation Integration
Databaser, efterår 2002 Information Integration Troels Andreasen Datalogiafdelingen, hus 42.1 Roskilde Universitetscenter Universitetsvej 1 Postboks 260 4000 Roskilde Telefon: 4674 2000 Fax: 4674 3072
Læs mereHenrik Bulskov Styltsvig
Ordensvægtet aggregering Henrik Bulskov Styltsvig Datalogiafdelingen, hus 42. Roskilde Universitetscenter Universitetsve Postboks 26 4 Roskilde Telefon: 4674 2 Fax: 4674 372 www.dat.ruc.dk Behov for aggregering
Læs mereSortering. De n tal i sorteret orden. Eksempel: Kommentarer:
Sortering Sortering Input: Output: n tal De n tal i sorteret orden Eksempel: Kommentarer: 6, 2, 9, 4, 5, 1, 4, 3 1, 2, 3, 4, 4, 5, 9 Sorteret orden kan være stigende eller faldende. Vi vil i dette kursus
Læs mereSortering. Eksempel: De n tal i sorteret orden
Sortering 1 / 32 Sortering Input: Output: Eksempel: n tal De n tal i sorteret orden 6, 2, 9, 4, 5, 1, 4, 3 1, 2, 3, 4, 4, 5, 9 2 / 32 Sortering Input: Output: Eksempel: n tal De n tal i sorteret orden
Læs mereSortering. Eksempel: De n tal i sorteret orden
Sortering 1 / 34 Sortering Input: Output: Eksempel: n tal De n tal i sorteret orden 6, 2, 9, 4, 5, 1, 4, 3 1, 2, 3, 4, 4, 5, 9 2 / 34 Sortering Input: Output: Eksempel: n tal De n tal i sorteret orden
Læs mereSortering af information er en fundamental og central opgave.
Sortering Sortering Input: Output: Eksempel: n tal De n tal i sorteret orden 6, 2, 9, 4, 5, 1, 4, 3 1, 2, 3, 4, 4, 5, 9 Mange opgaver er hurtigere i sorteret information (tænk på ordbøger, telefonbøger,
Læs mereHenrik Bulskov Styltsvig
Matematisk logik Henrik Bulskov Styltsvig Datalogiafdelingen, hus 42.1 Roskilde Universitetscenter Universitetsvej 1 Postboks 260 4000 Roskilde Telefon: 4674 2000 Fax: 4674 3072 www.dat.ruc.dk Disposition
Læs mereDANMARKS NATIONALBANK
ANALYSE DANMARKS NATIONALBANK 21. JANUAR 2019 NR. 3 Tekstbaseret machine learning forbedrer konkursmodellering Machine learning forbedrer beregning af konkurssandsynlighed Tekstbaserede data tilføjer brugbar
Læs mereSortering af information er en fundamental og central opgave.
Sortering 1 / 36 Sortering Input: Output: Eksempel: n tal De n tal i sorteret orden 6, 2, 9, 4, 5, 1, 4, 3 1, 2, 3, 4, 4, 5, 6, 9 Mange opgaver er hurtigere i sorteret information (tænk på ordbøger, telefonbøger,
Læs mereIntroduktion til Visual Data Mining and Machine Learning
SAS USER FORUM Introduktion til Visual Data Mining and Machine Learning Astrid Enslev Vestergård, SAS Institute Agenda Introduktion til et par machine learningmodeller Case-introduktion Demo SWEDEN 2017
Læs mereKIS, efterår 2003. Henrik Bulskov Styltsvig. Efterår 2003
Introduktion til KI/Intelligente systemer KIS, efterår 2003 Henrik Bulskov Styltsvig Datalogiafdelingen, hus 42.1 Roskilde Universitetscenter Universitetsvej 1 Postboks 260 4000 Roskilde Telefon: 4674
Læs mereNetværksalgoritmer 1
Netværksalgoritmer 1 Netværksalgoritmer Netværksalgoritmer er algoritmer, der udføres på et netværk af computere Deres udførelse er distribueret Omfatter algoritmer for, hvorledes routere sender pakker
Læs mereNormalisering, del 2
Databaser, efterår 2002 Normalisering, del 2 Troels Andreasen Datalogiafdelingen, hus 42.1 Roskilde Universitetscenter Universitetsvej 1 Postboks 260 4000 Roskilde Telefon: 4674 2000 Fax: 4674 3072 www.dat.ruc.dk
Læs mereBegrænsninger i SQL. Databaser, efterår 2002. Troels Andreasen
Databaser, efterår 2002 Begrænsninger i SQL Troels Andreasen Datalogiafdelingen, hus 42.1 Roskilde Universitetscenter Universitetsvej 1 Postboks 260 4000 Roskilde Telefon: 4674 2000 Fax: 4674 3072 www.dat.ruc.dk
Læs mereER-modellen. Databaser, efterår Troels Andreasen. Efterår 2002
Databaser, efterår 2002 ER-modellen Troels Andreasen Datalogiafdelingen, hus 42.1 Roskilde Universitetscenter Universitetsvej 1 Postboks 260 4000 Roskilde Telefon: 4674 2000 Fax: 4674 3072 www.dat.ruc.dk
Læs mereOpgaver. Henrik Bulskov Styltsvig. Efterår 2003
Regelbaserede ekspertsystemer Opgaver Henrik Bulskov Styltsvig Datalogiafdelingen, hus 42.1 Roskilde Universitetscenter Universitetsvej 1 Postboks 260 4000 Roskilde Telefon: 4674 2000 Fax: 4674 3072 www.dat.ruc.dk
Læs mereDefinition : Et træ er en sammenhængende ikke-orienteret graf uden simple kredse. Sætning : En ikke-orienteret graf er et træ hvis og kun hvis der er
Definition : Et træ er en sammenhængende ikke-orienteret graf uden simple kredse. Sætning : En ikke-orienteret graf er et træ hvis og kun hvis der er en unik simpel vej mellem ethvert par af punkter i
Læs mereGrundtvigs Sandkasse
Introduction to the NFSG Sandbox Environment Computing, chcaa.io Aarhus University, Denmark April 23, 2019 Outline 1 2 3 Udvikling af computerbaseret forskning Aarhus Universitet har besluttet at understøtte
Læs mereGrådige algoritmer. Et generelt algoritme-konstruktionsprincip ( paradigme ) for optimeringsproblemer.
Grådige algoritmer Grådige algoritmer Et generelt algoritme-konstruktionsprincip ( paradigme ) for optimeringsproblemer. Grådige algoritmer Et generelt algoritme-konstruktionsprincip ( paradigme ) for
Læs mereLøs til optimalitet i eksponentiel tid Find tilnærmet løsning i polynomiel tid
6 april Løsning af N P -hårde problemer Løs til optimalitet i eksponentiel tid Find tilnærmet løsning i polynomiel tid Oversigt Grænseværdier (repetition) Branch-and-bound algoritmens komponenter Eksempler
Læs mereGrådige algoritmer. Et algoritme-konstruktionsprincip ( paradigme ) for optimeringsproblemer.
Grådige algoritmer Grådige algoritmer Et algoritme-konstruktionsprincip ( paradigme ) for optimeringsproblemer. Grådige algoritmer Et algoritme-konstruktionsprincip ( paradigme ) for optimeringsproblemer.
Læs mereDesign ved normalisering
Databaser, efterår 2002 Design ved normalisering Troels Andreasen Datalogiafdelingen, hus 42.1 Roskilde Universitetscenter Universitetsvej 1 Postboks 260 4000 Roskilde Telefon: 4674 2000 Fax: 4674 3072
Læs mereAlgoritmisk geometri
Algoritmisk geometri 1 Intervalsøgning 2 Motivation for intervaltræer Lad der være givet en database over ansatte i en virksomhed Ansat Alder Løn Ansættelsesdato post i databasen Antag, at vi ønsker at
Læs mereER-modellen. Databaser, efterår 2002. Troels Andreasen. Efterår 2002
Databaser, efterår 2002 ER-modellen Troels Andreasen Datalogiafdelingen, hus 42.1 Roskilde Universitetscenter Universitetsvej 1 Postboks 260 4000 Roskilde Telefon: 4674 2000 Fax: 4674 3072 www.dat.ruc.dk
Læs mereDatabasesystemer. Databaser, efterår Troels Andreasen. Efterår 2002
Databaser, efterår 2002 Databasesystemer Troels Andreasen Datalogiafdelingen, hus 42.1 Roskilde Universitetscenter Universitetsvej 1 Postboks 260 4000 Roskilde Telefon: 4674 2000 Fax: 4674 3072 www.dat.ruc.dk
Læs mereGrådige algoritmer. Et generelt algoritme-konstruktionsprincip ( paradigme ) for optimeringsproblemer.
Grådige algoritmer Grådige algoritmer Et generelt algoritme-konstruktionsprincip ( paradigme ) for optimeringsproblemer. Grådige algoritmer Et generelt algoritme-konstruktionsprincip ( paradigme ) for
Læs mereHigh-Performance Data Mining med SAS Enterprise Miner 14.1
High-Performance Data Mining med SAS Enterprise Miner 14.1 nye procedurer til en mere effektiv modeludviklingsproces Kristina Birch, Advisory Analytical Consultant, SAS Institute Indhold Hvad er High-Performance
Læs mereMachine Learning Noter
Machine Learning Noter Michael Lind Mortensen, illio 22. marts 2010 Indhold 1 Linear Regression 3 1.1 Disposition............................ 3 1.2 Emne detaljer........................... 3 1.2.1 Lineær
Læs mereGrådige algoritmer. Et generelt algoritme-konstruktionsprincip ( paradigme ) for optimeringsproblemer.
Grådige algoritmer Grådige algoritmer Et generelt algoritme-konstruktionsprincip ( paradigme ) for optimeringsproblemer. Grådige algoritmer Et generelt algoritme-konstruktionsprincip ( paradigme ) for
Læs mereUdglatning af GWR-prisindeksene
Udglatning af GWR-prisindeksene En målsætning for GWR-prisindeksene er, at de er temporale og spartiale kontinuere. Den geografiske vægtede regression (GWR), beskrevet ovenover, sikrer geografisk spartial
Læs mereIntervalsøgning. Algoritmisk geometri. Motivation for intervaltræer. Intervalsøgning. Lad der være givet en database over ansatte i en virksomhed
Algoritmisk geometri Intervalsøgning 1 2 Motivation for intervaltræer Intervalsøgning Lad der være givet en database over ansatte i en virksomhed Ansat Alder Løn Ansættelsesdato post i databasen Vi kan
Læs mereHvordan virker en rejseplanner?
29. September 2004 Hvordan virker en rejseplanner? Henning Christiansen professor i datalogi, ph.d. http://www.ruc.dk/~henning Datalogiafdelingen, hus 42.1 Roskilde Universitetscenter Universitetsvej 1
Læs mereFunktionel afhængighed
Databaser, efterår 2002 Funktionel afhængighed Troels Andreasen Datalogiafdelingen, hus 42.1 Roskilde Universitetscenter Universitetsvej 1 Postboks 260 4000 Roskilde Telefon: 4674 2000 Fax: 4674 3072 www.dat.ruc.dk
Læs mereDanmarks Tekniske Universitet
side af sider Danmarks Tekniske Universitet Skriftlig prøve, den. maj 00. Kursusnavn Algoritmer og datastrukturer Kursus nr. 06. Tilladte hjælpemidler: Alle hjælpemidler. Vægtning af opgaverne: Opgave
Læs mereEvolutionstræer (Phylogenetic trees)
BM forelæsning d november 00 Referat af Claus Skovgaard Evolutionstræer (Phylogenetic trees) Baseres på hvor meget de forskellige arter ligner hinanden og hvordan man tror udviklingen har forløbet menneske
Læs mereDanmarks Tekniske Universitet
side af 2 sider Danmarks Tekniske Universitet Skriftlig prøve, den 2. maj 200. Kursusnavn Algoritmer og datastrukturer Kursus nr. 02326. Tilladte hjælpemidler: Alle hjælpemidler. Vægtning af opgaverne:
Læs mereDanmarks Tekniske Universitet
side af sider Danmarks Tekniske Universitet Skriftlig prøve, den 6. maj 0. Kursusnavn: Algoritmer og datastrukturer I Kursus nr. 005. Tilladte hjælpemidler: Skriftlige hjælpemidler. Varighed: timer Vægtning
Læs mere16. december. Resume sidste gang
16. december Resume sidste gang Abstrakt problem, konkret instans, afgørlighedsproblem Effektiv kodning (pol. relateret til binær kodning) Sprog L : mængden af instanser for et afgørlighedsproblem hvor
Læs mereDynamisk programmering
Dynamisk programmering Dynamisk programmering Et algoritme-konstruktionsprincip ( paradigme ) for optimeringsproblemer. Har en hvis lighed med divide-and-conquer: Begge opbygger løsninger til større problemer
Læs merePerspektiverende Datalogikursus
Perspektiverende Datalogikursus Uge 1 - Algoritmer og kompleksitet Gerth Stølting Brodal 2. september 2005 1 Afleveringsopgaver... /\.. // \\ / \ / [] \ \\_// / \ / \ []._. ---------------- _ 2 Øvelse
Læs mereDanmarks Tekniske Universitet
side af sider Danmarks Tekniske Universitet Skriftlig prøve, den. maj 00. Kursusnavn Algoritmer og datastrukturer I Kursus nr. 005. Tilladte hjælpemidler: Alle skriftlige hjælpemidler. Vægtning af opgaverne:
Læs mereStudieretningsprojekter i machine learning
i machine learning 1 Introduktion Machine learning (ml) er et område indenfor kunstig intelligens, der beskæftiger sig med at konstruere programmer, der kan kan lære fra data. Tanken er at give en computer
Læs mereKUNSTIG INTELLIGENS KOMMUNAL GAME CHANGER ELLER BARE BUZZ?
KUNSTIG INTELLIGENS KOMMUNAL GAME CHANGER ELLER BARE BUZZ? v. Tim Daniel Hansen Managing Partner & Co-Founder Digitaliseringsmessen d. 27. september 2018 På vippen til et paradigmeskifte 2 KL S TEKNOLOGISPRING
Læs mereDanmarks Tekniske Universitet
side af sider Danmarks Tekniske Universitet Skriftlig prøve, den 6. maj 0. Kursusnavn: Algoritmer og datastrukturer Kursus nr. 06. Tilladte hjælpemidler: Skriftlige hjælpemidler. Varighed: timer Vægtning
Læs mereØkonometri 1 Efterår 2006 Ugeseddel 11
Økonometri 1 Efterår 2006 Ugeseddel 11 Program for øvelserne: Gruppearbejde og plenumdiskussion Introduktion til SAS øvelser SAS øvelser Øvelsesopgave: Paneldata estimation Sammenhængen mellem alder og
Læs mereInduktive og rekursive definitioner
Induktive og rekursive definitioner Denne note omhandler matematiske objekter, som formelt er opbygget fra et antal basale byggesten, kaldet basistilfælde eller blot basis, ved gentagen brug af et antal
Læs mereFraktaler Mandelbrots Mængde
Fraktaler Mandelbrots Mængde Foredragsnoter Af Jonas Lindstrøm Jensen Institut For Matematiske Fag Århus Universitet Indhold Indhold 1 1 Indledning 3 2 Komplekse tal 5 2.1 Definition.......................................
Læs mereDanmarks Tekniske Universitet
side af 2 sider Danmarks Tekniske Universitet Skriftlig prøve, den 2. maj 200. Kursusnavn Algoritmer og datastrukturer I Kursus nr. 0205. Tilladte hjælpemidler: Alle skriftlige hjælpemidler. Vægtning af
Læs mereNeurale netværk til identifikation og klassifikation af katalytiske proteiner - et case study
Neurale netværk til identifikation og klassifikation af katalytiske proteiner - et case study Projekt udarbejdet af: Glennie Helles Datalogisk vejleder: Prof. Peter Johansen Indholdsfortegnelse 1 INDLEDNING...4
Læs mereAI is not ROBOTS
AI is not ROBOTS Dataetik og AI Regeringens Ekspertgruppe om dataetik lancerede 22. november 2018 deres anbefalinger. Den praktiske anvendelse af AI spillede en fremtrædende rolle i mange af diskussionerne,
Læs mereDynamisk Routing OSPF. Rasmus Elmholt V1.0
Dynamisk Routing OSPF Rasmus Elmholt V1.0 Routing Politikker Routing politikker bestemmer hvilket information der rammer og forlader route tabellen. Routing Politikker Eksempel Redistribute Static [edit]
Læs mereDeep Learning. Muligheder og faldgruber. Glenn Gunner Brink Nielsen, Teknologisk Institut
Deep Learning Muligheder og faldgruber Glenn Gunner Brink Nielsen, Teknologisk Institut Deep Learning en klar succes! Siden de første convolutional netværk blev indført i 2012 har de domineret denne opgave.
Læs mereAfsluttende opgave Kommunikation/IT
Afsluttende opgave Kommunikation/IT Indledning: Dette er mit afsluttende projekt, som jeg har skrevet alene. Vores overemne er ballonprojekt, og vi fik 3 forskellige projektoplæg: E-learning Databehandling
Læs mere.. if L(u) + w(u, v) < L(v) then.. begin... L(v) := L(u) + w(u, v)... F (v) := u.. end. med længde L(z)}
Procedure Dijkstra(G = (V, E): vægtet sh. graf,. a, z: punkter) { Det antages at w(e) > 0 for alle e E} For alle v V : L(v) := L(a) := 0, S := while z / S begin. u := punkt ikke i S, så L(u) er mindst
Læs mereDanmarks Tekniske Universitet
ksamen 06, side af sider anmarks Tekniske Universitet Skriftlig prøve, den 6. maj 0. ursusnavn: lgoritmer og datastrukturer ursus nr. 06. Tilladte hjælpemidler: Skriftlige hjælpemidler. Varighed: timer
Læs mereØkonometri 1 Forår 2006 Ugeseddel 11
Økonometri 1 Forår 2006 Ugeseddel 11 Program for øvelserne: Gruppearbejde og plenumdiskussion Introduktion til SAS øvelser SAS øvelser Øvelsesopgave 5: Paneldata estimation af indkomstligninger på danske
Læs merePerspektiverende Datalogikursus
Perspektiverende Datalogikursus Uge 1 - Algoritmer og kompleksitet Gerth Stølting Brodal 27. august 2004 1 Indhold Mere om Eksempler på beregningsproblemer Algoritmer og deres analyse Korrekthed af algoritmer
Læs mereNetværksalgoritmer. Netværksalgoritmer. Meddelelses-modellen. Routing
Netværkalgoritmer Netværkalgoritmer Netværkalgoritmer er algoritmer, der udføre på et netværk af computere Dere udfør er ditribueret Omfatter algoritmer for, hvorlede routere ender pakker igennem netværket
Læs mereb. Sammenhængen passer med forskriften for en potensfunktion når a = 1 og b= k.
Kapitel 5 Øvelse 56 a = b = 3 b a = 1,7 b = 0,8 c a = 3 b =1 d a = b = 8 Øvelse 57 Sammenhængen passer med forskriften for en potensfunktion når a =1 b k = b Sammenhængen passer med forskriften for en
Læs mereFractal compression a technology in search of a problem
Fractal compression a technology in search of a problem Bryggervej 30, 8240 Århus N 4. januar 2011 Oversigt 1 Magien bag ved Matematikken Kopimaskinen Simsalabim Partitioneret IFS 2 Collage theorem De
Læs mereDM13-1. Obligatorisk opgave E.05. Jacob Aae Mikkelsen
DM13-1. Obligatorisk opgave E.05 Jacob Aae Mikkelsen - 191076 26. september 2005 Indhold Analyse af problemstillingen........................ 2 Spørgsmål 1................................. 3 Spørgsmål
Læs mereHvordan kan en computer. DEEP LEARNING et gennembrud inden for kunstig intelligens
DEEP LEARNING et gennembrud inden for kunstig intelligens Forfatterne Morten B. Jensen er ph.d.-studerende mboj@create.aau.dk Chris H. Bahnsen er ph.d.-studerende cb@create.aau.dk Morten og Chris forsker
Læs mereKommunikation Første case opgave Natascha og Nicklas
Kommunikation Første case opgave Natascha og Nicklas Opgave formulering : Projekt : Målgrupper og segmentering Dig og dit team er blevet hyret til at lave en målgruppeundersøgelse for et stort mediehus,
Læs mereDynamisk Routing OSPF. Rasmus Elmholt V1.0
Dynamisk Routing OSPF Rasmus Elmholt V1.0 Routing Politikker Routing politikker bestemmer hvilket information der rammer og forlader route tabellen. Naboer Routes Protokoller Import Routing Table Export
Læs mereRoskilde Tekniske Gymnasium. Eksamensprojekt. Programmering C niveau
Roskilde Tekniske Gymnasium Eksamensprojekt Programmering C niveau Andreas Sode 09-05-2014 Indhold Eksamensprojekt Programmering C niveau... 2 Forord... 2 Indledning... 2 Problemformulering... 2 Krav til
Læs mere22 Hobe. Noter. PS1 -- Hobe. Binære hobe. Minimum-hob og maximum-hob. Den abstrakte datatype minimum-hob. Opbygning af hobe. Operationen siv-ned.
22 Hobe. Binære hobe. Minimum-hob og maximum-hob. Den abstrakte datatype minimum-hob. Opbygning af hobe. Operationen siv-ned. Indsættelse i hobe. Sletning af minimalt element i hobe. Repræsentation. 327
Læs mereSocial Media Rapport for VIRKSOMHED A/S af Bach & McKenzie
Social Media Rapport for VIRKSOMHED A/S af Bach & McKenzie Dato: 22-08-2014 Copyright af Bach & McKenzie 2014 Introduktion Indholdsfortegnelse 03 Hovedtal Kære VIRKSOMHED A/S Tillykke med jeres nye Social
Læs mereInvarianter. Invariant: Et forhold, som vedligeholdes af algoritmen gennem (dele af) dens udførelse. Udgør ofte kernen af ideen bag algoritmen.
Invariant: Et forhold, som vedligeholdes af algoritmen gennem (dele af) dens udførelse. Udgør ofte kernen af ideen bag algoritmen. Invariant: Et forhold, som vedligeholdes af algoritmen gennem (dele af)
Læs mereSkruedyrenes evolution
Skruedyrenes evolution Materialer: 8 forskellige søm og skruer per hold. Formål: At tegne et slægtskabstræ udfra morfologiske karaktertræk Når arterne er blevet indsamlet og identificeret, skal de systematiseres.
Læs mereLogistik og optimering
Logistik og optimering JENS LYSGAARD Professor Institut for Økonomi Aarhus Universitet Forskningscentret CORAL v. Institut for Økonomi Logistik og optimering CORAL: Cluster for Operations Research And
Læs mereSammenhængskomponenter i grafer
Sammenhængskomponenter i grafer Ækvivalensrelationer Repetition: En relation R på en mængde S er en delmængde af S S. Når (x, y) R siges x at stå i relation til y. Ofte skrives x y, og relationen selv
Læs mereObjektorientering og databaser
Databaser, efterår 2002 Objektorientering og databaser Troels Andreasen Datalogiafdelingen, hus 42.1 Roskilde Universitetscenter Universitetsvej 1 Postboks 260 4000 Roskilde Telefon: 4674 2000 Fax: 4674
Læs mereDynamisk programmering
Dynamisk programmering Dynamisk programmering Optimeringsproblem: man ønsker at finde bedste den kombinatoriske struktur (struktur opbygget af et endeligt antal enkeltdele) blandt mange mulige. Eksempler:
Læs mereBGP Peers Opbygning af BGP Peers/Neighbors
BGP Peers Opbygning af BGP Peers/Neighbors BGP transport BGP anvender TCP som transport medie Derfor skal netværket være i konvergens Derfor anvendes en IGP. (IS-IS) TCP er forbindelses orienteret BGP
Læs mereOpgave: BOW Bowling. Rules of Bowling. danish. BOI 2015, dag 1. Tilgængelig hukommelse: 256 MB. 30.04.2015
Opgave: BOW Bowling danish BOI 0, dag. Tilgængelig hukommelse: 6 MB. 30.04.0 Byteasar er fan af både bowling og statistik. Han har nedskrevet resultaterne af et par tidligere bowling spil. Desværre er
Læs mere18 Multivejstræer og B-træer.
18 Multivejstræer og B-træer. Multivejs søgetræer. Søgning i multivejssøgetræer. Pragmatisk lagring af data i multivejstræer. B-træer. Indsættelse i B-træer. Eksempel på indsættelse i B-træ. Facts om B-træer.
Læs mereDeep Learning og Computer Vision. C h r i s H o l m b e r g B a h n s e n
Deep Learning og Computer Vision C h r i s H o l m b e r g B a h n s e n Baggrund Hv em er jeg? Cand. polyt. Elektronik & IT, 2013 Ph.d.-afhandling i robust trafikovervågning, 2018 Visual Analysis of People
Læs mereNina Nielsen STANDARD RAPPORT. Adaptive General Reasoning Test
Adaptive General Reasoning Test STANDARD RAPPORT Dette er en fortrolig rapport, som udelukkende må anvendes af personer med en gyldig certificering i anvendelse af værktøjet AdaptGRT fra DISCnordic. VIGTIGT
Læs mereSortering ved fletning (merge-sort)
Sortering 1 Sortering ved fletning (merge-sort) 7 2 9 4 2 4 7 9 7 2 2 7 9 4 4 9 7 7 2 2 9 9 4 4 2 Del-og-hersk Del-og-hersk er et generelt paradigme til algoritmedesign Del: opdel input-data S i to disjunkte
Læs mereSortering. Sortering ved fletning (merge-sort) Del-og-hersk. Merge-sort
Sortering Sortering ved fletning (merge-sort) 7 2 9 4! 2 4 7 9 7 2! 2 7 9 4! 4 9 7! 7 2! 2 9! 9 4! 4 1 2 Del-og-hersk Merge-sort Del-og-hersk er et generelt paradigme til algoritmedesign Del: opdel input-data
Læs mereDivide-and-Conquer algoritmer
Divide-and-Conquer algoritmer Divide-and-Conquer algoritmer Det samme som rekursive algoritmer. Divide-and-Conquer algoritmer Det samme som rekursive algoritmer. 1. Opdel problem i mindre delproblemer
Læs mereSøren Sørensen STANDARD RAPPORT. Adaptive General Reasoning Test
Adaptive General Reasoning Test STANDARD RAPPORT Dette er en fortrolig rapport, som udelukkende må anvendes af personer med en gyldig certificering i anvendelse af værktøjet AdaptGRT fra DISCnordic. VIGTIGT
Læs mereGeometrisk skæring. Afgørelse af om der findes skæringer blandt geometriske objekter Bestemmelse af alle skæringspunkter
Planfejning 1 Skæring 2 Geometrisk skæring Afgørelse af om der findes skæringer blandt geometriske objekter Bestemmelse af alle skæringspunkter Løsningsmetoder: Rå kraft Planfejning (eng. plane sweep)
Læs mereStatistisk 3-D ber egning af sandsynligheden for at finde en jordforurening
M iljøpr ojekt nr. 449 1999 Statistisk 3-D ber egning af sandsynligheden for at finde en jordforurening Lektor, cand.scient., lic.tech. Helle Holst IMM, Institut for Matematisk Modellering DTU, Danmarks
Læs mereBørnenes Egen U-landskalender: Lav en digital lågekalender
Side 1/5 Fag/klassetrin: Dansk, 1.-4. klasse Omfang: 2-8 lektioner. Målpar, læringsmål, tegn på læring: Se skema nedenfor. Formål: Formålet er at producere egne digitale u-landskalendere, som eleverne
Læs mereInternettet Reklamer Mund-til-mund Aviser Magasiner Butikker Radio/TV
1 2 Internettet Reklamer Mund-til-mund Aviser Magasiner Butikker Radio/TV 3 Traditionel - accept Avanceret - accept Over kill - ikke accept Overraskelse 4 5 Individet i de mange kontekster = komplekse
Læs mereHegn og et godt naboskab
Et godt naboskab er et fint udgangspunkt for at ordne praktiske ting i venskabelighed. Hegnet er en del af naboskabet en fælles sag. Naboerne må som regel selv bestemme, hvordan hegnet mellem deres ejendomme
Læs mereAlgoritmer og datastrukturer Course No. 02105 Cheat Sheet 2012. May 15, 2012
Algoritmer og datastrukturer Course No. 02105 Cheat Sheet 2012 May 15, 2012 1 CONTENTS 2012 CONTENTS Contents 1 Kompleksitet 3 1.1 Køretid................................................ 3 1.2 Asymptotisk
Læs mereNotat. Testrapport - metode. Deep learning algoritme i billeddannende måleudstyr til måle- og klassificeringsanvendelser
Notat 7. december 2018 2006150-02-01 TMO,DBN,GLN,EVO Testrapport - metode Deep learning algoritme i billeddannende måleudstyr til måle- og klassificeringsanvendelser i fødevarevirksomheder. Introduktion
Læs mereSandsynligheder. Udfaldsrum Ω = {ω 1,..., ω N } hvor alle udfald er lige sandsynlige, dvs. P (ω i )=1/N for alle i =1,..., N.
Dagens program Afsnit 1.4-1.6 Kombinatorik - Permutationer - Kombinationer Udtagelse af stikprøver - Population - Med og uden tilbagelægning Eksempler 1 Sandsynligheder Udfaldsrum Ω = {ω 1,..., ω N } hvor
Læs mereLineære sammenhænge. Udgave 2. 2009 Karsten Juul
Lineære sammenhænge Udgave 2 y = 0,5x 2,5 2009 Karsten Juul Dette hæfte er en fortsættelse af hæftet "Variabelsammenhænge, 2. udgave 2009". Indhold 1. Lineære sammenhænge, ligning og graf... 1 2. Lineær
Læs mereSådan kommer du igennem din blogs 5 stadier i opstartsfase
Sådan kommer du igennem din blogs 5 stadier i opstartsfase Nogle af de absolut skarpeste bloggere tjener over 100.000 i måneden, men det er typisk på den internationale scene, men her i Danmark har vi
Læs mereHegn... og et godt naboskab Hegn... og et godt naboskab Hegn... og et godt naboskab Hegn og et godt naboskab Bygninger Anke Hegnssyn
Hegn og et godt naboskab Naboskab Et godt naboskab er et fint udgangspunkt for at ordne praktiske ting i venskabelighed. Hegnet er en del af naboskabet en fælles sag. Naboerne må som hovedregel selv bestemme,
Læs mereHamilton-veje og kredse:
Hamilton-veje og kredse: Definition: En sti x 1, x 2,...,x n i en simpel graf G = (V, E) kaldes en hamiltonvej hvis V = n og x i x j for 1 i < j n. En kreds x 1, x 2,...,x n, x 1 i G kaldes en hamiltonkreds
Læs mereDivide-and-Conquer algoritmer
Divide-and-Conquer algoritmer Divide-and-Conquer algoritmer Det samme som rekursive algoritmer. Divide-and-Conquer algoritmer Det samme som rekursive algoritmer. 1. Opdel problem i mindre delproblemer
Læs mereFOLK NETVÆRKER.. Tilfældigheder! Copyright Soulaima Gourani, soulaimagourani.dk HVAD SKAL UNDERSØGES?
VELKOMMEN The investment in time and energy creating a network will only be worth while if you are genuinely interested in the people in it sustaining it for purely selfish reasons won t work FOLK NETVÆRKER..
Læs meredpersp Uge 40 - Øvelser Internetalgoritmer
Øvelse 1 dpersp Uge 40 - Øvelser Internetalgoritmer (Øvelserne 4 og 6 er afleveringsopgaver) a) Hver gruppe får en terning af instruktoren. Udfør 100 skridt af nedenstående RandomWalk på grafen, som også
Læs mere