Gerth Stølting Brodal Aarhus Universitet
|
|
|
- Bjørn Rasmussen
- 10 år siden
- Visninger:
Transkript
1 Gerth Stølting Brodal Aarhus Universitet Science Center Sorø - 4. september 2009
2 Overblik Hvem er jeg? Hvad er MADALGO? Algoritmiske problemstilling? Vidensspredning
3 Gerth Stølting Brodal Cand. scient., Aarhus Universitet 1994 Ph.d., Aarhus Universitet, 1997 Lektor, Aarhus Universitet, 2004-
4
5 Center motivation: Massive Data Computere og censorer anvendes overalt Øgede muligheder for at indsamle/gemme/behandle data Massive data tilstede overalt Samfundet mere og mere datadrevet Tilgå/behandle data overalt til enhver tid Nature 2/06: 2020 Future of computing 9/08: BIG DATA Videnskabelig data vokser eksponentielt, mens kvalitet og tilgængelighed forbedres Paradigmeskift: Videnskab vil blive om datamining Datalogi altafgørende i alle videnskaber
6 Massive Data Eksempler Telefon: AT&T 20 TB telefonopkalds database, trådløs sporring Forbrugere: WalMart 70 TB database, købsmønstre WEB: Google indeks med»8 milliarder websider Bank: Danske Bank 250 TB DB2 database Geografi: NASA sateliter genererer terrabytes hver dag
7 Center ved Lars Arge, Professor, Centerleder Lars Arge Gerth S. Brodal, Lektor 5 post docs., 13 ph.d. studerende, 2 kandidat studerende, 4 TAP Total budget for 5 år ca. 60 millioner kr Overordnede mål Fremme den algoritmiske viden inden for processering af massive data Træning af forskere i et verdensførende miljø At være katalysator for multidisciplinære samarbejder
8 Etableret milliarder kr Yderligere 3 milliarder i 2009 Støtter Grundforskningscentre ( Center of excellence ) Højt profilerede gæsteprofessorer Ph.d. skoler Center of excellence Grundforskning i verdensklasse 5 år; nogle forlænges med yderligere 5 år P.t. ca. 40 centre Gennemsnitlige 5 års bevilling på ca. 40 million kr
9 MADALGO kerneforskere AU Arge Brodal (AU) (AU) I/O, cache, og algoritme engineering MIT MPI Demaine Indyk (MIT) (MIT) Cache og streaming Mehlhorn Meyer (MPI) (FRA) I/O og algoritme enginnering
10
11 Center Aktiviteter Besøg af kerneforskerne Udveksling af AU, MPI, FRA og MIT post docs. og ph.d. studerende Gæsteophold af forskere og studerende fra andre institutioner Diverse workshops Incl. multidisciplinære og i samarbejde med industrien Førende internationalle begivenheder: 25 th Annual Symposium on Computational Geometry in 2009 Workshop on Algorithms for Massive Datasets in 2009 Sommerskoler 2007: Streaming algorithms 2008: Cache-oblivious algorithms
12 Center samarbejder COWI, DHI, DJF, DMU, Duke, NSCU Finansering fra det Strategiske Forskningsråd og US Army Research Office Software platform for Galileo GPS Adskillige danske akademiske/industrielle partnere Finansering fra Højteknologi Fonden Europæisk netværk om massive data algoritmik 8 førende europæiske forskningsgrupper
13 Algoritmiske Problemstilling
14 køretid Problemet... Normal algoritme I/O-effektiv algoritme datastørrelse størrelsen af hukommelsen
15 køretid Hvad er flaskehalsene? datastørrelse
16 Hukommelseshierarkier CPU Processor R L1 L2 L3 A M Disk flaskehals voksende tilgangstid og hukommelsesstørrelse
17 køretid Hukommelseshierarkier vs. Køretid L1 L2 L3 RAM datastørrelse
18 Algoritmik Central betydning for skalerbarhed/effektivitet Algoritmik centralt datalogisk område Traditionel algoritmik: Transformer input til output ved anvendelse af en simpel maskinmodel Utilstrækkelig til f.eks. Massive data Små/varierende maskiner Kontinuære datastrømme Software med begrænsninger! Faglige grupperinger har arbejdet med disse mangler men meget mangler stadig at blive løst
19 I/O-Effektivite Algoritmer Problemer involverende massive data på disk spor Læse-/skrivehoved Læse-/skrivearm Magnetisk overflade Tilgang til disk er 10 6 gange langsommere end hukommelsen Dyr tilgangstid amortiseres ud ved at overførre store blokke af data Forskellen i hastighed mellem moderne CPU- og diskteknologier svarer til forskellen i hastigheden mellem at spidse sin blyant med sin blyantspidser på sit skrivebord og at tage et fly til den anden side af jorden og anvende en anden persons blyantspidser på dennes skrivebord. (D. Comer) Altafgørende at udnytte blokkene når data gemmes/tilgås I/O-effektivie algoritmer: Flytte så få blokke som muligt for at løse et givet problem
20 I/O-Effektivite Algoritmer Problemer involverende massive data på disk Tilgang til disk er 10 6 gange langsommere end hukommelsen Dyr tilgangstid amortiseres ud ved at overførre store blokke af data Altafgørende at udnytte blokkene når data gemmes/tilgås I/O-effektivie algoritmer: Flytte så få blokke som muligt for at løse et givet problem
21 I/O-Effektive Algoritmer: I/O-model Blok I/O D M P Model parametre N= # elementer i input B = # elementer I en disk blok M = # elementer i intern hukommelse Mål: Minimer # I/O Flyt B sammenhængende elementer mellem hukommelsen og disk Typiske teoretiske grænser: N N Sortering: O( B logm ) B B Søgning: O(log B N) 1 Prioritets køer: O( log N ) amortiseret B M B B
22 MADALGO Fokusområder I/O Effektive Algoritmer Streaming Algoritmer Cache Oblivious Algoritmer Algoritme Engineering
23 I/O-Effektive Algoritmer Gør Forksel Eksempel: Gennemløb en kædet liste Problemstørrelse N = 10 elementer Diskblokstørrelse B = 2 elementer Hukommelsesstørrelse M = 4 elementer (2 blokke) Algoritme 1: N = 10 I/O Algoritme 2: N/B = 5 I/O Forskellen mellem N og N/B stor da blokstørrelsen er stor Eksempel: N = 256 x 10 6, B = 8000, 1ms disk tilgang N I/O tager 256 x 10 3 sek = 4266 min = 71 timer N/B I/O tager 256/8 sek = 32 sek
24 Cache-Oblivious Algoritmer Hvis problemer skal løses på ukendte eller ændrende maskiner Bloktilgang er vigtig på alle niveauer i hukommelseshierarkiet Men hukommelseshierarkier er meget varierende Cache-oblivious algoritmer: Brug alle blokke effektivt på alle niveauer i ethvert hukommelseshierarki
25 Algoritme Engineering Design/implementation af praktiske algorithmer Eksperimenter Center motiveret ved teoretiske mangler Center promoverer interdisciplinær/industrielt arbejde Naturligt at lave algorithm engineering Algorithm engineering Ofte værdifuld input til teoretisk arbejde f.eks. til design af bedre beregningsmodeller Nogle gange praktiske gennembrud f.eks. MADALGOs terræn data implementation
26 Hurricane Floyd Sep. 15, :00 15:00
27 Massive Terræn Data
28 Terræn Data Nye teknologier: Meget nemmere/billigere at indsamle detaljeret data Før manuel eller radarbaserede metoder Ofte 30 meter mellem datapunkter Nogle gange 10 meter data tilgængelig Nye laserskannings metoder (LIDAR) Mindre end 1 meter mellem datapunkterne Præcision i centimeter (hidtil meter) Danmark ~2 millioner punkter v. 30 meter («1GB) ~18 milliarder punkter v. 1 meter (»1TB) COWI (og andre) skanner nu DK NC skannet efter Hurricane Floyd i 1999
29 Simulering af Oversvømmelse Ikke alt terræn over højde h bliver oversvømmet når vandet stiger h meter! Teoretisk ikke så hårdt at beregne områderne der oversvømmes når vandet stiger h meter Men ingen software kunne gøre det for Danmark ved 2-meter opløsning Anvend I/O-effektiv algoritme Danmark på én dag
30 Oversvømmelse af Danmark +1 meter +2 meter 30
31 TerraStream Terræn Software Skalerbar, generelt, porterbar, håndtering af datafejl Pipeline af massive terræn data processerings software Demo:
32 Opsummering Massive datamængder forekommer overalt Medfører skaleringsproblemmer pga. hierarkisk hukommelse og langsom I/O I/O-effektive algoritmer giver en signifikant forbedring af skalerbarhed Nyt forskningscenter fokuserer på algoritmiske emner inden for massive data
33 Vidensspredning
34 Vidensspredning Folkeskolepraktik Gymnasiepraktik UNF foredrag om internetsøgemaskiner ACM programmeringskonkurrence Perspektiverende datalogi kursus
35 Tak! Spørgsmål, hvad nu? Gerth Stølting Brodal, MADALGO, Aarhus Universitet
Perspektiverende Datalogikursus
Perspektiverende Datalogikursus Algoritmer og kompleksitet Gerth Stølting Brodal 1 Perspektiverende kursus Formål: Vise bredden af Datalogi. Vise fagets anvendelighed. Vise konkrete eksempler på hvad datalogi
intelligent beregning af hydrologiske parametre afledt af en terrænmodel
u intelligent beregning af hydrologiske parametre afledt af en terrænmodel Peder Klith Bøcher Aarhus Universitet Projekter involveret: Effektiv håndtering af massive terrændata (NaBiIT): udvikling og anvendelse
Fremtidens Facility Management er datadrevet!
Fremtidens Facility Management er datadrevet! Få mere værdi ud af FM ved hjælp af Big Data Lidt om mig Flemming Adsersen Direktør, Over 20 års erfaring med Information Management fra projekter hos mange
EDUROAM WINDOWS 8. Nemt for brugeren og nemt for universitetet
1 Eduroam er det foretrukne netværk for studerende og ansatte på Aarhus Universitet. Du kan med eduroam få nem og automatisk adgang til internettet overalt på Aarhus Universitet eller på andre universiteter
IT-UNIVERSITETET I KØBENHAVN. KANDIDAT I SOFTWAREUDVIKLING OG -TEKNOLOGI ITU.dk/uddannelser
IT-UNIVERSITETET I KØBENHAVN KANDIDAT I SOFTWAREUDVIKLING OG -TEKNOLOGI ITU.dk/uddannelser SOFTWAREUDVIKLING OG -TEKNOLOGI Den 2-årige kandidatuddannelse (MSc) i Softwareudvikling og teknologi er en moderne
Vejledning til brug af skolens IT for nye elever/studerende.
Vejledning til brug af skolens IT for nye elever/studerende. Udarbejdet af: Ken R. Paulsen i samarbejde med ITCSYD 2016 ver. 16 IT Center Syd byder dig velkommen til Gråsten Landbrugsskole. Denne vejledning
En forsknings og businesspark inden for sundhedsteknologi og videnskab i Nord Danmark
Introduktion til Eir En forsknings og businesspark inden for sundhedsteknologi og videnskab i Nord Danmark Eir samler og udnytter synergierne mellem den basale og anvendelsesorienterede sundhedsteknologiske
Kommunikation og it. Tværfaglig bachelor- og kandidatuddannelse på Københavns Universitet. det humanistiske fakultet københavns universitet
det humanistiske fakultet københavns universitet Kommunikation og it Tværfaglig bachelor- og kandidatuddannelse på Københavns Universitet det humanistiske fakultet 1 Vil du udvikle det nye Twitter? Vil
Introduktion til DM507
Introduktion til DM507 Rolf Fagerberg Forår 2017 1 / 20 Hvem er vi? Underviser: Rolf Fagerberg, IMADA Forskningsområde: algoritmer og datastrukturer 2 / 20 Hvem er vi? Underviser: Rolf Fagerberg, IMADA
Vejledning til brug af skolens IT for nye elever/studerende.
Vejledning til brug af skolens IT for nye elever/studerende. Udarbejdet af: Ken R. Paulsen i samarbejde med ITCSYD 2015 ver. 14 IT Center Syd byder dig velkommen til Gråsten Landbrugsskole. Denne vejledning
KUNSTIG INTELLIGENS KOMMUNAL GAME CHANGER ELLER BARE BUZZ?
KUNSTIG INTELLIGENS KOMMUNAL GAME CHANGER ELLER BARE BUZZ? v. Tim Daniel Hansen Managing Partner & Co-Founder Digitaliseringsmessen d. 27. september 2018 På vippen til et paradigmeskifte 2 KL S TEKNOLOGISPRING
The ADSL-optimizer: Korrekt trafikstyring på ADSL linier
The ADSL-optimizer: Korrekt trafikstyring på ADSL linier Trafikstyring i bolignet d.8/6-2005 Foredrag: Baseret på mit datalogi speciale af Jesper Dangaard Brouer Cand. Scient Datalog Datalogisk
Overvågning af habitater ved hjælp af LiDAR baserede højdedata. Peder K. Bøcher Økonformatik & Biodiversitet Aarhus Universitet
Overvågning af habitater ved hjælp af LiDAR baserede højdedata Peder K. Bøcher Økonformatik & Biodiversitet Aarhus Universitet Aarhus Universitet Bioscience Kalø Silkeborg Økoinformatik & Biodiversitet
\ \ Computerens Anatomi / /
HTX Roskilde - mat-it-prog, 1.4 \ \ Computerens Anatomi / / Introduktion En PC ( personlige computer ) eller computer er bygget op af forskellige komponenter. Vi vil hermed gennemgå størstedelen af computerens
SYDDANSK UNIVERSITET VELKOMMEN TIL SYDDANSK UNIVERSITET! Prodekan for Forskning, Det Samfundsvidenskabelige Fakultet Professor Nina Dietz Legind
T r a n s p o r t e n s I n n o v a t i o n s d a g 1 5 SYDDANSK UNIVERSITET VELKOMMEN TIL SYDDANSK UNIVERSITET! Prodekan for Forskning, Det Samfundsvidenskabelige Fakultet Professor Nina Dietz Legind
C.V. for PER NIELSEN
NAVN: Per Nielsen ADRESSE: Bistrup Park 81 3460 Birkerød e mail: [email protected] FØDT: 25. juli 1961 UDDANNELSE: 1991 Ph.D., Danmarks Tekniske Universitet, Laboratoriet for Anvendt Matematisk Fysik
Programmering, algoritmik og matematik en nødvendig sammenblanding?
Programmering, algoritmik og matematik en nødvendig sammenblanding? Oplæg til IDA møde, 29. november 2004 Martin Zachariasen DIKU 1 Egen baggrund B.Sc. i datalogi 1989; Kandidat i datalogi 1995; Ph.D.
Intervalsøgning. Algoritmisk geometri. Motivation for intervaltræer. Intervalsøgning. Lad der være givet en database over ansatte i en virksomhed
Algoritmisk geometri Intervalsøgning 1 2 Motivation for intervaltræer Intervalsøgning Lad der være givet en database over ansatte i en virksomhed Ansat Alder Løn Ansættelsesdato post i databasen Vi kan
DM507 Algoritmer og datastrukturer
DM507 Algoritmer og datastrukturer Introduktion til kurset Rolf Fagerberg Forår 2019 1 / 20 Hvem er vi? Underviser: Rolf Fagerberg, Institut for Matematik og Datalogi (IMADA) Forskningsområde: algoritmer
STATUS PÅ DATALOGIFORSKNING OG -UDDANNELSE Professor Stephen Alstrup, Datalogisk Institut, KU Næstformand i ATV s Digitale Vismænd
STATUS PÅ DATALOGIFORSKNING OG -UDDANNELSE Professor Stephen Alstrup, Datalogisk Institut, KU Næstformand i ATV s Digitale Vismænd 1 Den digitale verden 2 Digitalisering og lidt tal IKT-sektoren omsætter
Fra Kontorarbejde til Klinikken en udfordring for IT teknologien
Fra Kontorarbejde til Klinikken en udfordring for IT teknologien Jakob E. Bardram Forskningschef, Ph.D. Center for Pervasive Computing Datalogisk Institut Aarhus Universitet Forskningsmetoder Omfattende
Datalogistudiet. Rolf Fagerberg. Institut for Matematik og Datalogi Syddansk Universitet. Studiestart, 1. september 2014
Datalogistudiet Rolf Fagerberg Institut for Matematik og Datalogi Syddansk Universitet Studiestart, 1. september 2014 Datalogistudiet Studiestart, 1. september, 2014 1 / 15 Hvad arbejder du med bagefter?
Ruteplanlægning og ITS
Stefan Røpke, Ph.D., Lektor, Danmarks Tekniske Universitet, Institut for Transport Teknologisk Institut, 6. Marts 2012 Hvad er ruteplanlægning? Opgave: Forsyn supermarked og tankstationer med dagligvarer.
FS2: Dynamic Data Replication in Free Disk Space for Improving Disk Performance and Energy Consumption
FS2: Dynamic Data Replication in Free Disk Space for Improving Disk Performance and Energy Consumption DIKU, Datalogisk Institut, Københavns Universitet 07/12/2005 Præsentation af Lauge Wulff Problem:
Vejledning til brug af skolens IT for nye elever/studerende.
Vejledning til brug af skolens IT for nye elever/studerende. Udarbejdet af: Ken R. Paulsen i samarbejde med ITCSYD ver. 10 IT Center Syd byder dig velkommen til Gråsten Landbrugsskole. Denne vejledning
Personlig og faglig udvikling. Vejen til et bedre studie og karrierer forløb
Personlig og faglig udvikling Vejen til et bedre studie og karrierer forløb Program for MM3 Supervision på studiejournaler og portofolier Hvilke kompetencegab er identificeret? Hvordan fyldes kompetencegabet
Danish Centre for Composite Structures and Materials for Wind Turbines (DCCSM)
Danish Centre for Composite Structures and Materials for Wind Turbines (DCCSM) Bent F. Sørensen Afdelingen for Materialeforskning Risø National Laboratoriet for Bæredygtig Energi Danmarks Tekniske Universitet
Klimatilpasning. Skybrudskort. fra Region Midtjylland. Arne Bernt Hasling. [email protected]. Region Midtjylland
Region Midtjylland Klimatilpasning Skybrudskort fra Region Midtjylland Arne Bernt Hasling [email protected] 1 Procesforløb og resultat Kortgrundlag Oversvømmelsessimuleringer Begrænsninger Eksempler på anvendelse
Lokationsbestemmelse. Mikkel Baun Kjærgaard ISIS Software Katrinebjerg Department of Computer Science University of Aarhus
Lokationsbestemmelse Mikkel Baun Kjærgaard ISIS Software Katrinebjerg Department of Computer Science University of Aarhus Projekt Fokus på fremtiden arkitektur, applikationer og grænseflader til trådløs
EDUROAM WINDOWS 7. Nemt for brugeren og nemt for universitetet
1 EDUROAM WINDOWS 7 Eduroam er det foretrukne netværk for studerende og ansatte på Aarhus Universitet. Du kan med eduroam få nem og automatisk adgang til internettet overalt på Aarhus Universitet eller
Institut for Regional Sundhedsforskning. Sundhedsfaglig Forskning og Uddannelse i Region Syddanmark NØGLETAL
Institut for Regional Sundhedsforskning Sundhedsfaglig Forskning og Uddannelse i Region Syddanmark NØGLETAL 2008-2011 2. udgave juni 2012 Indholdsfortegnelse Vision... 3 Forskning Forskningspublikationer...
OpenTele Server Performance Test Rapport
OpenTele Server Performance Test Rapport 17. marts 2015 Side 1 af 22 1Indholdsfortegnelse Indholdsfortegnelse Indledning Test forudsætning Beskrivelse af testscenarier Test af OpenTele kliniker web interface
AARHUS UNIVERSITY. Forskningsstøtteenheden UHH
AARHUS UNIVERSITY Forskningsstøtteenheden UHH 1 Hvorfor har AU/AUH en forskningsstøtteenhed? Hvorfor er jeg her i dag? FSEs kunder Aarhus Universitet (forskere og ledelse) Aarhus Universitetshospital (forskere
Bioinformatik Open Source Software i biologiens tjeneste
Bioinformatik Open Source Software i biologiens tjeneste Kenneth Geisshirt [email protected] Silex Science ApS Bioinformatik p.1/19 Om Silex Science ApS Grundlagt maj 2002 Ejeren er Cortex Holding Fokusområderne
ERHVERVSFORSKER ET TÆT SAMARBEJDE MELLEM VIRKSOMHED OG UNIVERSITET
ERHVERVSFORSKER ET TÆT SAMARBEJDE MELLEM VIRKSOMHED OG UNIVERSITET UNIVERSITETS Som universitetsvejleder synes jeg, at samarbejde med en virksomhed omkring en erhvervsph.d. både kan være godt til at starte
Kemi-lærerdag. 5 April 2013
Kemi-lærerdag 5 April 2013 Program 9:45 Registrering 10:00 Velkomst. Frank Jensen, Institut for Kemi 10:15 Skyer i jordens atmosfære Merete Bilde, Professor, Institut for Kemi 11:00 Kaffe 11:30 På sporet
Hosted løsning... 3. Hosted produkter... 4. Dedikeret server hosting... 5. Virtuel server hosting... 6. Shared Office hosting... 7
2011 Indhold Hosted løsning... 3 Hosted produkter... 4 Dedikeret server hosting... 5 Virtuel server hosting... 6 Shared Office hosting... 7 Exchange hosting... 8 Remote Backup... 9 Hosted løsning Hosting
HYBRID TAKEOFF REDEFINED JOURNEY TO THE CLOUD BY EMC Søren Holm, Proact
HYBRID TAKEOFF REDEFINED JOURNEY TO THE CLOUD BY EMC Søren Holm, Proact More than 3500 projects In control of 55 petabyte data 450 certified consultants More than 1.5M euro in training per year 55 PB,
Ny viden om hvordan depressionsmedicin bindes i hjernens nerveceller
Ny viden om hvordan depressionsmedicin bindes i hjernens nerveceller Med ny præcision kortlægger Århus-forskere hvordan depressionsmedicin virker. Opdagelserne giver håb om at udvikle forbedret depressionsmedicin
