Sikkerhed & Revision i det digitale samfund 7.9.2017 David Dreyer Lassen Økonomisk Institut Center for Social Data Science - SODAS Københavns Universitet
07-09-2017 2 1. Privacy 2. Hvad man man lære af data? 3. Prediktion og algoritmer 4. Adfærd og computational privacy
07-09-2017 3 Eksempel: Telefondata 10 min GPS wifi
07-09-2017 4 Hvorfor privacy? Privacy som selvstændigt mål privatliv som princip Privacy mhp informational rents Forbrugere, virksomheder Privacy og politik
Big Data in Economics Hvorfor privacy? Privacy som selvstændigt mål privatliv som princip, selvstændig værdi Udfordring: offentlig gode-problem Overvågning vs. opklaring Beskyttelse af egne data vs. forskning
Big Data in Economics Hvorfor privacy? Privacy mhp informational rents Forbrugere: willingness to pay (WTP), karakteristika og adfærd typisk privat information Willingness to pay: 1 st class vs. 2 nd class Karakteristika: Smag, genetik, personlighed Adfærd: fx køremønster el. fysisk aktivitet og forsikring Værdien af tid / søgeomkostninger Virksomheder: IPR, strategi Industrispionage Virksomheder hvor data er eneste aktiv (LinkedIn)
Big Data in Economics Persondataloven Lov om Al elektronisk brug af personlige data Data i registre Generelt: strikse regler omkring myndigheders og virksomheders brug af data Særligt fokus på følsomme data: Politisk tilhørsforhold Seksuelle præferencer etnicitet fagforeningsmedlem sundhed Væsentlige sociale problemer
Big Data in Economics Fra 2018: Udskift dansk lov med EUs persondataforordning Link: http://ec.europa.eu/justice/data-protection/ The objective of this new set of rules is to give citizens back control over of their personal data, and to simplify the regulatory environment for business. Data Protection Officers (DPOs) nye kernepersoner i mange organisationer og virksomheder Revision ifht overholdelse af DPD? Virksomheder EU regnskab og EU data
07-09-2017 9 Eksempel på udfordringer: Lovgivning? Offentlig adgang til tinglysning via Digital Tinglysning Ejerskab, låneforhold Søg adresse 2016: søgbar database over tinglysningsdata på server i USA Søg navne Lukket ned af Rigspolitiets Nationale Cyber Crime Center (NC3) men ikke helt klart hvorfor CVR-api?
07-09-2017 10 Eksempel på udfordringer: Er forudsigelser persondata/ipr? Persondatalov EUs dataforordning IPR etc. er alle baseret på faktiske, observerbare data Men hvad er egentlig data?
Big Data in Economics 11 Eksempel på udfordringer: Hvis mig dine venner... Social Fabric: Stort DTU-projekt hvor vi bruger data fra 1000 studerendes mobiltelefoner Hvor: GPS, wifi Hvem: bluetooth, wifi, sms, tlf, Facebook Målinger hvert 5. minut i et år Vi måler klassedeltagelse fra telefoner og karakterer fra admin data
Big Data in Economics 12
07-09-2017 13
07-09-2017 14
Big Data in Economics Eksempel på udfordringer: Hvad kan vi lære af Facebook-likes? Ret meget Private traits and attributes are predictable from digital records of human behavior Kosinski et al. PNAS 2013. 58,000 frivilige gav adgang til Facebooklikes, demografi + tog personlighedstest Resultat: Facebook-likes -> statistical learningmodel som korrekt predikterer Seksuel orientering 88% Afri-Am vs Causcasian 95% Dem vs. Rep 85 % Mindst ligeså god som personlighedstest Implikationer for privacy og online-adfærd?
07-09-2017 16 Tænkepause Persondatalov / EUPersondataforordning / IPR etc. er alle baseret på faktiske, observerbare data Men behandlede data (infereret, forudsigelser) kan afsløre (mindst) lige så meget om individer og virksomheder Lovgivning slet ikke på omgangshøjde her
07-09-2017 17 Predictive accounting? Revision handler (i min amatøroptik) langt henad vejen om hvorvidt historiske oplysninger er retvisende Men hvad siger data om hvad der vil ske i fremtiden? Og skal vi/i sige noget om det? Populært specialeemne: kan vi forudsige hvilke virksomheder der går konkurs ud fra historiske (regnskabs)data? Machine Learning / algoritmer
ML/AI Afsløring af snyd og bedrag Udvælgelse til audits/særligt gennemsyn: Hvidvask, aggressiv skatteplanl. Revision som sådan? 07-09-2017 18
07-09-2017 19 Hvem holder øje med algoritmerne? Mange virksomheder bruger algoritmer til fx prisfastsættelse, lånegodkendelse, forsikringssager Er de unbiased lighedsfremmere? Eller Weapons of Math Destruction? Hvordan får vi systematiseret tilsyn med algoritmer? Jf. bankers (ikke-)brug af kundedata Hvem skal gøre det? Hvordan skal det gøres?
Big Data in Economics Computational privacy Er anonymiserede data anonyme? Eksempler med fokus på re-identifikation Meget få datapunkter er nok til at re-identificere virksomheder, personer Også: Forensic data science Nye tilgange: analytiker kan ikke se data, men lave beregninger på dem Mere generelt problem: hvor meget information kan man få ud af data givet krav om ingen identifikation? Aktivt forskningsområde i datalogi
07-09-2017 21 Adfærd, privacy og sikkerhed Mange overvejelser om privacy og sikkerhed baseret på rationelle regler (ok) og individer (måske ikke altid ok) Adfærdsøkonomi hvordan træffer folk beslutninger og hvornår er de fornuftige Kahneman, Thinking Fast and Slow
07-09-2017 22 sodas.ku.dk ddl@econ.ku.dk