mining er ikke længere nice to have men need to have Af Frank Bjergø
Agenda Introduktion Hvad er mining og hvordan fungerer det? Eksempler på i Telco mining Hvilke forretningsområder er i gang
Hvem er jeg? Frank Bjergø Baggrund - Cand. mag. inf. fra Århus Universitet Mere end 10 års erfaring med data mining bl.a. - Ph.d. mining projekt på KU (Nordea/Novo) - Konsulent i SPSS - miner i Telco - Moodagent Recommendations (Syntonetic)
Hvor er vi 15 år efter det hele startede Store DWH er blevet bygget Dette gør det muligt at bygge modeller på historiske data Verden er ikke lineær I dag er data strukturer meget komplekse Der findes kommercielle data mining værktøjer Dette gør det muligt for analytikere at fokusere og løse på the Business goal base-embedded værktøjer mining værktøjer kan mine direkte i DHW
Hvorfor for at få mest værdi ud af dine data Source:TDWI BEST PRACTICES REPORT, FIRST QUARTER 2007
Generel metode Crisp -DM Forståelse af forretningen Forståelse af kilder Kundescores lægges i DWH Manipulering og udledning af variable Modellering ware houses Kundebaser Andre datakilder Evaluering (liftkurver og statistiske tests Source: http://www.crisp-dm.org
scores tabel Historisk adfærd > Model > Fremtidig adfærd Modellering: t 0 t 1 I dag Tid..! Udvikling 0 Status 0 Adfærd Model: P(Køb)=F(alder, anciennitet, ) Prædiktion/scoring: I dag Udvikling 1 Status Prædikteret adfærd 1 P(køb)=F(alder, anciennitet, ) Tid..!
Tool - IBM SPSS Modeler (Clementine) Push Back adgang til kilde data Deskriptiv Statistik ETL - aflede variable Modellering Evaluering Scoring tilbage i DWH
Modeller P(adfærd)=F(status,udvikling, ) Eksempel: Socialt bedrageri Mindre end 2 Socialt bedrageri (de røde) Antal børn 2 eller over Bor far hjemme? Regressionsmodeller Beslutningstræer Neurale netværk eller varianter Nej? Ja? Er det sociale bidrag steget siden sidste mdr? Under 1200 kr Over 1200 kr
resulterer i scores eller sandsynligheder
Hvorfor så mining Benchmarks, ROI & Lift Altså er der højere sandsynlighed for at kunden vil købe produktet således løftes ROI flere gange
Implementering af scores - differentierede budskaber Bonus_id 145678 127632 Id Forlader os XL Ny telefon Fri til Fast Centralitet Og flere 145678 0.7872 0.6766 0.3212 0.3786 0.2588 127632 0.6372 0.1223 0.1882 0.1222-132288 0.6377 0.4515 0.6523 0.1234 0.7888 142998 0.3456 0.7877 0.1222 0.4567 0.1533 156532 0.2344 0.2321 0.3434 0.3645 0.1234 134211 0.6777 0.6537 0.7412 0.7724 0.7341 166436 0.3471 0.1235 0.2443 0.2455 0.4355 149988 0.2361 0.2341 0.5277 0.4435 0.3242 129798 0.7657 0.3425 0.1743 0.2334 0.1333 Id 132288 134211 129798
Implementering af scores - hvilke produkter skal kunden have? Søgefelt Kundeoverblik Anbefalinger Matrice Hjælpetekster Log
Hvem er det modellerne udvælger - kundeprofil High eller Medium segmenterne Højere forbrug end gennemsnittet Ofte unge, kvinder Typisk kunder, som har en kort historik Har oftere været suspenderet Bor typisk tæt på bymidten Har ofte en kortere uddannelse og lavere indkomst Herved hjælper DM marketing med budskaberne til de respektive kampagner
mining Scoren geografisk placeret
Kampagne Opsalg/churn reduktion Standardiseret opfølgning Løft i salg Reduktion i Churn Kampagne/Model Model Model Kampagne/Model Model Model I kampagne Primær målgruppe Udvalgt af modellen 10,4% Kontrolgruppe Ikke udvalgt af modellen 6,0% I kampagne Primær målgruppe Udvalgt af modellen 7,5% Kontrolgruppe Ingen påvirkning, udvalgt af modellen 5,6% Ingen påvirkning, Ikke udvalgt af modellen 0,8% Kontrolgruppe Ingen påvirkning, udvalgt af modellen 15,6% Ingen påvirkning, Ikke udvalgt af modellen 1,2% Simpel business case 10.000 udsendelser Udgifter Indtægt (Forventet delta CLV 200 kr) 15.000 kr Start omkostniger 120.000kr uden model (6%) 100.000 kr Udsendelse(a 10 kr) 212.00 kr med model (10,4%) 115.000 kr Udgifter i alt Ekstra levetid (1/7,5) - (1/15,6) = 6,9 mdr
POC: Kom godt i gang med 1 Problemstilling & Business Case Vælg et problem, der kan løses med nuværende ressourcer 4 Beskriv din resultaters indflydelse på forretningen Beskriv din problemstilling Beregn Business casen Beskriv dit succeskriterium Beskriv din test 2 Definer & generer variabler, der kan beskrive dit problem 3 Få hjælp til Vil du vide mere så mød op til gratis DM Workshops hos EG med undertegnede: Ballerup (25 nov, 9 dec ) Århus (2, 16 dec) Henv. til Thomas Varan
mining er ikke længere nice to have men need to have - forretningsområder som er i gang Basket analyse Web mining Differentieret reklameudsendelse (scoring af postruter) Optimering af Email-dialog Profilering af kunder med Conzoom, Cameo Offentlige (prædiktion af ventelister, prioritering af resurser til forebyggelse i ældreplejen etc.) Fraud, socialt bedrageri Kreditscoring