Big Data er en revolution
Et gammelt mundheld taler om tre slags løgn: Løgn, forbandet løgn og statistik. Umiddelbart kunne man tro, at Big Data er statistisk løgn opløftet til højeste potens. Men sådan er det ikke – tværtimod.
Big Data er nemlig ikke statistik, det er sandsynlighedsregning.
– Det er en forudsigelse, hvor vi bygger en model. Definerer hvor præcis den skal være og krydsvaliderer den bagefter. Du kan jo se, hvor stor sandsynligheden er for de sammenhænge og mønstre, vi finder, forklarer Michal Kosinski, der er forsker på University of Cambridge i England og tilknyttet Machine Learning Group på Microsoft Research.
Michal Kosinski arbejder i et krydsfelt mellem IT og psykologi. Sammen med to kolleger er han manden bag en opsigtsvækkende undersøgelse, hvor de har analyseret ”likes” for 58.000 Facebook-brugere og sammenholdt dem med deres profiler. På baggrund af de enorme mængder data har de lavet en model, der med ret stor præcision kan fortælle en masse om brugernes personlighed.
Mere sandsynligt end markedsundersøgelser
De har blandt andet fundet frem til en række personlighedstræk bag profilerne som for eksempel, hvor intelligente de er, hvilket køn og hvilken race de tilhører, religion, seksuel orientering og politisk overbevisning.
Mere kuriøst har de også fundet frem til hovedparten af de personer, hvis forældre gik fra hinanden, inden Facebook-brugeren var 21 år gammel. Mange af oplysningerne er endda ikke noget, som de selv har ønsket at få frem i lyset. Men mønstret i deres ”likes” afslører dem.
– Vores præcision med bare 58.000 Facebook-profiler, hvor mere end halvdelen havde mere end hundrede likes, er rimelig høj – og mere sikker end klassiske markedsanalyser, siger Michal Kosinski.
I nogle tilfælde giver det god mening at koble, hvad Facebook-brugere kan lide, når for eksempel homoseksuelle klikker på musik, billeder, film og historier om bøsser eller lesbiske. Men umiddelbart lyder det som løgnagtig statistik, når de tre britiske forskeres analyser viser, at der også er sammenhæng mellem intelligens og tordenvejr og krøllede kartoffelchips. Men det er der, understreger Michal Kosinski:
– Hvis bare databasen er stor nok, så er det usandsynligt, at de mønstre du finder er tilfældige.
Selvfølgelig kan man fodre sin Facebook-profil med falske likes for at forvirre. – Forvanskning er altid et problem. Men Big Data-modellen er faktisk ligeglad, for det viser bare en adfærd. Computere har den fordel, at de ikke nærer fordomme. Den finder bare mønstre. På en måde kan du sige, at det bare skaber en tredje mening
Michal Kosinski, ekspert i computere og psykologi
Big Data ændrer samfundets spilleregler
Han kalder selv perspektiverne i sådanne analyser for rimeligt skræmmende.
– Jeg vil ikke overdrive på det her punkt, men det her får en kæmpe effekt på vores samfund og vores liv. Big Data handler ikke om teknik – det er en skarpladt pistol. Det handler om den måde, vi tænker vores samfund, demokrati og politik på, siger Michal Kosinski.
Han peger på, at mobiltelefonen i sin tid ændrede vores tilværelse og samfundets spilleregler.
Facebook ved alt – også det vi vil skjule
Forskere har vist, at de kan bruge Big Data-teknologien på Facebook til alene ud fra brugernes likes at spotte karaktertræk som race, intelligens, forbrug af alkohol, cigaretter og narkotika, politisk overbevisning, seksuel og religiøs interesse – også selv om brugerne ikke selv har ønsket at få den information frem.
Prøv selv: Gå ind på hjemmesiden YouAreWhatYouLike.com og log ind med din Facebook-profil.
Læs den videnskabelige artikel om Big Data på Facebook i det amerikanske tidsskrift Proceedings of the National Academy of Sciences of the United States of America, PNAS.
I et digitalt samfund er mulighederne for at samle begrundet og sandsynlig viden om os alle sammen nærmest uendelige. Tænk bare på de data, der ligger i logning af mobiltelefoner, elektroniske patientjournaler, biler med ip-adresse og gps-informationer, geografisk information om huse, rejser og meget andet, sociale netværk, indkøb på nettet foruden de klassiske data om klik på internettet og Google-søgninger. Alene supermarkedskæden Walmart registrerede sidste år 2,5 millioner gigabyte data om deres kunder om dagen.
Det er en moderne virkelighed, som vi må lære at leve med:
– Hvis du ikke vil rammes af Big Data, så er du nødt til at lukke hele dit moderne liv ned. Men jeg har nu stor tiltro til, at vi kan holde vores vestlige regeringer til ansvar for, hvordan det bruges. På samme måde tror jeg, at virksomheder som Google og Facebook vil holde sig tilbage, fordi misbrug af deres data vil genere deres forretning, siger Michal Kosinski.
Men Big Data vil også blive et våben i borgernes hænder.
– Det giver dybest set magten til individer. Du kan jo bygge en model, der kan detektere bøsser. En gaydar ligesom en radar, der kan forudsige om ens venner er homoseksuelle. Den slags kan i den yderste konsekvens føre til eksempelvis selvmord, siger Michal Kosinski.