Agregacija podataka i ugrožavanje privatnosti

Agregacija podataka

Tumačenje pojma agregacija podataka (Eng. data aggregation) nije jedinstveno, niti jednostavno. Jedan od razlog za neunificirano objašnjenje pojma jeste raznolikost konteksta u kojima se agregacija podataka može odvijati. Najopštije definisano, ovaj proces predstavlja svrstavanje sakupljenih podataka u skupove i podskupove. Konkretnije, agregaciju podataka imamo kod statističkih istraživanja i njihovih prikaza. Svakodnevno preko medija dobijamo ekonomske podatke o prosečnom nivou zarade, stopi inflacije, ceni prosečne potrošačke korpe ili o rastu trenda nezaposlenosti. Pored toga, informacije o nekoj specifičnoj grupi ljudi i njihovim karakteristikama (npr. godine starosti, navike, zaposlenost, prosečni nivo zarade) nastaju složenim procesima prikupljanja, analiziranja, validiranja i sistematizacije podataka. To znači da u procesu istraživanja najpre mora da se odredi prostor ili grupa koja se istražuje, zatim da se dođe do podataka, da se podaci sakupe, obrade i pre analiziranja i prezentovanja, oni moraju da se svrstaju u određene kategorije, tačnije skupove. Očigledno, da bi se došlo do statističkih prikaza, postupak agregacija mora biti izvršen. Svakako, savremena agregacija podataka ima višestruki značaj, između ostalog i za naučne i poslovne svrhe.

Agregacija podataka u poslovne svrhe

Savremene kompanije teško da bi mogle da povećaju sopstvenu konkurentnost bez agregacije poslovnih podataka. U poslovnom okruženju podaci se eksponencijalno uvećavaju. Njihovo sakupljanje i obrada jesu veliki izazov, a dalja sistematizacija utiče na njihovu upotrebnu vrednost. Procene poslovnog rizika i efektivnosti zavise od obrade podataka, kao i njihove pravilne agregacije. Treba imati u vidu da blagovremeni i tačni finansijski izveštaji (ako je moguće i u realnom vremenu) ne predstavljaju puko ispunjavanje zakonskih obaveza, već i rezultat poslovanja koji može proaktivno da utiče na savladavanje potencijalnih poslovnih problema, na rast baze klijenata i povećanje profitabilnosti.

Gotovo je svima koji koriste Internet poznato da reklame koje se pojavljuju na društvenim mrežama i različitim veb stranama neretko imaju nekakve veze sa nama. Koliko to možda čudno bilo, komercijalne poruke koje nam se upućuju mogu biti prilagođene našim potrebama. Svakako da bihevioralni marketing (koji može da se smatra novom naučnom granom, poslovnom strategijom, delom primenjene psihologije, ili sve to zajedno) služi za detekciju obrazaca ponašanja i za pomoć u izboru marketinških strategija. Njegova suština jesta da se marketing ne svede na puko nagađanje šta kupci žele. No, sofisticirane tehnologije koje služe za povećanje prodaje robe i usluge preko Interneta koriste i strategije na bazi agregacije podataka o potencijalnim konzumentima. Preko Interneta dobijamo ponude određenih vrsta roba i usluga iako ranije nismo pokazali bilo kakvo interesovanje za njih. Štaviše, uzimajući u obzir naše godine, mesto gde živimo ili čime se bavimo, ponuđena roba i usluge mogu da nam deluju jako interesanto. Obradom naših ličnih podataka (godine starosti, prebivalište i profesija) nove tehnologije profilišu potencijalne kupce. Drugim rečima, nas kao potencijalne konzumente nove tehnologije svrstavaju u specifične skupove potrošača kojima se nudi određena roba i usluge.

Grupisanje podataka po srodnosti može da se izvrši po različitim kriterijumima. Podataka ima mnogo i kao što smo već spomenuli, jedan od najvećih savremenih izazova jeste njihovo svrstavanje i povezivanje. Činjenica jeste da su naši lični podaci razbacani svuda po Internetu i to nije neka novost. Velike kompanije koriste naše podatke u najrazličitije svrhe, ali nam i nude podatke putem velikog spektra usluga. Najočigledniji primer jeste Gugl koji pruža usluge elektronske pošte, skladištenja i obrade dokumenata, veb pretraživanje, mape, praćenje lokacija, društveno umrežavanje, deljenje audio i video materijala i drugo što može biti u interesu korisnicima na Internetu. Pružanjem svojih usluga Gugl dobija pristup ličnim podacima, prikuplja ih i vrši njihovu agregaciju prema određenim kriterijumima. Svako ko ima ikakvog iskustva sa Guglovim uslugama može da pretpostavi da je jedan od najvažnijih kriterijuma za agregaciju podataka zapravo sam korisnik usluga. Drugim rečima, naši podaci se grupišu u jedan skup, a onda se razvrstavaju u različite podskupove. Time se stvara sadržaj generisan po korisniku (user-generated content). Ovakav pristup za agregaciju podataka jeste osnova za profilisanje klijenata. Profilisanje svakako olakšava korišćenje usluga i povećava njihov kvalitet. Jednostavno, agregacija podatka utiče sa jedne strane na usavršavanje poslovne arhitekture privrednih subjekata, a sa druge strane običnim konzumentima roba i usluga najjednostvanije rečeno – olakšava život. U neku ruku to zvuči sjajano! No, kada se razmotri problem zaštite privatnosti korisnika onda situacija i nije tako sjajana.

Agregacija podataka i studije o kockanju

Da bi smo ukazali na problem zaštite privatnosti, a u vezi sa agregacijom podataka uzećemo u obzir kontekst kockanja, tačnije mere koje se tiču prevencije problematičnog kockanja. U februaru 2016. godine, pod pokroviteljstvom engleskih gradova Mančester i Vestminster, a u saradnji sa udruženjem lokalnih samouprava Velike Britanije objavljena je studiju o potencijalnim rizicima nastanka problematičnog kockanja u određenim geografskim oblastima. Cilj ove studije jeste da kreira indekse rizika problematičnog kockanja putem identifikacije kategorija stanovništva koje su izložene rizicima od nastanka problematičnog kockanja. Pored studije, deo projekta jeste i mapiranje geografskih oblasti u Vestminsteru i Mančesteru sa specifičnim rizicima problematičnog kockanja. Na osnovu postojećih izveštaja i studija zaključeno je da su mladi, lica koja žive u siromašnim područijima, građani koji spadaju u specifične etničke zajednice, lica sa pogoršanim mentalnim zdravljem, nezaposleni i lica koja traže tretman za odvikavanje od patološkog kockanja kategorije stanovništva sa povećanim rizikom od nastanka problematičnog kockanja. Činjenica je da je većina studija u vezi sa kockanjem kvanitativnog tipa kod kojih se posmatra određena pojava ili njen trend u istraživanim grupama (npr. univerzitetski studenti, nezaposlena lica, žitelji nekog naselja). Bez namere da detaljnije ulazimo u metodologije istraživanja, svakako da je agregacija podataka deo neophodne šire metodologije obrade podatka. No, šta se dešava kada se agregacija podataka kombinuje sa drugim metodologijama za procesuiranje podataka? Inutitivan odgovor bi bio da se time kompletira jedno istraživanje. Ipak, ostaje pitanje da li je gomilanje metodologija za obradu podataka zaista neophodno i svrsishodno?

Agregacija podataka i problem privatnosti

Gore spomenuta studija ima i svoju drugu dimenziju, koja može biti problematična sa aspekta zaštite privatnosti. Naime, ova studija pored toga što identifikuje rizike, ona ih i locira. Na teritorijama Vestminstera i Mančestera (pogledaj linkove) locirani su različiti rizici problematičnog kockanja. Neki od njih su okvirno locirani i tako predstvaljeni. Takav je slučaj sa rizikom problematičnog kockanja kod lica koja se kockaju kod kuće (People at home gambling risk index). No, radno sposobna ali nezaposlena lica (economically active but unemployed residents) i lica iz specifičnih etničkih grupa (residents form relevant ethnic groups) locirana su precizno tako da se fizička adresa lica iz ovih grupa stanovnika može pronaći bez većih problem. Pored toga, precizno su locirani objekti za smeštaj beskućnika, centri za zapošljavanje, kockarnice. Kombinacijom većeg broja rizika tako što se lociraju na mapi gradova, zatim vizuelno preklope i predstave dobijaju se informacije u kojim delovima grada postoji specifična koncentracija rizika.

Svakako da je naučno poželjno znati koji se rizici problematičnog kockanja preklapaju. Takođe, iz perspektive realizacija javnih politika, dobro je imati uvid u kojim delovima grada postoje rizici i problemi vezani sa kockanjem. Međutim, ovaj izveštaj ima karakter javnog dokumenta i dostupan je preko Inteneta. Postoji bojazan da ovaj dokument može da utiče na stvaranje negativne percepcije o nekom delu grada, nekoj etničkoj grupi ili osobama koje žive na određenoj adresi. Samim tim, postoji povećana opasnost od zloupotrebe naučnog istraživanja, stvaranja predrasuda i diskriminacije. Zbog ovih podataka neko bi mogao da ostane uskraćen za posao, zajam kod banke ili zdravstveno osiguranje jer  je prepoznat kao lice sa visokim rizikom nastanka problematičnog kockanja. Pored toga, život u „pogrešnom komšiluku“ stvara sumnju saradnje sa „pogrešnim ljudima“ (koji možda imaju sumnjivu prošlost), te i  verovatnoću da se posećuju „pogrešna mesta“. Takođe, u „pogrešnom komšiluku“ postoji strepnja da vaše dete pohađa školu ili pak uopšte zađe tamo. A upravo onemogućavanje prilike da se zađe u „pogrešan komšiluk“ možda utiče na normalni razvoj i socijalizaciju. U svakom slučaju puno je načina da se čitava naselja, porodice ili etničke grupe diskriminišu zahvaljujući dostupnosti podataka koji u ovom slučaju imaju naučni značaj.

Način na koji gore opisani projekat zadire u privatnost nije jedinstven. Naime određena vrsta analogije može biti napravljena sa vebliningom i redliningom. Reč je o etički jako spornim procesima obrade ličnih podataka od strane finansijskih institucija. Cilj ovih procesa jeste maprianje lokacija (npr. delovi grada) u kojima socijalno okruženje utiče na procenu finansijskih vrednosti. U praksi to znači da ukoliko imate nekretninu u određenom delu grada, njena vrednost pada ako u vašem komšilku živi određena etnička grupa. Pored toga, ako i vi živite u tom naselju možda ćete morati da prođete neuobičajeno detaljnu proveru lične solventnosti u procesu dobijanja pozajmice od banke.

Privatnost (ni)je mrtva

Ugrožavanje privatnosti putem novih tehnologija više nije tabu tema. Jasno je da već živimo u doba u kom je konvencionalni oblik privatnosti nestao. No, razvoj novih tehnologija i naučna dostignuća stvaraju nove načine kojima se zadire u privatnost. Na nama je da stvorimo etički diskurs u okviru koga možemo da diskutujemo novine koje imaju pozitivni značaj ali nose sa sobom potencijalne pretnje. Ovaj tekst je pokušao da ukaže na praktičnom primeru kako jedna tradicionalna naučna metodologija (agregacija podataka) uz pomoć savremenih tehnologija generiše impozantne rezultate, ali i probleme.

Photo: Map data ©2016 Google

Dušan Pavlović, LL.M. M.Econ.

Ekspert za onlajn kockanje, doktorski kandidat LAST-JD EM studija, master prava i master ekonomije

  • googleplus
  • linkedin