Ghicitoarea cartofilor prăjiţi: "like"-urile sociale spun mai mult decât crezi

Vă amintiţi primul deceniu al internetului, când era un loc static. Puteai să te conectezi, să cauţi pagini realizate fie de organizaţii care aveau echipe pentru asta, fie de persoane pasionate de tehnologie la acel moment. Odată cu popularizarea mediului social şi a reţelelor sociale la începutul anilor 2000, internetul s-a schimbat complet în ceva în care majoritatea conţinutului cu care interacţionăm este realizat de utilizatori obişnuiţi prin videoclipuri pe YouTube postări pe bloguri, recenzii de produs sau postări obişnuite. A devenit de asemenea un loc mai interactiv unde oamenii interacţionează unii cu alţii comentează, împărtăşesc, nu doar citesc.

Facebook nu e singurul loc unde poţi face asta, dar este cel mai mare, iar numerele vorbesc de la sine. Facebook are 1,2 miliarde de utilizatori lunar. Deci jumătate din populaţia conectată la internet foloseşte Facebook. E un site care, alături de altele, permite oamenilor să îşi creeze o identitate online necesitând puţine cunoştiinţe tehnice, iar oamenii răspund punând foarte multe date personale online. Așa că avem indicatori comportamentali, de preferinţe, demografici, pentru sute de milioane de oameni, ceva unic în istorie. Ca specialist în calculatoare, asta înseamnă că am putut crea modele care pot anticipa tot felul de atribute ascunse de care nici măcar nu ştiţi că oferiţi această informaţie. Ca oameni de ştiinţă, noi folosim asta pentru a ajuta modul în care oamenii interacţionează online dar există aplicaţii mai puţin altruiste şi există o problemă că utilizatorii nu înţeleg exact aceste tehnici şi cum funcţionează şi chiar dacă ar înţelege nu le-ar putea controla. Astăzi vreau să vă vorbesc despre câteva lucruri pe care le putem face şi apoi să avem idei despre cum putem merge înainte să redăm controlul utilizatorilor.

Aceasta e compania Target. Acel logo nu e pus degeaba pe pântecele acelei femei însărcinate. Poate aţi văzut anecdota printată în revista Forbes, unde Target a trimis un fluturaş acestei fetiţe de 15 ani cu reclame şi cupoane de biberoane, scutece şi pătuţuri de copii cu două săptămâni înainte să le spună părinţilor că este însărcinată. Tatăl a fost foarte supărat. A spus: "Cum şi-au dat seama cei de la Target că această liceană este însărcinată înainte ca ea să le spună părinţilor?" A reieşit că ei au istoricul cumpărăturilor pentru sute de mii de clienţi şi calculează un scor ce estimează sarcina, arătând nu doar dacă o femeie e însărcinată sau nu, ci şi care e data la care va naşte. Iar ei au estimat asta fără a accesa lucrurile evidente: dacă a cumparat un pătuţ sau haine de copil, ci dacă a cumpărat mai multe vitamine decât în mod obişnuit sau dacă a cumparat o geantă suficient de mare pentru scutece. Aceste cumparături nu par să dezvăluie prea mult, dar este un tipar comportamental care, raportat la mii de oameni, începe să însemne ceva anume. Asta facem noi când estimăm lucruri despre voi în mediul social. Căutăm modele de comportament care, fiind comune la milioane de oameni, ne ajută să aflăm tot felul de lucruri.

În laborator cu colegii mei am dezvoltat mecanisme prin care putem să estimăm lucruri cu acurateţe precum preferinţele politice personalitatea voastră, genul, orientarea sexuală religia, vârsta, inteligenţa, împreună cu lucruri precum cât de mult aveţi încredere în oamenii cunoscuţi şi cât de puternice sunt acele relaţii. Putem face foarte bine acest lucru. Şi, din nou, asta nu datorită informaţiei considerate evidente.

Exemplul meu favorit e în acest studiu publicat anul ăsta în Procedurile Academiilor Naţionale. Îl puteţi găsi pe Google. Are patru pagini – uşor de citit. Au luat în calcul doar la ce dau oamenii like, adică lucrurile care vă plac pe Facebook şi le-au folosit pentru a estima aceste atribute pe lângă altele. În lucrare ei au listat cele 5 like-uri care indică un grad înalt de inteligentă. Şi printre ele se afla like-ul la o pagină pentru cartofi prăjiţi. (Râsete) Cartofii prăjiţi sunt delicioşi, dar dacă vă plac, nu înseamnă neapărat că sunteţi mai deştept decât persoana medie. Cum se face că unul dintre cei mai puternici indicatori ai inteligenţei voastre este că daţi like la această pagină cu un conţinut total irelevant pentru atributul care urmează a fi estimat? Rezultă că trebuie să luăm în calcul o întreagă serie de teorii pentru a vedea de ce putem face asta. Una dintre ele e o teorie sociologică numită homofilie care spune că oamenii sunt prieteni cu oameni ca ei. Dacă eşti deştept, tinzi să fii prieten cu oameni deştepţi şi dacă eşti tânăr – cu oameni tineri şi ştim asta de sute de ani. Mai ştim multe despre cum se împrăştie informaţia prin reţele. Se pare că videoclipurile virale sau like-urile de pe Facebook sau alte informaţii sunt transmise exact în acelaşi fel în care se transmit bolile prin reţele sociale. Asta e ceva ce studiem de ceva timp. Avem modele bune pentru asta. Punem lucrurile astea la un loc şi vedem de ce se întâmplă astfel de lucruri. Dacă ar fi să vă dau o ipoteză, ar fi că un om deştept a creat această pagină sau poate că unul dintre primii care au dat like ar fi avut un punctaj mare la acel test. Iar acestuia i-a plăcut pagina şi prietenii săi au văzut şi datorită homofiliei ştim că are prieteni deştepţi, astfel s-a transmis şi lor, iar câtorva le-a plăcut, iar ei la rândul lor au prieteni deştepţi, astfel că s-a transmis şi lor şi aşa s-a propagat prin reţea către oamenii deştepţi, iar în final acţiunea de a da like la cartofi prăjiţi e un indicator de inteligenţă, nu datorită conţinutului ci pentru că acţiunea de a da like reflectă atribute comune ale altor oameni care au făcut asta.

Destul de complicat, nu? Este greu de explicat utilizatorului mediu şi chiar dacă ar fi posibil, ce ar putea face el în privinţa aceasta? Cum poţi şti că ai dat like la ceva care indică o trăsătură a ta care e irelevantă prin conţinutul care ţi-a plăcut? Utilizatorii nu au puterea de a controla modul cum sunt folosite aceste date. Văd asta ca o problemă reală ce avansează.

Cred că există anumite soluţii pe care să le analizăm dacă vrem să dăm control utilizatorilor cu privire la utilizarea datelor, pentru că nu vor fi întotdeauna folosite în beneficiul lor. Dau adesea un exemplu: dacă o să mă plictisesc vreodată de a fi profesor, voi crea o companie care estimează toate aceste atribute, lucruri despre cât de bine lucraţi în echipă, dacă sunteţi dependent de drog sau alcoolic. Ştim cum să estimăm toate astea. Intenţionez să vând rapoarte companiilor de HR şi marilor afaceri care vă angajează. Putem face asta acum. Pot începe această afacere chiar mâine şi nu aţi avea absolut niciun control asupra faptului că folosesc astfel datele. Asta mi se pare o problemă.

O cale pe care o putem alege e calea politicii şi a legii. În anumite privinţe, cred că aceasta ar fi cea mai eficientă, dar problema e că ar trebui să o facem. Observarea procesului politic în acţiune mă face să mă gândesc că e puţin probabil să avem câţiva reprezentanţi care să înveţe despre asta şi apoi să adopte schimbări radicale în proprietatea intelectuală în SUA, astfel încât utilizatorii să controleze datele.

Am putea alege calea politică unde companiile sociale mediatice spun "Ştiţi ceva? Aveţi propriile voastre informaţii. Aveţi control total asupra modului în care sunt folosite." Problema este că modelele de venit pentru majoritatea companiilor sociale mediatice se bazează într-un fel pe împărtăşirea sau exploatarea datelor utilizatorilor. Uneori se spune despre Facebook că utilizatorii nu sunt clienţii, ei sunt produsul. Deci cum faci o companie să redea controlul asupra principalei sale proprietăţi utilizatorilor? E posibil, dar nu cred că e ceva care o să se schimbe rapid.

Cred că cealaltă cale pe care o putem alege şi care va fi mai eficientă este cea a ştiinţei. Practicarea ştiinţei ne-a permis să dezvoltăm aceste mecanisme de a calcula aceste date personale în primul rând. Ar trebui să facem o cercetare similară dacă dorim să dezvoltăm mecanisme care să-i poată spune unui utilizator "Acesta e riscul pe care ţi l-ai luat cu această acţiune" Dând like la acea pagină de Facebook, sau împărtăşind această informaţie personală, mi-ai îmbunătăţit capacitatea de a prezice dacă foloseşti droguri sau dacă te simţi bine la locul de muncă. Iar acest lucru consider că poate afecta dacă oamenii doresc sau nu să împărtăşească ceva, să păstreze privat sau pur și simplu să nu-l pună online. Putem observa şi lucruri ca cel de permite oamenilor să codifice informaţiile pe care le încarcă astfel încât să fie invizibile şi inutile pentru site-uri precum Facebook sau terțe servicii care le accesează, dar să selecteze utilizatorii care au acces la ele. Asta-i o cercetare foarte interesantă dintr-o perspectivă intelectuală, astfel că cercetătorii vor fi dispuşi s-o intreprindă. Asta ne dă un avantaj în faţa căii legale. Una dintre problemele menționate este: "dacă oamenii încep să îşi păstreze toate datele personale private, aceste metode pe care le dezvoltaţi ca să le deduceţi caracteristicile vor eşua." Iar eu răspund: "Absolut, iar pentru mine, acesta e un succes, deoarece, ca om de ştiinţă, scopul meu nu e să deduc informaţii despre utilizatori, ci să îmbunătăţesc modul în care oamenii interacţionează online. Uneori asta implică deducţia unor lucruri despre ei, dar dacă utilizatorii nu vor ca eu să folosesc acele date, cred că ar trebui să aibă dreptul să facă asta. Vreau ca utilizatorii să fie informaţi şi de acord cu instrumentele pe care le realizăm.

Cred că a încuraja acest tip de ştiinţă şi a sprijini cercetătorii care vor să redea o parte din acel control utilizatorilor şi să îl ia de la companiile sociale mediatice, înseamnă a înainta, odată cu evoluția şi progresul acestor mijloace, înseamnă că vom avea o bază de utilizatori educată şi în control şi toți suntem de acord că asta-i modalitatea ideală de a merge înainte.

Ghicitoarea cartofilor prăjiţi: „like”-urile sociale spun mai mult decât crezi