Termenul „Big Data” (traducere mot-a-mot ar fi Date Mari sau Masive) a devenit omniprezent în spațiul online. Este adesea asociat cu subiecte despre inovație, viitorul pieței muncii și inteligența artificială (AI). Zeci de evenimente și conferințe sunt organizate aproape zilnic la acest subiect, în timp ce aproape fiecare platformă de învățare online are un curs dedicat Big Data.[1] Conceptul Big Data este deseori descris ca un instrument care va ajuta societatea să soluționeze provocări majore, precum încălzirea globală, securitatea energetică sau combaterea sărăciei.[2] În același timp, există numeroase îngrijorări care ne vorbesc despre faptul că utilizarea Big Data poate fi considerată o amenințare la adresa vieții noastre private și la slăbirea în general a cadrului de protecție a drepturilor omului.
Deci, ce este big data? | Exemplu |
„Big Data” este termenul utilizat în mod obișnuit pentru a descrie volumul mare și în creștere de date generate de utilizatorii unor servicii sau dispozitive precum și tehnicile analitice avansate utilizate pentru a analiza aceste date.[3] | Ori de câte ori folosim un smartphone, ceas digital sau o tabletă care are senzori capabili să înregistreze informații, anumite date privind modul de utilizare al acestei tehnologii de către noi sunt create ca și produs secundar. Un exemplu ilustrativ al ceea ce este Big Data ar fi fluxul zilnic de informații depersonalizate generate de dispozitivul Apple Watch de la utilizatorii săi din întreaga lume (timpul, frecvența sau modul de utilizare, etc) |
Așa dar, Big data înseamnă....informații, de regulă despre noi, adunate și analizate împreună, pentru a genera anumite concluzii, și mai nou! pentru a prezice cu exactitate anumite informații despre comportamentul nostru în viitor, de exemplu: care va fi cel mai bine vândut produs în perioada sărbătorilor de iarnă? sau: ce cuvinte trebuie să includă anunțul de publicitate pentru a atrage atenția lui X?. Cu ajutorul Big Data, statele și corporațiile sunt capabile să nu doar să analizeze deprinderile, dar să prezică și chiar să manipuleze comportamentului oamenilor într-un grad fără precedent.[4]
Big data și Algoritmii
Pentru a procesa Big Data, este necesar un set specific de abilități, de obicei compuse din instrucțiuni matematice și programe software care analizează aceste seturi de informații prin intermediul unor instrucțiuni, cunoscute sub numele de „algoritmi”.
__________________________________
Un algoritm este definit ca un set de instrucțiuni care este dezvoltat pentru a ne ajuta în luarea unei decizii și prezintă o soluție pentru sortarea unor seturi de date foarte mari care nu pot fi înțelese pur și simplu de către ființe umane sau care ar necesita o cantitate enormă de timp și resurse. Cel mai simplu algoritm lucrează după exemplu „dacă / atunci” (if/then).
___________________________________
Big data este așa-numitul „combustibil” pentru algoritmi. Algoritmul analizează datele existente și ne ajută să trasăm anumite concluzii. În sectorul financiar, algoritmii deja „ajută” ofițerii de creditare să evalueze riscurile de credit pentru crearea unor previziuni financiare (Va putea X să plătească creditul la timp?).[5] Pe de altă parte, de exemplu în domeniul medical, algoritmii asistă personalul medical în procesul de diagnosticare al anumitor maladii (de exemplu: suprapunerea a mii de ultrasonografii pentru a depista elemente comune ale unei maladii).[6]
Așadar, utilizarea Big Data ne poate ajuta să automatizăm anumite procese care anterior ne puteau lua foarte mult timp și resurse. În același timp, dacă nu sunt construite corect, acestea pot înrădăcina sau crește inegalitățile și promova discriminarea, mai ales având în vedere că cei care sunt cel mai expuși la evaluarea prin sisteme automate ar putea fi de fapt cei mai vulnerabili din societatea noastră. Un exemplu ilustrativ în acest sens poate fi explicat cu ajutorul unui studiu celebru realizat in 2003, întitulat: „Sunt Emily și Greg mai angajabili decât Lakisha și Jamal?”.[7] În această cercetare, autorii au realizat un experiment pentru a măsura discriminarea rasială pe piața muncii. Fiecărui CV identic după conținut i se atribuia fie un nume din punct de vedere sonor tipic afro-american (de exemplu: Jamal), fie un nume sonor tipic „alb” (de exemplu: Greg). Rezultatele au arătat o discriminare semnificativă împotriva persoanelor afro-americane, care deși prezentau un CV identic, primeau de două ori mai puține invitații la interviul de angajare. Astfel, un algoritm care ar permite screening-ul automat al unui număr mare de CV-uri pentru angajare, dacă include în calitate de criteriu de triere numele persoanei, locul nașterii persoanei, sexul sau vârsta, poate crea o situație gravă de discriminare.
Big Data – implicații pentru drepturile omului și sistemul justiției
Cu toate riscurile pe care le comportă, în special pentru protecția vieții private și alte drepturi ale noastre, Big Data poate totuși ajuta factorii de decizie să ia decizii „corecte”, dacă sunt construite corespunzător. Introducerea „Big Data” în sistemul justiției poate ajuta la detectarea și reducerea anumitor criterii subiective, precum și la reducerea apariției erorilor sau chiar la detectarea prejudecăților.[8] De exemplu, anumiți factori externi, (precum foamea!) pot influența rezultatul unui proces judiciar. Într-un studiu realizat în Israel în 2011 în baza a 1.112 hotărâri judecătorești, cercetătorii au stabilit că procentul de decizii favorabile pentru reclamanți scade treptat de la 65% la aproape zero de la începutul zilei de lucru și până la pauza de prânz și revine brusc la 65% după pauza de masă. Rezultatele studiului ne arată că hotărârile judecătorești pot fi „influențate” de anumite variabile care nu ar trebui să aibă nicio legătură cu motivarea sau probele administrate pe caz.[9] Acest exemplu, deși în niciun caz nu sugerează ca judecătorii să fie înlocuiți cu roboții sau algoritmi inteligenți, ilustrează că sunt necesare anumite mecanisme care să prevină sau să limiteze la maxim factorul uman sau alte erori care „nu pot fi văzute cu ochiul liber”, dar pot fi detectabile de Big Data.
Există încă un caz în care cercetătorii au utilizat Big Data și algoritmii pentru a construi un sistem care prezice acuratețea rezultatului cazurilor judecate de Curtea Europeană a Drepturilor Omului cu o precizie de 79%.[10] Sarcina cercetătorilor a fost de a prezice dacă un anumit articol al Convenției a fost încălcat, având în vedere dovezi textuale extrase dintr-un caz. Printre concluziile cercetătorilor se numără faptul că secțiunea „fapte” a unui caz prezice cel mai bine decizia curții, în al doilea rând, că conținutul descris al unui caz este un indicator important dacă va exista o încălcare a unui anumit articol al Convenției sau nu.[11]
Aplicațiile Big Data pot deveni o realitate pentru sectorul public și, în special, pentru sistemul judiciar. Instanțele judecătorești au capacitatea și competența de a colecta, stoca și prelucra o cantitate mare de informații. De exemplu, numărul total al cauzelor înregistrate in instanțele de judecată din Moldova depășește 200.000 dosare anual.[12] Aceasta poate reprezenta elementul de volum de informații Big Data. Crearea unei infrastructuri de Big Data poate ajuta sistemul justiției să detecteze informații și caracteristici noi despre sistemul de justiție, inclusiv să ajute la detectarea și diminuarea riscurilor de corupție.
Aplicațiile Big Data ajută foarte mult în eficientizarea procesului de monitorizare a respectării drepturilor omului, concluziile fiind importante pentru stabilirea priorităților de intervenție la nivel de politici publice. În același timp, există potențial pentru ca aplicațiile Big Data și algoritmurile să dezvolte mecanisme de prevenție a drepturilor Omului. De exemplu, analiza datelor a fost deja utilizată pentru a prezice și preveni conflictele sociale și cele ale încălcărilor drepturilor omului în urma unor evenimente cum ar fi alegerile sau izbucnirea unui conflict militar.[13]
Așa-dar, Big-data, prezintă atât beneficii, cât și riscuri pentru protecția drepturilor omului și sectorul justiției. De aceea, este foarte important ca utilizarea AI să fie reglementată, pentru a asigura utilizarea maximă beneficiilor și reducerea posibilă a riscurilor.
Principii și etica de utilizare Big Data
Din cercetările efectuate, Big Data este încă o zonă gri, lipsită de o reglementare adecvată. La nivelul țărilor ONU, comunitatea internațională a fost chemată să îmbrățișeze un set de principii în legătură cu utilizarea Big Data. Acestea includ principiile responsabilității, transparenței, calității, predictibilității și securității. Principiul responsabilității oferă identificarea responsabilităților, procesul decizional și, după caz, identificarea factorilor de decizie; Transparență înseamnă cerința de a prezenta ce se întâmplă în interiorul unui algoritm, când și cum se prelucrează datele noastre personale înainte ca acestea să fie accesibile publicului. Un alt principiu este posibilitatea utilizării unor algoritmi „deschiși” care pot fi evaluați de către terți. Un alt principiu, calitatea, reprezintă garanții minime ale calității datelor și prelucrării. Nu cel din urmă, principiul securității, cere măsuri adecvate din partea dezvoltatorilor de algoritmi și big data pentru a împiedica scurgerile de date și faptul că anumiți algoritmi să fie utilizați neautorizat.[14]
Comitetul de Miniștri al Consiliului Europei a elaborat o recomandare pentru statele membre cu privire la impactul sistemelor algoritmice asupra drepturilor omului – Recomandarea CM/Rec(2020)1 of the Committee of Ministers to member States on the human rights impacts of algorithmic systems. În cadrul Consiliului Europei a fost creat Comitetul Ad-Hoc cu privire la AI (Ad hoc Committee on Artificial Intelligence (CAHAI)). CAHAI are mandatul să examineze fezabilitatea și elementele potențiale, în baza consultărilor largi a diverșilor subiecți, a unei reglementări juridice pentru dezvoltarea, designul și aplicarea inteligenței artificiale, în baza standardelor Consiliului Europei cu privire la drepturile oului, democrație și statul de drept.
La ce ne putem aștepta în viitor?
Algoritmi puternici alimentați de Big Data pot chiar la un moment dat chiar să înlocuiască luarea deciziilor umane în multe domenii ale vieții noastre. Acest lucru, deși are unele beneficii de eficiență, comportă și multe riscuri. De aceea instrumentele de evaluare algoritmică, nu trebuie totuși considerate ca fiind singurul factor în luarea unei decizii. Acestea pot ajuta oamenii la luarea deciziilor, dar nu ar trebui să înlocuiască oamenii în toate domeniile vieții noastre. Iar pentru a ajuta, utilizarea instrumentelor de evaluare algoritmică necesită o reglementare clară atât la nivel național, cât și interațional.
Poți afla mai multe despre Big Data și modul în care ar putea fi utilizate pe aceste platforme:
Coursera.org: https://www.coursera.org/courses?query=big%20data
Lynda.com: https://www.lynda.com/search?q=big+data
Kenneth Cukier, ‘Big Data is better data’, (Ted talks, 2014): https://www.youtube.com/watch?v=8pHzROP1D-w
Acest articol face parte dintr-o serie de publicații non-academice realizate de Centrul de Resurse Juridice din Moldova (CRJM) în cadrul proiectului „Program de capacitare în drepturi digitale” susținut de Centrul Internațional pentru Drept non-profit (ICNL). Opiniile exprimate aparțin CRJM şi nu reflectă în mod necesar poziția ICNL.
______________________________________________
[1] Printre altele: <https://www.coursera.org/courses?query=big%20data>; <https://www.lynda.com/search?q=big+data
[2] Kenneth Cukier, ‘Big Data is better data’, (Ted talks, 2014) <https://www.youtube.com/watch?v=8pHzROP1D-w>.
[3] Raportorul Special al ONU privind dreptul la viață privată „Promovarea și protecția drepturilor omului: întrebări privind drepturile omului, inclusiv abordări alternative pentru îmbunătățirea utilizării efective a drepturilor omului și a libertăților fundamentale’ A/72/43103 [36].
[4] Report of the United Nations High Commissioner for Human Rights „The right to privacy in the digital age” (2018) A/HRC/39/29
[5] Amir E. Khandani, Adlar J. Kim, Andrew W ‘Consumer Credit Risk Models via Machine-Learning Algorithms’
[6] Tim Adams ‘The robot will see you now: could computers take over medicine entirely’ 29 July 2018 The Guardian < https://www.theguardian.com/technology/2018/jul/29/the-robot-will-see-you-now-could-computers-take-over-medicine-entirely>
[7] Bertrand Marianne, Mullainathan Sendhil, ‘Are Emily and Greg More Employable than Lakisha and Jamal? A Field Experiment on Labor Market Discrimination’ (2003) <http://www.nber.org/papers/w9873>
[8] Anna Sagana Dr. Mario Senden ‘Big Data in the courtroom: Bug or Feature?’ Maastricht University <https://www.maastrichtuniversity.nl/sites/default/files/6_big_data_in_the_courtroom_bug_or_feature.pdf.
[9] Shai Danziger, Jonathan Levav and Liora Avnaim-Pessoa ‘Extraneous factors in judicial decisions’ 2011 Apr 26; 108(17): 6889–6892.< https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3084045/>
[10] Aletras N, Tsarapatsanis D, Preoţiuc-Pietro D, Lampos V. ‘Predicting judicial decisions of the European Court of Human Rights: a Natural Language Processing perspective. PeerJ Computer Science 2:e93 <https://doi.org/10.7717/peerj-cs.93> (2016)
[11] Ibidem
[12] Agenția de administrare a instanţelor judecătoreşti (AAIJ), raport 2019 privind examinarea cauzelor în instanța de judecată https://aaij.justice.md/files/document/attachments/RAPORT%20ANALIZA%20STATISTICA%202019%20final%20%281%29.pdf.
[13] Galit A. Sarfaty „Can big data revolutionize international human rights law?” https://scholarship.law.upenn.edu/jil/vol39/iss1/3/
[14] Raportorul Special al ONU privind dreptul la viață privată A/72/43103