În primăvara acestui an am livrat un curs de guvernanță a datelor, de două zile, la un client mare din zona Enterprise. Au fost două zile intense, cu exerciții, discuții, scenarii și probleme ridicate. La acest client am descoperit faptul că datele erau conforme cu cerințele unui program matur de guvernanță a datelor, dar era loc serios de îmbunătățire la modul în care erau folosite. Erau colectate corect, prioritizate, securizate, analizate dar se putea face mult mai mult cu ele. Mulți bani, adică…
Contextul internațional.
„Data is the new gold” – acesta este titlul discursului comisarului european Neelie Kroes din 2011. Acest titlu a fost rostogolit de atunci, a ajuns în jdemii de prezentări corporate și articole Ernst & Young, Forbes, World Economic Forum. Peste tot în lume se fac investiții masive în centre de date, în cercetarea datelor, în inteligență artificială. Americanii au o strategie agresivă în această direcție, în Emirate se construiesc centre de date care să bubuie consumul de la 1GW (astăzi) la 3.3GW în următorii cinci ani.
OECD, organizația la care România bate la ușă, are criterii foarte clare de guvernanță a datelor, toate țările civilizate au înțeles necesitatea unor strategii de date digitale care să poată arhiva informațiile cheie dar care să și crească organizațiile ce le folosesc pentru a le transforma în organizații data-driven. Pe scurt, vorbim de o exuberanță a țărilor în organizarea datelor digitale. Nu și în România.
Dezastrul carpato-danubiano-pontic.
Istoric vorbind, în teritoriile ce s-au aflat în Imperiul Habsburgic, urmat de cel Austro-Ungar, datele aveau o foarte mare valoare. De aceea românii din Ardeal își pot găsi detaliat arborele genealogic, de aceea există cadastru, arhive cu taxele plătite de fiecare familie și de fiecare firmă etc. Datele austro-ungare au fost „farmacie”, și chiar și în ziua de astăzi istoricii români sapă prin arhivele vieneze după anumite informații. În teritoriile aflate sub stăpânire sau suzeranitate țaristă sau otomană, nu se punea mare preț pe date. De aceea există mari probleme cu cadastrul în aceste zone ale României și efortul de refacere a informațiilor cadastrale este unul de durată. Arborele genealogic al familiilor vlahe este greu de stabilit, doar familiile boierești au beneficiat de așa ceva. Pe scurt, avem o mare problemă cu disciplina colectării, organizării, analizei și arhivării datelor.
Anii ’90 au venit ca o a doua șansă pentru România. Noile firme au beneficiat direct de cele mai moderne tehnologii, PC-uri, servere, rețelistică. În anii ’90 s-au pus primele baze de date mari moderne, aplicații peste aceste baze de date, automatizări ale serviciilor de salarizare, operațiuni, industriale etc. Din păcate, însă, pentru multe organizații cam acolo s-a oprit evoluția.
De șapte ani echipa Tudor Galoș Consulting face consultanță în domeniul datelor – guvernanță a datelor, protecție a datelor și guvernanță de inteligență artificială. Lucrăm cu peste 200 de clienți din lumea întreagă și pot spune cu mâna pe inimă că dezastru în date ca în România nu prea am văzut. Mai puțin pe la corporații, care vin cu cultura cascadată de afară, mai mult pe la firmele mici, medii și mari românești. Am promis că voi scrie o carte odată, cu povești din domeniul datelor românești.
Cultura datelor încă nu există.
Da, producem și consumăm cu toții date. Facem mail-uri, excel-uri, documente word, prezentări. Facem analize folosind unelte de vizualizare, facem calcule, facem strategii, proiecte, totul bazându-ne pe date. Poate vă întrebați ce se întâmplă cu aceste date… vă spun eu: de cele mai multe ori, nimic. Zac în diverse directoare, de cele mai multe ori locale, unde se „strică”. Partea mișto este că nici măcar nu documentăm ce facem, deseori văd sisteme schimbate și nu se știe când, cum, „hai să îl întrebăm pe Ionică”.
Datele intră în firme din multiple surse: internet, email, medii optice, senzori, sisteme ce produc date. De cele mai multe ori aceste date nu sunt corecte, nu sunt etichetate, nu sunt securizate. Intră și „poluează” sisteme. Să vă dau un exemplu: vine clientul Ion Popescu și cumpără în magazin o girafă să zicem. I se creează un cont pentru că Ion Popescu va cumpăra mâncare pentru girafă tot de la magazin. Dar Ion Popescu intră online pe site-ul magazinului de unde cumpără mâncare, nu mai vrea să meargă la magazin. Ați ghicit, i se creează alt cont. Girafa se îmbolnăvește și Ion Popescu sună la hotline, unde se salvează conversația audio. Ați ghicit, nu este legată de vreunul din cele două conturi. Domnul Ion Popescu trimite un email către suport, mâncarea pentru girafe are alt gust și vrea să facă plângere. La fel, email-ul rămâne pe server-ul de email, nelegat de vreunul din cele două conturi.
Directorul general al firmei cere marketing-ului să facă o analiză a datelor să vadă căror clienți ar putea să le vândă un nou suc pentru girafe. Datele îi spun că clienții de girafe nu cumpără nimic după ce iau girafa, dar sunt unii clienți ce cumpărau mâncare de girafe (pentru cine?) după care renunțau fără explicații la ea. Ei bine, scalați acest dezastru la sute de mii de clienți, milioane de produse și veți înțelege cam ce văd eu.
Eram odată la o discuție de business unde explicam importanța guvernanței datelor, iar potențialul client îmi explica de ce nu vrea să investească în așa ceva. Și îl sună un furnizor ce nu mai știa ce ofertă îi trimisese, dacă era draft sau final. Despre asta vorbim – nu știm pe ce versiuni lucrăm.
Vrem AI dar nu avem cu ce.
La fiecare curs de business de AI explic că AI-ul are o vechime de 70 de ani. Cred că vă dați seama că în 70 de ani au existat totuși niște best practice-uri generate pe această planetă. De exemplu, faptul că ai nevoie de date organizate – etichetate, cu ownership clar, liniaritate, evoluție, disponibile ca produse de date (data as a product), corecte, integre, formatate corect (8/6 poate să însemne ceva diferit pentru europeni sau americani), consistente în toate sistemele etc. Nu ai cele de mai sus, nu ai AI.
Îmi povestea cineva că la o firmă au pus un model lightweight de ChatGPT să le indexeze toate politicile și procedurile ca angajații să poată pune întrebări ce să facă în diverse situații – de exemplu, cum cer concediu? Problema era că dacă puneai aceeași întrebare de trei ori, primeai trei răspunsuri diferite. AI-ul funcționa perfect, dar în politici și proceduri se tratau situații similare diferit. O procedură spunea ceva, o alta venea și o contrazicea. Calitatea datelor era dezastruoasă.
Teoretic, dacă ai tot istoricul firmei tale, venituri, contracte, negocieri, documente plus informațiile publice de la Institutul Național de Statistică, datele istorice de vreme, evenimente, politică, condiții economice etc poți construi un model destul de solid de forecast financiar care să îți spună cum o furtună în Teleorman îți poate afecta cashflow-ul. Noi avem aceste date dar ele nu sunt organizate deloc. Și organizarea lor este un efort gargantuelic.
Supraviețuirea României depinde de date.
Estonia s-a digitalizat complet pentru ca în cazul unei invazii rusești țara să poată continua să existe, chiar dacă doar virtual. Sistemele funcționează și dacă țara ar fi ocupată complet – emite certificate de naștere, deces, căsătorie, se colectează taxe, se plătesc salarii, tot. Totul ar funcționa și poporul ar continua să existe.
Revenind la istorie, în istoria României există o perioadă de câteva sute de ani despre care se știu foarte puține lucruri. Repet: sute de ani de blanc. De aceea există teorii privind formarea poporului român, migrarea către Transilvania, dinspre Transilvania, dinspre sudul Dunării – teorii care pe viitor ar putea fi „explicația” pentru care statul român ar putea fi desființat de o mare putere. S-a mai întâmplat, nu?
Și atunci este nevoie de o Românie digitală. De date organizate, structurate, etichetate etc. Luate toate datele din sistemul public și integrate rapid în cloud-ul guvernamental, odată ce sunt curățate. Așa se face digitalizare la scară largă: cu date curate, etichetate, organizate, cu responsabilități clare pe fiecare set de date.
Și aici vine conflictul cu securiștii: dacă aceste date ar fi curățate, nimic nu ar împiedica un DIICOT să zicem să pună un algoritm AI de fraud detection pe toate aceste date. S-ar vedea instant fiecare mizerie făcută de politicieni, securiști, oameni de afaceri, tot.
Conflictul se acutizează întrucât cheia spre reorganizarea sistemului public din România o constituie fix curățarea datelor. Ca să se știe fiecare instituție ce face, fiecare departament, fiecare om. Ca să știi ce vrei să optimizezi, trebuie să știi cine ce face dar și cine ce a făcut. Viitorul României aici se joacă.
Securiștii nu vor asta și ceva îmi spune că ce scriu eu aici este bine conștientizat inclusiv la nivelul trădătorilor de țară care încearcă să se opună acestui curent: România riscă să dispară cu totul dacă această inițiativă va fi oprită. Fiindcă, well, fără date nu putem dovedi nimic. Nici măcar că existăm sau că am existat.
2 comentarii Adaugă comentariu
Adevarat 100%, in fosta oranduire, cat si cea actuala, datele erau si sunt disponibile doar unor oameni ai sistemului. Transparenta nu a fost, si in mare parte nu este dorita de catre sistem. Prea multe „coincidente” si sinecuri ar fi vizibile cu ochiul liber chiar si pentru un ochi neavizat.
Secretizarea averilor mai bate inca un cui in acest cosciug plutitor pe care il numim barca…pardon, stat de drept.
Problema era că dacă puneai aceeași întrebare de trei ori, primeai trei răspunsuri diferite.
Nu prea suna a problema, suna a angajat la stat, deci este antrenat fix pe stilul nostru – aceeasi intrebari pusa de mai multe ori, primesti raspunsuri diferite :))