Dades per minimitzar la mala sort


Carles Pont

Lluís Vicent
Director del Postgrau Online en Data Management de la UPF-BSM

El data manager ha de ser l'assistent del director general d'una empresa, que li expose de manera clara els pros i contres de cada decisió amb el rigor que li han donat les dades

data management

Dades, futur, decidir. O dit d'una altra manera, anàlisi de dades, probabilitat i teoria de jocs. Això és el resum de com moltes empreses, com els gegants Amazon, Google o Facebook estan treballant diàriament, i com sembla que acabarà treballant qualsevol empresa d'ací a pocs anys.

Fins ara, les persones que han excel·lit als mons dels negocis o de la guerra han sigut persones amb gran intuïció, persones capaces de veure més enllà del que altres amb les mateixes observacions i experiències veien. I a més d'això, han tingut la sort que altres intuïtius no han tingut. Hui en dia, la immensa quantitat de dades que estem generant i que estan capturant moltes empreses i governs està canviant el paradigma. La sort ja no és tan important, perquè quan maneguem grans volums d'informació el que fem és minimitzar la mala sort.

Poc li importa a un equip comercial enviar una campanya de màrqueting directe a un 20% de persones que no estan en absolut interessades en el producte, si en canvi arriben a un 80% de persones que sí que n'estan d'interessades.

Les dades hui en dia constitueixen la fotografia, la radiografia, el diagnòstic... Que ens descriu la realitat: la realitat en un determinat moment o en el passat.

Imaginem el cas d'una campanya electoral. Les dades de Facebook (i això ha passat en el famós escàndol de Cambridge Analytica en les eleccions que va guanyar Trump, i segur que no és l'únic cas), ens poden donar una projecció bastant acurada sobre si una persona fins a aquell moment, ha votat a un partit o a un altre. I també ens pot dir quines persones no es decanten clarament per cap partit.

L'anàlisi de dades ens pot donar aquesta informació amb forta fiabilitat, i a ningú importarà, si l'objectiu final és guanyar unes eleccions, que aquesta segmentació de persones s'haja equivocat en un 5% dels observats. Però això no implica que les persones que fins aquell moment hagen votat un partit, continuaran segur votant aquell partit. O que els indecisos no s'acaben decantant per un partit o un altre. Com sempre recorde als meus estudiants, els bancs sempre ens avisen que "rendibilitats passades no garanteixen rendibilitats futures".

Les dades hui en dia constitueixen la fotografia, la radiografia, el diagnòstic... Que ens descriu la realitat: la realitat en un determinat moment o en el passat

Ací entra la projecció de futur. Ací entra la probabilitat. El futur ningú el sap. Quan ens van confinar el mes de març, semblava lògic que les empreses d'internet: Amazon, Google, Zoom, pujaren el seu valor en la borsa, però si haguérem estat segurs hauríem posat tot el nostre patrimoni en elles, i no crec que ningú ho férem. Tanmateix, la probabilitat ens indica que bona és una aposta. En el cas de la covid i les tecnològiques l'argument és la lògica, però en un règim estable, on no hi ha grans canvis, el passat és el millor que tenim per predir el futur (probabilísticament, clar).

En l'exemple de les eleccions, pot ser que amb les dades històriques i amb certes argumentacions lògiques, calculem que la probabilitat que els que fins aquell moment havien votat esquerra tornen a votar esquerra, és d'un 80%, i que la probabilitat que els indecisos voten esquerra és un 40%, i que la probabilitat que els de la dreta canvien a l'esquerra és d'un 10%.

Amb aquestes dades, si som el partit de l'esquerra, hem de decidir quines accions fem per maximitzar el vot a l'esquerra. Ací entra la tercera pota fonamental: la decisió, i per tant, la teoria de jocs, o l'art de decidir rigorosament. La teoria de jocs ens diu quina és la nostra millor decisió en un determinat moment amb la informació que tenim. La teoria de jocs tindrà en compte què fa l'enemic: en aquest exemple: el partit de la dreta. Calcularà les probabilitats que té el partit de la dreta d'aconseguir vots, i les accions que pot fer per aconseguir-los. I ens farà fer la jugada òptima per maximitzar (sempre probabilísticament) el nostre benefici, o disminuir el benefici del rival si és una competició de només dos partits.

Un data manager ha de ser una persona que domine aquests tres camps. Ha de ser el cervell que dissenye tot el recorregut des de la generació i captació de dades fins a la decisió final. Ha de ser l'assistent del director general d'una empresa, que li expose de manera clara els pros i contres de cada decisió amb el rigor que li han donat les dades.

De moment el data manager és una persona, però ja hi ha tecnologia que pren decisions automàticament, decisions a hores d'ara, encara no vitals per a una empresa. Futur inquietant, on sembla que cap activitat rutinària, ni física ni intel·lectual, vaja a ser realitzada per éssers humans. Tema que dóna peu a molts articles prospectius.

.