Què són els deepfakes i com es poden detectar?
Els deepfakes són vídeos creats o modificats gràcies a un tipus d’Intel·ligència Artificial (IA) anomenat aprenentatge profund (deep learning) fins a aconseguir que semblin reals. Aquesta tecnologia permet generar imatges falses des de zero o modificar àudios per crear el que es coneix com a ‘clons de veu’, amb els quals sembla que figures públiques pronunciïn declaracions que en realitat mai han dit.
Com es generen?
Investigadors universitaris i especialistes en efectes especials estan arribant cada vegada més lluny en el camp de la manipulació de vídeo i imatges. Una de les millores més importants ha estat el face swaping o intercanvi de cares. En primer lloc, es processen milers de fotogrames de la cara de dues persones a través d’un algoritme d’IA anomenat codificador (encoder). El encoder aïlla i aprèn les similituds entre les dues i les redueix a les seves característiques comunes compartides, comprimint aquestes imatges. Un segon algoritme d’AI, anomenat descodificador (decoder), recupera les cares a partir de les imatges comprimides. Per realitzar l’intercanvi dels editors només han d’introduir les imatges codificades en el descodificador contrari, així el resultat és un que els trets d’una cara apareixen en l’altra.
Hi ha un segon mètode anomenat Xarxa Generativa Antagònica, o GAN. Una GAN enfronta dos algorismes d’IA: el primer -generador- s’alimenta de soroll aleatori i el converteix en una imatge. Aquesta imatge sintètica s’afegeix a un flux d’imatges reals -d’un famós, per exemple- que s’alimenten en el segon algoritme, conegut com discriminador. A el principi, les imatges sintètiques no s’assemblaran en res a les cares, però si el procés es repeteix moltes vegades (amb retroalimentació sobre el rendiment) tant el discriminador com el generador milloren. Si es realitzen suficients cicles d’assaig i error, aquest generador començarà a produir rostres totalment realistes en situacions inexistents.
Per a què serveixen
Segons l’empresa d’intel·ligència artificial Deeptrace el 96% dels deepfakes detectats a la Xarxa eren pornogràfics i el 99% d’ells mostraven rostres de famoses.
No obstant això es tem que puguin ser utilitzats cada vegada més en estafes i en campanyes de desinformació. El passat mes de març, el cap de la filial britànica d’una empresa energètica alemanya va transferir gairebé 220.000 euros a un compte bancari hongaresa després que un estafador li cridés amb una imitació de la veu de el director general, que se sospita va elaborar amb un clon de veu. S’ha informat que estafes similars han utilitzat missatges de veu gravats de WhatsApp.
Quina tecnologia és necessària
És difícil aconseguir un bon deepfake amb un ordinador estàndard. La majoria es creen en equips de gamma alta amb potents targetes gràfiques o amb potència de computació en el núvol. Això redueix el temps de processament de dies i setmanes a hores per aconseguir resultats sofisticats. Encara que també es necessita experiència, sobretot per retocar els vídeos acabats i reduir el parpelleig i altres defectes visuals. Dit això, cada vegada hi ha més eines disponibles per ajudar a la gent a fer deepfakes.
Com es desemmascara 1 deepfake?
Les falsificacions de baixa qualitat són fàcils de detectar. La sincronització dels llavis sol ser dolenta o el to de la pell irregular. Els detalls més precisos, com el moviment de cabells, són particularment difícils de reproduir. Joies o dents mal reproduïts també poden ser un senyal, a l’igual que els efectes de llum estranys, com la il·luminació inconsistent i els reflexos en l’iris.
D’altra banda, els governs, les universitats i les empreses tecnològiques estan finançant la investigació per detectar els deepfakes més sofisticats. El mes passat es va llançar el primer Deepfake Detection Challenge, recolzat per Microsoft, Facebook i Amazon. A més, Facebook acaba de prohibir els deepfakes que puguin induir els espectadors a pensar que algú “digui paraules que en realitat no ha dit”, de cara a la propera elecció presidencial dels EUA el 2020.