Per citar aquesta publicació

Mejía Reinoso, Joffre (2023) "La mort de l’autor? L’adveniment de la intel·ligència artificial en l’audiovisual", Ab Origine Magazine, 90 (desembre) [en línia].

La mort de l’autor? L’adveniment de la intel·ligència artificial en l’audiovisual

Publicat el 15 de desembre de 2023

Portada: Il·lustració creada per Chikorita mitjançant IA “Midjourney as it imagines itself, image generated by Midjourney v4 using the prompt: Midjourney –v 4”. Font: Chikorita, CC BY-SA 4.0, Wikimedia Commons, domini públic.

La intel·ligència artificial en la cultura popular

La primavera o època daurada de la intel·ligència artificial té una història recent que data dels anys 40 del segle XX, però si més no la podem trobar en l’imaginari humà ja des del mite antic de Talos l’Ars Magna de Ramon Llull el 1275. Sobretot en la seva variant negativa, la IA ha estat un tema recurrent dintre de la cultura popular, des del Frankenstein de Mary Shelly (1818), a l’encunyament del terme «robot» a R.U.R. de Karel Čapek (1920); així com al cinema de ciència-ficció, des de Metròpolis (F. Lang, 1927), 2001: una odissea de l’espai (2001: A Space Odyssey; S. Kubrick, 1968), Tron (S. Lisberger, 1983), Jocs de guerra (War Games; J. Badhman, 1983), I.A. ( A.I.; S. Spielberg, 2001), Her (S. Jonze, 2013) o la més recent MEGAN (2023). Sempre sobre la idea de la super-màquina o la màquina-pensant que podria dominar la raça humana.

La novetat que sorgeix en els temps més recents però, amb les noves eines repercuteix en la producció mateixa de la creació, en el nostre cas d’estudi, en els films o l’audiovisual, fora del món diegètic que es podria narrar al metratge. És a dir, el recurs temàtic del tropos que en el seu moment es plantejava com el futur -dins de la pantalla-, avui dia és cada vegada més real i amb unes conseqüències no menys rellevants.

Les “intel·ligències artificials” i les seves aplicacions

Però què és exactament la intel·ligència artificial? Segons l’IBM (International Business Machines Corporation), es tracta de l’ús dels ordinadors i màquines per mimetitzar les capacitats per resoldre problemes i fer decisions, pròpies de la ment humana. Cal que diferenciem les diferents intel·ligències artificials existents i els seus potencials usos en el context més immediat que ens afecta. Primer de tot, la intel·ligència a la qual ens referim -la que pot convertir-se en amenaça per l’autoria- es troba dins d’un subgrup conegut com a generative AI, que alhora és dins del conegut deep learning, i que es diferencia del machine learning. El primer actua d’una manera més o menys autònoma, sense supervisió, mentre que el segon tipus necessita intervenció humana per “entrenar” al model o màquina.

És en els models generatius (generative models) on trobem que s’ha detingut més l’atenció popular, donada la seva capacitat de difusió per xarxes socials i altres medis. Es tracten de models d’aprenentatge profund (deep learning), que agafen dades sense processar (raw data) i “aprenen” a generar resultats estadísticament probables, però diferents de les dades originals. Per exemple, es podria “alimentar” un model generatiu amb pel·lícules o fotogrames de Tim Burton, perquè finalment processés una imatge amb una estètica semblant al director nord-americà.

Aquestes primeres incursions que tenen el seu auge arran del 2018 i 2021, es mouen dins del format curt de vídeo i en data de 2023 es troben en un primer estadi d’aprenentatge (AI training). Sorgeix la possibilitat que hom es pregunti quina serà la reacció dels cineastes i creadors audiovisuals davant la constant millora d’aquesta intel·ligència. En la indústria dels blockbusters i del capitalisme pur, es veurà com una opció viable per a abaratir costos? Recalquem que encara ens trobem en un primer nivell, on continua regint una curiositat innata per part dels usuaris de crear la foto més hiperrealista, de crear un text-a-imatge (text-to-image) només amb la introducció d’una instrucció (prompt), o que un programa s’«inventi» una partitura, entre altres ocurrències.

*“Aquest gat no existeix” imatge d’un gat generat a partir de bases de dades.* Font: Flickr, CC BY 2.0 DEED, Wikimedia Commons, domini públic.

La intel·ligència artificial és i serà una de les eines amb més potencial de la nostra societat, i independentment de les creacions autònomes d’imatges o vídeos, són moltes més les seves aplicacions les que podrien ajudar-nos com a societat: des de millores en el reconeixement de veu, visió computacional, aplicacions als serveis d’atenció al client, detecció precoç de malalties, i moltes més.

Les primeres incursions de la IA en l’audiovisual

Són moltes les eines que en els darrers anys han proliferat en matèria de creació i manipulació d’imatges i text: a partir de la posada en marxa de l’empresa OpenAI amb Dall-E i Dall-E 2, fins al ja famós ChatGPT (amb les seves diferents versions); la millora en els programes ha estat tal que l’usuari que ho desitgi pot generar fragments de vídeos a partir del text introduït (Midjourney; Gen-2, etc..). Malgrat les possibles variants que podria tenir cada programa, la més recent generative tool -plugin dins d’Adobe Photoshop (2023)- és sens dubte una de les més reveladores: l’usuari pot triar una imatge de base i seleccionar de la mateixa les parts que desitgi, i generar contingut parcial o totalment amb el text indicat. Aquesta pràctica d’experimentació aplicada a escenes de films per exemple, permetria a l’usuari generar un ambient circumdant hiperrealista, que si més no distorsionaria la visió original de la composició que podria tenir el càmera i el director.

*Imatge promocional de Dall-E 2.* Font: Trusted Reviews, CC BY-NC-ND 4.0 DEED, Wikimedia Commons, domini públic.

Un dels recents exemples, categoritzat dintre del format curt, és The Frost (2023), de J. Rubin, on s’ha fet ús de Dall-E per generar imatges, convertides posteriorment en fotogrames i en últim pas en petits fragments de vídeo. El resultat final és el d’uncurtmetratge d’animació que perfectament podria simular una creació convencional “feta per persones”.

Per això mateix, serà necessari el replantejament legislatiu al voltant de les imatges-síntesi. En l’època de la «desinformació» i del poder de les imatges de la pantalla global en el que s’ha convertit el món, totes les imatges són susceptibles de ser deepfakes. Tal com indica el Portal Lingüístic de la Corporació Catalana de Mitjans Audiovisuals, els deepfakes és una tècnica informàtica de manipulació audiovisual que permet crear vídeos ficticis però molt realistes, sovint amb l’objectiu de desinformar o difamar.

I és que ja no només en el món audiovisual, però en l’àmbit periodístic on els usuaris esperem llegir fets constatables, necessàriament s’hauran d’establir mètodes de verificació per saber si un text, una imatge, un vídeo o un arxiu sonor són originals (amb autoria) o si s’han generat amb la intervenció de la IA. De fet a Wikimedia Commons, s’adverteix que una imatge generada amb IA pot ser de domini públic, però que com és basa es una quantitat ingent d’imatges no es pot verificar la seva autoria.

Res més lluny de la ficció, l’ús de la IA ja és present fins a un cert punt en la indústria contemporània. Malgrat que en internet es poden trobar innombrables exemples, és rellevant que esmentem la utilització d’aquest de material aplicat en la recent sèrie Secret Invasion (A; Selim, Disney/Marvel Studios, 2023), on a partir d’una sèrie d’imatges generades per ordinador, l’equip de Method Studios aconsegueix concebre una seqüència que representa els temes de la trama.

Així mateix, The Safe Zone(IA, 2023) és un dels primers curtmetratges dirigits per una IA; a través de ChatGPT es va formular un guió, unes directrius artístiques i una llista d’atrezzo per l’equip de producció. Dintre del camp d’imatges-síntesi, és a dir, de creació autònoma per part de la IA però fent ús de bases de dades, tenim /IMAGINE(Anna Apter/IA, 2023) un curt on es reflexiona sobre la solitud.

*Imatge promocional de la sèrie Black Mirror.* Font: CC BY-NC-ND 4.0 DEED, Wikimedia Commons, domini públic.

Endinsant-nos en el camp de l’audiovisual narratiu son diversos els exemples que podem destacar que facin al·lusió a l’auge de la I.A. Comencem esmentant el capítol 01 de la sisena temporada de Black Mirror, «Joan és horrible» (Joan is awful; A. Pankiw, 2023), on una treballadora de recursos humans en una empresa tech, rep les instruccions d’acomiadar a un membre de l’equip. Aquesta mateixa nit, en el seu domicili després sopar descobreix un nou serial en la plataforma fictícia de streamberry titulat «Joan és horrible» i que per a la seva sorpresa, és una versió dramatitzada de la seva vida amb Salma Hayek com a protagonista, que passa pels mateixos esdeveniments que hi hauria viscut la Joan nº1 que coneixem. Poc després descobreix que Joan va acceptar a aquesta extorsió mitjançant l’acceptació dels “termes i condicions” de la plataforma, per la qual es podrien infiltrar en el seu dispositiu mòbil i mitjançant algoritmes de comportament fer ús de la seva vida. El contingut generaria mitjançant un ordinador quàntic els successos que considerés més dramàtics del dia, sense intermediació d’un director. Després d’una sèrie de pertorbadores accions per cridar l’atenció de Hayek, la qual havia cedit la seva imatge-avatar digital a la companyia, el duo femení es disposa a destruir el computador central de la companyia. En la seva incursió escoltem a la CEO afirmar que aquest tipus de contingut personalitzat és el futur i que “Abans haguéssim trigat mesos a produir una sèrie així, i ara és en minuts”.

*Vaga de guionistes, actors i treballadors de la industria cinematogràfica, manifestant-se per condicions justes i regulacions sobre l’ús de la intel·ligència artificial, maig 2023.* Font: Fabkek, CC BY-SA 4.0, Wikimedia Commons, domini públic.

El segon exemple il·lustrador, és el capítol 9 «Whose show is this?»; (J. Gao, 2023) de la sèrie Hulka (Marvel Studios), on la protagonista Jennifer Walters -desconcertada per veure el desenllaç que estava tenint la seva sèrie- decideix trencar la quarta paret i anar a la recerca del productor Kevin Feige. Irrompent en l’estudi, descobreix que Feige és l’acrònim de K.E.V.I.N. (Nexus de coneixement i millora visual interconnectats) i que es tracta d’una I.A. que controla tot l’Univers Cinematogràfic de Marvel (MCU), creant les narratives necessàries a partir d’algorismes sofisticats.

Aquests exemples que comentem són del tot pertinents, donat que posen sobre la taula una certa crítica que ja es pot sentir en l’ambient de la indústria i de la qual són conscients (vagues de guionistes al maig del 2023). Els dos capítols esmentats comparteixen tropos presents en pel·lícules i sèries del mateix gènere sobre l’avanç de «la màquina», però incidint en la creació sense autor associat, pressuposada, molt en línia amb la societat de l’híperconsum que busca un contingut personalitzat que li sedueixi, i allunyat de la idea de màquina-robot.

El context de la pantalla global i l’hipermodernitat

Una de les problemàtiques afegides, pròpies de la hipermodernitat com l’entenen Gilles Lipovetsky, Jean Serroy, o més específicament Paul Virilio, és la celeritat amb la qual sorgeixen aquestes noves eines i les actualitzacions constants que es publiquen al mercat (literalment una cada setmana). Mirant l’aspecte creatiu, preguntem-nos, podrà l’IA eventualment crear contingut audiovisual amb un cert grau d’originalitat? Quines repercussions a curt termini poden tenir aquestes noves eines? És precís consensuar que la intel·ligència artificial, no és immanent a l’audiovisual ni molt menys. Com la «nova ontologia» de la imatge digital (principis dels anys 2000), la IA s’entén en un context molt major i que en certa manera es podrà aplicar al procés d’assemblatge d’un film o producte audiovisual. És ineludible tenir en compte el gran pes que tenen els mateixos usuaris de la xarxa, compartint mitjançant xarxes socials els seus resultats i incitant que altres curiosos provin de fer-ho. Però com ja hem comentat, en un marc més global, s’està aplicant la IA a tot tipus d’àmbits i indústries, des de la salut, a les ciències i a l’enginyeria.

I el rol de l’autor, on queda?

Fins ara i des dels anys 50, l’autoria cinematogràfica no és quelcom que hagi estat explícitament en debat. Des d’Alexandre Astruc i la seva idea de la «caméra-stylo» (Ecran français, nº144, 1948), on el director podia “escriure amb la càmera” com un escriptor ho faria amb la ploma; al conegut article del crític André Bazin la “Politique des auteurs” (Cahiers du Cinéma, nº70 1957), on en un film es podia fer ús del factor personal com un criteri de referència, autoria i cinema han anat des de llavores de la mà. I és que assumir que una pel·lícula ha estat feta per un director o directora, on mitjançant un anàlisi del seu corpus filmogràfic es pot constituir un estil o autoria, no és quelcom nou.

*Autors com Fritz Lang, Alfred Hitchcock o Nicholas Ray van ser els autors que més influència van tenir en la crítica de Cahiers du Cinéma, afavorint la idea de “cinema d’autor”* Font: Willem van Bergen , CC BY 2.0, Wikimedia Commons, domini públic.

Com abordarà la societat i les institucions aquest tipus de material aparentment sense autor. És a dir, com es configurarà el dispositiu estètic-artístic exterior al film. A qui s’atribuirà l’autoria? L’usuari i les eines usades seran coautors?

Per intentar justificar la importància de la nostra reflexió -podria morir l’autor en l’audiovisual?- cal que constatem que la idea “d’autor” ha sigut una de les concepcions més importants de la modernitat. La noció d’autor constitueix el moment més important de la individualització en la història de les idees, dels coneixements, de les literatures (…) (FOUCAULT, ¿Què és un autor? , 10-11). Aquest tipus de contingut en aparença original no deixa de beure d’una base de dades on es reuneix els diferents «focus de cultura» de la societat, on s’aprecia la mort de l’autor.

L’any 1967 Roland Barthes publicava el seu breu, però sumptuós assaig sobre la mort de l’autor, on ens indicava que l’autor és un personatge modern, produït indubtablement per la nostra societat, en la mesura que aquesta, en sortir de l’edat mitjana i gràcies a l’empirisme anglès, el racionalisme francès i la fe personal de la reforma, descobreix el prestigi de l’individu (…) de la “persona humana” (BARTHES, El susurro del lenguaje, 66. La imatge de la literatura que trobem en la cultura comuna, indica Barthes, té el seu centre en l’autor i la seva història, els seus gustos, les seves passions. I és que evidentment la figura d’aquest s’esvaeix, i s’elimina el factor creativitat que podria aportar, que en el fons -diu Michel Foucault- també mira necessàriament d’influències o cites anteriors.

Eina autònoma o col·laborativa?

Torna a sorgir la pregunta sobre quina seria la manera correcta de referir-se a aquesta mena de «creacions», a partir de quin punt de síntesi una imatge o text podria considerar-se de creació pròpia, i quan, només una mera imatge digital més? Els ordinadors no extreuen la imatge del no-res, sinó que es recolzen en una infinita mirada de models: algoritmes o convencions socials de representació. És a dir, està reprenent i aplicant al camp audiovisual a Roland Barthes i la mort de l’autor, on un text és un espai de múltiples dimensions en el qual es concorden i es contrasten diverses escriptures a partir de diferents focus de cultura, i cap de les quals és l’original.

Sabrem fer ús de la intel·ligència artificial com a una nova eina, o pel contrari, serà la causa de la mort de l’autor i de la individualitat creativa?

Per saber-ne més

BAECQUE, A (2003). «La Política de los autores: Manifiestos de una generación de cinéfilos». Barcelona, Paidós.

BARTHES, R (1987). «El susurro del lenguaje». Barcelona, Paidós.

CAUGHIE, J (1981). «Theories of Authorship». Londres: Routledge.

DOUGLAS HEAVEN, W. ARTIFICIAL INTELLIGENCE. «Welcome to the new surreal. How AI-generated video is changing film». MIT Technology review. 2023. https://www.technologyreview.com/2023/06/01/1073858/surreal-ai-generative-video-changing-film/

FOUCAULT, M (2010). «¿Qué es un autor?». Buenos Aires, Ediciones literales.

JULLIER, L (2004). «La Imagen digital: De la tecnología a la estética». Buenos Aires, La Marca.

LIPOVETSKY, G., SERROY, J (2009). «La Pantalla global: Cultura mediática y cine en la era hipermoderna». Barcelona: Anagrama.

SARRIS, A (1970). «El Cine norteamericano: Directores y direcciones: 1929-1968». México; Barcelona, Diana.

Serveis lingüístics de la UOC. «Consideracions sobre la intel·ligència artificial i la traducció automàtica». https://blogs.uoc.edu/elearning-innovation-center/ca/consideracions-sobre-la-intel%c2%b7ligencia-artificial-i-la-traduccio-automatica/ 23 d’octubre de 2023.

Joffre Alejandro Mejía Reinoso

(Equador, 1999). Graduat en Història de l'art (UB) i Màster en Estudis Avançats en Història de l'art (UB). Expert en difusió del Patrimoni Digital (Diploma U.N.E.D.) i especialitzat en Història del cinema. Actualment, està escrivint la seva tesi doctoral sobre el panorama del cinema en l'era audiovisual i cursant un MBA en Arts & Culture management (Rome Business School) amb una beca d'excel·lència acadèmica.

View all posts