Articulos
Jacob Bañuelos-Capistrán 1
1 0000-0003-1919-7088. Tecnológico de
Monterrey, México.
jcapis@tec.mx
Recibido: 10/11/2023
Enviado a pares: 11/12/2023
Aceptado por pares: 12/02/2024
Aprobado: 29/02/2024
Para citar este artículo / to reference this article / para citar este artigo: Bañuelos-Capistrán, J. (2024). Inteligencia artificial y frontera: imagen generativa e imaginarios simbólicos México-Estados Unidos. Palabra Clave, 27(3), e2734. https://doi.org/10.5294/pacla.2024.27.3.4
Resumen
La presente investigación explora y analiza los imaginarios simbólicos visuales que generan cuatro programas de inteligencia artificial sobre la frontera México-Estados Unidos. La producción visual se realiza a partir de seis conceptos clave que emergen del tema general "Imaginarios simbólicos más relevantes sobre: muro, violencia, mujer, infancia, desigualdad y migración relacionados con la frontera México-Estados Unidos". Los programas de inteligencia artificial utilizados para producir las imágenes son Midjourney, Leonardo.ai, Stable Diffusion, Dall-E 2. Se utiliza una metodología experimental para definir los conceptos clave y los imaginarios simbólicos en la frontera de Estados Unidos y México a través de ChatGPT 3.5. Las imágenes se han obtenido traduciendo los conceptos escritos en texto a imágenes utilizando los programas de inteligencia artificial. Los programas de imagen generativa se conceptualizan a la luz de la teoría del aparato estético y la teoría de la visión poshumana. Las imágenes se analizan según la teoría de los imaginarios sociales, culturales y simbólicos. El análisis revela los sesgos ideológicos y tendencias estéticas en los imaginarios simbólicos y regímenes retóricos que se sintetizan visualmente sobre la frontera México-Estados Unidos a través de programas de producción de imágenes generativas; y construye una perspectiva sociopolítica crítica sobre tres aspectos principales: una conceptualización de los programas de imagen generativa como aparatos tecnoestéticos; una reflexión sobre los procesos creativos de construcción de discursos visuales producidos por dispositivos de inteligencia artificial; y un análisis de los sesgos ideológicos y estéticos de las imágenes, entendidas como objetos tecnoestéticos obtenidos a partir de esta tecnología de producción visual.
Palabras clave: Aparatos tecnoestéticos, frontera, imaginarios simbólicos, inteligencia artificial, México-Estados Unidos, sesgos ideológicos, visión poshumana.
Abstract
This research explores and discusses the visual symbolic imaginaries generated by four artificial intelligence (AI) programs regarding the Mexico-United States border. The visual production hinges upon six key concepts that emerge from the general theme: "Most relevant symbolic imaginaries of the wall, violence, woman, childhood, inequality, and migration related to the Mexico-United States border." The AI programs used to produce the images are Midjourney, Leonardo.ai, Stable Diffusion, and Dall-E 2. An experimental methodology defines the key concepts and symbolic imaginaries at the border between the United States and Mexico through ChatGPT 3.5. The images have been obtained by translating the written concepts into images using such programs. The generative image programs are conceptualized based on the aesthetic apparatus theory and the posthuman vision. The images are analyzed using the theory of social, cultural, and symbolic imaginaries. The analysis reveals ideological biases and aesthetic tendencies in the visually synthesized symbolic imaginaries and rhetorical regimes of the Mexico-United States border through generative image production programs. It also builds a critical-sociopolitical perspective on three main aspects: a conceptualization of generative image programs as techno-aesthetic apparatuses, a reflection on the creative construction processes of visual discourses produced by AI devices, and an examination of the ideological and aesthetic biases of the images understood as techno-aesthetic objects obtained from this visual production technology.
Keywords: Techno-aesthetic apparatuses; border; symbolic imaginaries; artificial intelligence; Mexico-United States; ideological biases; posthuman vision.
Resumo
Nesta pesquisa, são explorados e analisados os imaginários simbólicos visuais gerados por quatro programas de inteligência artificial sobre a fronteira entre o México e os Estados Unidos. A produção visual se baseia em seis conceitos-chave que emergem do tema geral "Imaginários simbólicos mais relevantes sobre muro, violência, mulheres, infância, desigualdade e migração relacionados à fronteira México-Estados Unidos". Os programas de inteligência artificial usados para produzir as imagens são Midjourney, Leonardo.ai, Stable Diffusion, Dall-E 2. Uma metodologia experimental é usada para definir os conceitos-chave e os imaginários simbólicos sobre essa fronteira por meio do ChatGPT 3.5. As imagens foram obtidas pela tradução dos conceitos escritos em texto para imagens usando programas de inteligência artificial. Os programas de geração de imagens são conceituados à luz da teoria do aparato estético e da teoria da visão pós-humana. As imagens são analisadas de acordo com a teoria dos imaginários sociais, culturais e simbólicos. A análise revela os vieses ideológicos e as tendências estéticas nos imaginários simbólicos e nos regimes retóricos que são sintetizados visualmente na fronteira entre o México e os Estados Unidos por meio de programas de produção de imagens generativas e constrói uma perspectiva sociopolítica crítica em três aspectos principais: conceituação de programas geradores de imagens como dispositivos tecnoestéticos; reflexão sobre os processos criativos de construção de discursos visuais produzidos por dispositivos de inteligência artificial; e análise dos vieses ideológicos e estéticos das imagens, entendidas como objetos tecnoestéticos obtidos a partir dessa tecnologia de produção visual.
Palavras-chave: Dispositivos tecnoestéticos; fronteira; imaginários simbólicos; inteligência artificial; México-Estados Unidos; vieses ideológicos; visão pós-humana.
La aparición de programas de inteligencia artificial (IA) para la producción visual desde 2022 ha propiciado un escenario donde se genera una relación entre creadores, analistas de información y capacidades de IA, con sus alcances y posibilidades para desarrollar conocimiento y creatividad en las artes y disciplinas creativas. Específicamente, en la producción de imágenes fijas y en movimiento, asistimos a la "normalización" del uso de programas generativos mediante modelos de difusión. Esta investigación explora características de producción simbólica visual sobre la frontera México-Estados Unidos, realizada por cuatro programas de IA, con el fin de analizar rasgos ideológicos y formales. El objetivo de este estudio es reconocer y analizar sesgos ideológicos y tendencias estéticas en imaginarios sociales y simbólicos de los programas Midjourney, Leonardo.ai, Stable Diffusion y Dall-E 2, sobre seis conceptos relacionados con la frontera: muro, violencia, mujer, infancia, desigualdad, migración.
Se construyó un andamiaje teórico-metodológico para comprender los programas generativos como aparatos tecnoestéticos (Déotte, 2012; Flusser, 2006; 2011), contextualizados en la teoría de la visión poshumana (Virilio, 1994; Zylinska, 2017; 2020; Celis, 2019; Ré et al, 2020; Burns, 2002); y para el análisis de los imaginarios simbólicos (Castoriadis, 1975; 1997; Durand, 1984) con perspectiva semiótica (Peirce, 1932) e iconológica (Panofsky, 1972). El enfoque de la presente investigación se construye a la luz de la teoría de los medios digitales, las humanidades y la semiótica.
Este análisis expone los imaginarios visuales sobre la frontera norte producidos por los programas de IA y construye una perspectiva sociopolítica crítica sobre la base de la conceptualización de los programas como dispositivos tecnoestéticos, los procesos creativos en discursos visuales de IA y un examen crítico-simbólico de sesgos en objetos visuales tecnoestéticos. El estudio contribuye a entender el impacto de la IA en la consolidación de arquetipos y representaciones visuales hegemónicas. Se inscribe en un campo incipiente con aportes en las humanidades digitales, los estudios visuales, la retórica visual y los estudios críticos de IA (Roberge y Castelle, 2021).
En seguida se conceptualizan los programas de imaginería generativa; se reflexiona sobre los procesos creativos en sistemas de IA; se realiza un análisis semiótico e iconológico de las imágenes, así como un análisis comparativo de los resultados visuales y sobre las relaciones entre el modelo de lenguaje ChatGPT 3.5 y los modelos de difusión empleados.
Programas de imaginería generativa
La imaginería generativa (Generative imagery) es un campo que emplea algoritmos y técnicas de aprendizaje profundo y automático para generar imágenes sintéticas. Tiene como base la creación algorítmica, en la que intervienen procesos matemáticos y reglas computacionales específicas, en lugar de métodos tradicionales. Involucra elementos de imprevisibilidad y sintetiza imágenes de manera estadística, estocástica, aleatoria y predictiva. La imaginería generativa es un campo interdisciplinario que integra áreas diversas como la informática, las matemáticas, el arte, el diseño, la ingeniería y la creatividad computacional. Autores como Wilde (2023) se preguntan si estamos ante un nuevo paradigma en la producción visual o solo ante un nuevo medio, una discusión que se debate en el estado del arte sobre el tema.
La aparición de plataformas de aprendizaje automático se intensificó en años recientes (Nilsson, 2010; Sudmann, 2018; Mitchell, 2019). Pero en 2022 vino una avalancha de programas para imágenes fijas y en movimiento, más allá de los laboratorios especializados. Comenzaron con tecnologías texto a imagen, como Dall-E 2, Stable Diffusion, Midjourney o Leonardo.ai, Adobe Firefly, Artbreeder, Deep Dream Generator; aplicaciones de texto a imagen en movimiento, como Gen-2, Runway ML, Wonder Studio, Stable Video Diffusion, Lens Go, Kaiber, W.A.L.T. Video Diffusion, Vids AI-Re-els Video Editor Alternatives, Creatus, PixVerse, Pika Labs, Veed.io, Gen-2 by Runway, Synthesia.io, Lumen5, Muse.ai o Raw Shorts; y aplicaciones para generar texto, como ChatGPT, Claude.ai, Bing, Bard (Singh y Rath, 2023; Yang et al., 2022).
La trayectoria histórica de las tecnologías por aprendizaje automático o imaginería IA o imaginería generativa se remonta a antes de 2022 (Wilde, 2023). Incluye la transición de un modelo de clasificación-generación (2012-2015), GAN (2015-2020) a modelos contemporáneos de difusión (2020-presente). Estos usan aprendizaje profundo multimodal, combinando técnicas de procesamiento de lenguaje natural (PLN) y visión computarizada (Wilde, 2023; Miller, 2019; Bajohr, 2023; Offert, 2022; Dobson, 2023; Sudmann, 2018).
Los modelos de difusión para generar imágenes, como Dall-E 2, Midjourney, Leonardo.ai y Stable Diffusion, son IA avanzada que utilizan aprendizaje profundo para crear nuevas imágenes. Cada uno tiene un enfoque ligeramente distinto, pero todos pueden generar imágenes únicas a partir de texto (prompt) o una imagen. Un prompt es una instrucción que se da a un modelo de inteligencia artificial, que puede ser con base en un lenguaje, para guiar su salida o comportamiento. Estos prompts o instrucciones pueden ser de texto, imágenes, voz u otros datos, según el modelo. Al proporcionar prompts adecuados, los usuarios instruyen la salida del modelo de IA para diversas tareas como generación de texto, traducción, análisis o generación de imágenes, entre otras (Bach et al., 2022; Lou et al., 2023; Wu et al., 2020; Lian et al., 2023).
Algunos términos asociados a la imaginería generativa son: arte generativo, deepfake o ultrafalso, IA generativa, imagen generada por IA, imagen sintética, IA-imagénesis (Ervik, 2023). Los modelos de difusión operan de acuerdo con principios estocásticos y estadísticos. La imagen se modifica gradualmente en pasos iterativos. En cada paso, el modelo realiza un pequeño cambio aleatorio a la imagen actual, dirigido por una red neuronal previamente entrenada en imágenes. La red neuronal decide cómo alterar la imagen en cada paso de difusión. A través de cientos o miles de cambios estocásticos, el modelo transforma una imagen inicial aleatoria (típicamente ruido) en una imagen final y refleja una descripción o imagen objetivo. Los modelos de difusión representan un dominio de investigación activo (OpenAI, 2023a; Heaton, 2018; Sauer et al., 2023).
En resumen, los programas de imaginería generativa están revolucionando la creación y consumo de imágenes. Tienen riesgos, como difusión de información falsa o contenidos delictivos, pero también potencial para usos benéficos, como fines educativos y creativos (Bañuelos, 2022).
Los programas generativos de imágenes como dispositivos tecnoestéticos
La rápida emergencia de programas generativos de imágenes, entendidos como aparatos tecnoestéticos, ha dejado un vacío conceptual sobre su significado en un contexto sociocultural desde la perspectiva de las humanidades. Desde 2022, prolifera la producción de imágenes por una amplia variedad de creadores en múltiples ámbitos, ante el poder productivo de la IA y la inquietud sobre el futuro laboral en numerosos gremios. Simultáneamente, enfrentamos un vacío legal sobre cuestiones éticas, violación de derechos de autor, desinformación con contenidos falsos y delitos como suplantación de identidad o pornografía no consentida, en una sociedad con una alfabetización mediática insuficiente, vulnerable ante un régimen algorítmico capitalista sin regulación (Zuboff, 2020). En este contexto emergen estos nuevos aparatos tecnoestéticos.
Conceptualizamos aquí los programas de imágenes generativas y de IA como aparatos tecnoestéticos, de acuerdo con Déotte (2012) y Flusser (2006; 2011). Para Déotte, un aparato estético es una configuración técnica que produce una nueva sensibilidad. Déotte analiza el papel de la tecnología en la experiencia estética. Un aparato estético trasciende la noción de máquina, siendo un sistema complejo con usuarios, objetos y entorno. No solo producen objetos, sino también experiencias que permiten percibir el mundo de formas nuevas. Déotte identifica varios aparatos estéticos clave, como la perspectiva, el museo, el cine, la fotografía y el psicoanálisis. Estos moldean la experiencia estética y alteran formas de ser, estar y hacer en el mundo (2012, pp. 12-139). Desde esta perspectiva, los programas de IA e imágenes generativas también son aparatos tecnoestéticos que producen una sensibilidad, un reparto de lo sensible (Rancière, 2009) y nuevas relaciones entre usuarios, objetos y entornos.
Flusser (2006; 2011) concibe los aparatos estéticos como dispositivos técnicos que influyen en pensamientos y acciones y crean nuevas representaciones conceptuales, con dimensión política. Por vez primera estamos frente a un aparato al que se pueden dictar descripciones textuales de imágenes y, sin mayor intervención de un operador humano, obtener una imagen, en una suerte de ekphrasis inversa. Los aparatos tecnoestéticos de la IA vislumbran un nuevo régimen de producción de la sensibilidad y visualidad con una retórica digital cambiante.
Los programas generativos se emparentan con la visión artificial y la teoría de la visión poshumana (Virilio, 1994; Zylinska, 2017; 2020; Celis, 2019; 2020; Ré et al., 2020; Burns, 2002). La visión artificial que posibilita la generación computacional dialoga con la concepción poshumana de la visión, donde la máquina expande y configura capacidades humanas de ver (Virilio, 1994). Los modelos actuales operan bajo lógicas algorítmicas que Zylinska (2017; 2020) caracterizaría como visión posthumana. Varios críticos advierten sobre los riesgos de un régimen algorítmico capitalista desregulado, que presagia una deconstrucción del humanismo (Han, 2022; Zuboff, 2019; Harari, 2018; 2023).
Imaginarios sociales y simbólicos en la imagen generativa
Los imaginarios sociales y simbólicos se fundamentan en la memoria histórica, mediática, artística, cultural y pública compartida por una sociedad. Un imaginario social simbólico es una construcción sociohistórica con instituciones, normas y símbolos compartidos por un grupo, que opera en la realidad brindando oportunidades y limitaciones para los sujetos. No es una ficción, sino una realidad con consecuencias prácticas (Castoriadis, 1975). Para Castoriadis el imaginario social se conforma por imaginarios culturales y simbólicos. El imaginario cultural se compone de expresiones, tradiciones, creencias y prácticas culturales. El imaginario simbólico está integrado por signos, lenguajes, objetos, sonidos e imágenes, que construyen significados y permiten la representación de valores e ideas. Ambas dimensiones del imaginario social son fundamentales para la comprensión de su naturaleza y funcionamiento.
Los programas de imagen generativa se nutren de una vasta reserva de información, proveniente de una memoria histórica y colectiva alojada en sus bases de datos. Estos sistemas procesan datos mediante complejas operaciones de aprendizaje profundo y automático (deep learning y machine learning) para producir resultados visuales finales. La amplia gama de referencias textuales y visuales a las que tienen acceso estos programas está constituida por una selección específica de una inmensa base de datos, que recopila una porción de la memoria social digital almacenada en bases de datos e internet. En este sentido, Manovich destaca la importancia de teorizar sobre una retórica de las bases de datos, lo cual conlleva implicaciones discursivas, éticas y culturales significativas (2001, pp. 129, 283).
Del mismo modo, la imaginación simbólica está implicada en las imágenes generativas. Siguiendo a Durand (1984), la imaginación simbólica es un pensamiento dinámico que utiliza símbolos para representar ideas complejas y comprender el mundo. Durand examina la esencia dialéctica simbólica en diversos planos, desde el psicoanálisis freudiano hasta la teofanía, para concebir la imaginación simbólica como expresión de la cultura humana. Los símbolos tienen un valor cultural y social más allá de su significado literal. El imaginario en imágenes, mitos y símbolos conforma una percepción del mundo en una cultura. Esta teoría recupera la obra de Cassirer (1923), en donde los símbolos son esenciales para la comprensión humana del mundo.
Por otra parte, Morin (1972) sostiene que el arte es clave en la construcción del imaginario colectivo, que se nutre de mitos y símbolos alojados en la memoria y en imaginación, hasta configurar una mente social colectiva. Los imaginarios colectivos refuerzan el sentimiento comunitario y propician una conciencia compartida. En semiótica, los símbolos son signos cuya existencia se basa en convenciones sociales (Peirce, 1932) y se expanden a través de imaginarios sociales, colectivos y culturales.
En el marco de esta investigación, la teoría de los imaginarios sociales y simbólicos, así como la definición de símbolo, articuladas por los autores anteriormente revisados, contribuye a la conceptualización de los imaginarios producidos por los programas y sistemas de imágenes generativas, los cuales trabajan a partir de la información contenida en sus bases de datos masivas y mediante operaciones de deep learning.
Metodología
El presente estudio tiene como objetivo analizar los imaginarios simbólicos visuales sobre la frontera México-Estados Unidos producidos por cuatro programas de generación de imágenes, desde una perspectiva semiótica (Peirce, 1932) e iconológica (Panofsky, 1972). La metodología experimental utilizada para generar las imágenes consistió en solicitar a ChatGPT 3.5 la elaboración de una lista de imaginarios sociales y simbólicos sobre la frontera a partir de la siguiente instrucción base (prompt) : "Write the most relevant symbolic imaginaries about: wall, woman, childhood, inequality and migration related to the Mexico-United States border". La instrucción base de entrada o prompt fue redactada en inglés, al igual que las respuestas generadas, ya que los modelos de inteligencia artificial utilizados están diseñados para operar de forma óptima en este idioma. Es necesario considerar que el idioma es una variable cualitativa que, eventualmente, puede modificar el resultado de ChatGPT 3.5. Usar un prompt en inglés implica ya un corte geopolítico y cultural. El prompt base inicial emplea conceptos abstractos y generales, no incluye sesgos o calificativos ideológicos intencionados sobre sus términos o bien sobre uno u otro país.
La instrucción base (prompt) es considerada aquí como un encuadre de la investigación necesario y busca establecer la formación de imaginarios simbólicos relacionados con los conceptos clave en la frontera México-Estados Unidos a través de ChatGPT 3.5. No obstante, es necesario considerar que contiene una selección de conceptos y una arquitectura gramatical que, por asociación, tiene connotaciones simbólicas generales de carácter geopolítico y cultural. Sin embargo, no ha sido objeto de este estudio centrar el análisis en los valores idiomáticos o comparar el uso de diversos idiomas en el prompt empleado para solicitar los imaginarios simbólicos al programa.
Sin dejar de lado estas consideraciones importantes sobre la instrucción base (prompt), el objeto de estudio de la presente investigación está centrado en el análisis de los imaginarios simbólicos visuales que producen los programas de imagen generativa (o Diffusion Models) sobre esta frontera, usando los prompts generados por un modelo de lenguaje a gran escala (o Large Language Model) como es ChatGPT 3.5. De esta forma, el análisis está enfocado en las imágenes y no en la arquitectura de los prompts, ni en la relación texto-imagen. No obstante, el análisis de la relación entre texto e imagen en entornos de IA generativa abre un amplio campo de investigación futura, que va desde los conceptos trabajados por Mitchell como imagentexto y metaimagen (2019, pp. 45-49) hasta la ingeniería de prompts, una línea de investigación que se indaga actualmente desde diversas áreas (Bach et al., 2022; Lou et al., 2023).
Se ha decidido explorar los imaginarios simbólicos sobre conceptos clave como muro, violencia, mujer, infancia, desigualdad y migración, por considerarlos relevantes en estudios sociológicos sobre la frontera México-Estados Unidos y por juzgarlos temas neurálgicos, sensibles, conflictivos y contemporáneos tratados de manera recurrente en diversos estudios especializados (Giménez, 2007; Meneses, 2013; Prado, 2022; Hernández y Delgado, 2023; Conte, 2022).
La respuesta producida por ChatGPT 3.5 fue la siguiente:
1. The Wall. Separation: The wall between Mexico and the United States represents the separation of families and communities.
2. Violence. Drug Trafficking: The northern border Mexico-United States border is often associated with violence related to drug trafficking and cartel wars.
3. Women. Migrant women between Mexico and the United States: Migrant women are often seen as particularly vulnerable to exploitation and abuse in their quest to cross the border.
4. Childhood. Mexico-United States border - migrant children: The image of migrant children detained in detention centers or crossing the border alone has generated international debate and concern.
5. Inequality. Inequality economic gap: The border is often seen as a place where economic inequalities between Mexico and the United States are manifested.
6. Migration. Dreams and hopes: Migration across the border between Mexico and the United States is often associated with the pursuit of the "American dream" and the hope for a better life. // Challenges and dangers: It is also associated with the dangers and challenges that migrants face in their journey, between Mexico and the United States, including detention and deportation (OpenAI, 2023b).1
Una vez generada la lista de conceptos e imaginarios simbólicos mediante ChatGPT 3.5, se utilizaron como prompts para solicitar la creación de imágenes en cada uno de los programas de imagen generativa (Midjourney, Dall-E 2, Stable Diffusion y Leonardo.ai). El análisis semiótico e iconológico de estas imágenes, contrastado con el marco conceptual desarrollado previamente, permite analizar los imaginarios simbólicos visuales sobre la frontera México-Estados Unidos construidos por estos sistemas de imagen generativa.
Se realizó un análisis detallado de los resultados obtenidos al utilizar estas descripciones (prompts) en Midjourney, Dall-E 2, Stable Diffusion y Leonardo.ai, para identificar y examinar tendencias ideológicas y estéticas en imaginarios sociales y simbólicos representados. En particular, se destacaron elementos simbólicos relevantes en cada imagen resultante. Además, se llevó a cabo un análisis comparativo general de los cuatro programas y de los modelos de lenguaje e imagen generativa. Se seleccionó la primera imagen generada por cada prompt, ya que todos producen cuatro imágenes en su configuración, por defecto. No se aplicaron prompts negativos.2
Es fundamental tener en cuenta que los programas de aprendizaje profundo tienen la capacidad de generar imágenes distintas para un mismo prompt y esta variabilidad puede manifestarse incluso en un corto período de tiempo. En este estudio, las imágenes analizadas fueron generadas el 25 y 27 de septiembre de 2023, utilizando un servidor ubicado en la Ciudad de México y con el perfil del usuario-investigador. Es importante destacar que los resultados obtenidos podrían cambiar debido a la interacción de tres factores principales: la temporalidad, la geolocalización y el perfil del usuario. No obstante, no es objeto de esta investigación comprobar si existen cambios en los resultados por estos factores.
Es necesario reconocer que, si bien existe una certeza metodológica en cuanto a las variaciones en los resultados, la naturaleza misma de los programas de imagen generativa implica que cada solicitud pueda generar resultados diferentes. Aunque es importante destacar que existen ciertas constantes en términos de forma y contenido, estas están sujetas al contexto y a las condiciones en las que se realiza la solicitud.
Análisis de los imaginarios simbólicos producidos por imagen generativa sobre la frontera México-Estados Unidos
A continuación se presenta un análisis conciso de los resultados obtenidos y una exploración de los imaginarios simbólicos producidos por los programas de IA. Sobre migración, se incluyeron dos resultados, por considerarlo un subtema transversal de la investigación. En la Figura 1 se relacionan los conceptos clave y las imágenes generadas por los modelos de difusión.
El muro
El muro (The Wall) fronterizo conforma un imaginario simbólico constante en las referencias conceptuales y visuales sobre la división física y política entre México y Estados Unidos. El imaginario simbólico producido por ChatGPT 3.5 lo relaciona con la separación entre familiares y comunidades. En las representaciones generadas por Midjourney, Leonardo.ai y Stable Diffusion, encontramos los imaginarios simbólicos centrados en la presencia de figuras humanas, una familia o unos niños, frente a un muro infranqueable ante ellos, con la presencia de una bandera estadounidense.
Figura 1. Imágenes generativas producidas por Midjourney, Leonardo.ai, Stable Diffusion y Dall-E 2, sobre conceptos clave de la frontera México-Estados Unidos, 2023
Fuente: elaboración propia.
En el caso de Stable Diffusion encontramos un muro metafórico formado por lo que podría ser agua de una playa fusionada con un muro de arena y cemento. Cabe recordar que hay fragmento del muro fronterizo que entra al mar sobre una playa, de modo que esta imagen bien puede ser una representación sintética generada con esta referencia.
La separación humana está representada por las familias y niños que encuentran un muro divisorio que les impide pasar o reunirse con otros familiares. En el caso de Dall-E 2, el imaginario simbólico se limita a la representación de la división fronteriza metálica, sin presencia humana, con referencias fotorrealistas, un muro en medio del desierto sin límites aparentes. El punto de vista ideológico político de estas representaciones está representado en la posición de los migrantes mexicanos, es decir, no vemos el lado norteamericano. En estos imaginarios son los mexicanos quienes sufren y enfrentan la separación infligida por el muro fronterizo, no los estadounidenses.
En todos los casos las imágenes tienen referencias fotorrealistas y siguen un patrón composicional con personas de espaldas frente a un muro, excepto Dall-E 2. Las referencias fotorrealistas no son similares, algunas presentan rasgos con cierta influencia pictórica o de ilustración gráfica, como en Midjourney. En todos los casos estamos ante una representación figurativa y perspectivista.
Violencia
El tráfico de drogas y la guerra de los cárteles sintetiza el imaginario simbólico producido por ChatGPT 3.5 sobre la violencia (violence) en la frontera entre México y Estados Unidos. En las imágenes producidas por Midjourney y Leonardo.ai los imaginarios simbólicos consisten en escenas protagonizadas por militares, ya sea en una operación de decomiso de drogas o en una escena donde hubo un enfrentamiento armado y aparece cuerpos humanos desmembrados en hilera. Cabe observar que en la escena generada por Leonardo.ai los cuerpos aparecen como fragmentos apenas reconocibles de personas muertas, debido a errores estadísticos que impiden la conformación figurativa de cuerpos completos (se eliminó "muy probablemente", que además tenía un typo). En el caso de Stable Diffusion, el imaginario simbólico es una carretera con algunos automóviles en medio del desierto. En las imágenes generadas por este programa no hay representación de la violencia producida por el narcotráfico o la guerra de cárteles de la droga. Es muy probable que las bases de datos de Stable Diffusion estén filtradas o no contengan referencias visuales relacionadas con violencia, guerra, acciones militares, crimen organizado, narcotráfico y drogas.
En el caso de la imagen generada por Dall-E 2, el imaginario simbólico está representado por un mapa gráfico de Centro América, México, Estados Unidos, Canadá y Alaska, que a manera de tablero contiene píldoras y un texto con letras que podrían sugerir la palabra "droga". En este caso específico no hay presencia humana, el color verde oliva remite al color de uso militar, el letrero atraviesa justo la zona de la frontera entre México y Estados Unidos y connota la problemática del tráfico de droga en toda la región.
En los tres primeros casos los imaginarios simbólicos se centran en México, con soldados y paisajes mexicanos donde suceden las escenas de violencia y tráfico de drogas. En estos casos las imágenes tienen referencias fotoperiodísticas, generadas a partir de fotografías tomadas en escenas donde se han registrado acciones militares. En el caso de Dall-E 2, la representación tiene referencias gráficas, sin presencia humana ni acciones violentas.
Mujer
Los imaginarios sociales y simbólicos que sintetizan los cuatro programas representan mujeres (women) jóvenes de entre 12 y 35 años de edad, con rasgos latinos o indígenas propios de la población mayoritaria mexicana. En todos los casos se trata de retratos frontales en escenas donde los fondos contienen algún rasgo desértico o un camino interminable, una reja divisoria fronteriza o, como es el caso de la imagen generada por Leonardo.ai, una escena donde un grupo de mujeres parecen descansar a la sombra de una tienda de campaña. Estos imaginarios simbolizan a las mujeres con expresiones faciales de agotamiento, sufrimiento y preocupación.
En el caso de Midjourney encontramos a una mujer joven en un retrato frontal, en medio de una carretera desierta. La mujer viste una camisa naranja que recuerda los uniformes de los prisioneros en Estados Unidos, tiene un alambre de púas que rodea su cabeza, un elemento que simboliza la represión, el castigo, la prohibición, pero también la transgresión. Su gesto es serio, adusto y triste. Esta mujer bien puede simbolizar a una migrante que ha roto las reglas para llegar a su destino y que ha sido detenida. La imagen puede también emparentarse con el ícono de un cristo con una suerte de corona de espinas en la cabeza. La imagen lleva a preguntarse si esta mujer icónica es presa, víctima o heroína, o las tres cosas al mismo tiempo. En todos los casos, los imaginarios simbólicos están compuestos por mujeres de rasgos latinos o indígenas, quienes enfrentan los riesgos y abusos que supone la migración, no las mujeres anglosajonas o de otras procedencias.
Los imaginarios producidos por Stable Diffusion y Dall-E 2 se emparentan mucho con la imagen sintetizada por Midjourney. Se trata de la representación de mujeres con rasgos latinos o indígenas, jóvenes y con expresiones de pesadumbre, preocupación y cansancio, en escenarios indefinidos. En todos estos casos, la imágenes tienen como referencia una estética fotodocumental y realista. En el caso de Midjourney la estética roza el arte conceptual fotográfico. Y en el caso de Leonardo.ai, una estética cercana a la fotografía documental en blanco y negro. En esta última imagen, cabe señalar que existe una notable distorsión en los rostros de las mujeres que acompañan al personaje central, producida por errores estadísticos.
Infancia
La infancia (childhood) también tiene imaginarios simbólicos producidos por ChatGPT 3.5 y los programas de imagen generativa, cuando se la relaciona con la frontera México-Estados Unidos. Estos imaginarios están simbolizados fundamentalmente por niños con rasgos mexicanos, indígenas o latinos, situados ante, detrás o entre rejas. Los niños son representados como prisioneros o detenidos en celdas de seguridad, como es el caso de Midjourney y Leonardo.ai. En el caso de Dall-E 2 la niña se encuentra en libertad frente a una reja fronteriza. Y en el caso de Stable Diffusion, la representación está conformada por un grupo de niñas y niños mexicanos con expresiones de preocupación, en lo que podría ser un centro de detención, de acuerdo al prompt empleado. Se trata de niños mexicanos, latinos o indígenas que han sido detenidos por migrar y se encuentran sin sus padres. La estética que presentan los cuatro imaginarios simbólicos sobre la infancia tienen referencias fotográficas documentales realistas. La imagen sintetizada por Leonardo.ai presenta un error (glitch), en el que una niña aparece incrustada entre las rejas.
Desigualdad
Los imaginarios simbólicos de la desigualdad (inequality) se relacionan con las diferencias económicas entre los dos países: la brecha económica. En las imágenes sintetizadas por Midjourney, Leonardo.ai y Stable Diffusion, la desigualdad económica la simboliza un lugar deteriorado, de escaso desarrollo urbano, desértico o en ruinas. En ninguno de estos tres casos la desigualdad compara, por ejemplo, una región más desarrollada o empobrecida con imágenes donde se simbolice la prosperidad de una región por contraste con otra. En estas tres imágenes se simboliza la desigualdad con imágenes de deterioro, abandono o pobreza del lado mexicano. En el caso de la imagen sintetizada por Leonardo.ai, un hombre camina por un sendero desértico y en el cielo contrastan pedazos de una bandera norteamericana ondeando, símbolo del contraste entre los dos países y la superioridad estadounidense. Nuevamente encontramos representaciones gráficas fotorrealistas en estos tres programas.
En el caso del imaginario sintetizado por Dall-E 2, la representación tiene un referente más cercano a la gráfica corporativa o financiera, representa el desequilibrio entre los dos países. Claramente la riqueza es simbolizada por el mapa de Estados Unidos y el símbolo del dólar, mientras que el lado mexicano está representado por un espacio vacío y una figura humana que intenta atravesar una línea divisoria. Aquí muy claramente aparece un símbolo comparativo que representa la desigualdad económica entre los dos países. Nuevamente, Dall-E 2 evita las figuras humanas realistas y se inclina por una representación gráfica más abstracta, aunque cargada de la retórica de la gráfica financiera.
Migración (sueños y esperanzas)
Como hemos apuntado, para el concepto migración (migration) hemos incluido dos prompts producidos por ChatGPT 3.5. El primero está relacionado con "sueños y esperanzas" (dreams and hopes). En los imaginarios producidos por Midjourney y Leonardo.ai encontramos una representación alegórica, con cierta carga onírica, en el primer caso, y un rasgo pictórico surrealista. En estos casos los sueños y esperanzas están simbolizados por la bandera estadounidense y protagonizados por mujeres jóvenes que habitan en contextos desolados, desordenados y rurales. Son las mujeres mexicanas las que sueñan y tienen la esperanza de alcanzar el "sueño americano", simbolizado principalmente por la bandera de rayas y estrellas que ondea en el cielo. En el caso de Dall-E 2, el imaginario se simboliza mediante la silueta de un niño anónimo que camina frente a una reja en donde ondea una bandera estadounidense. Nuevamente, la infancia simboliza a la población mexicana que tiene la esperanza de alcanzar el "sueño americano", franqueado por una reja.
En el caso de la imagen sintetizada por Stable Diffusion, nuevamente encontramos a un niño mexicano solo frente al gran muro divisorio. Los sueños y esperanzas están protagonizados por la figura del niño solitario y franqueados por una reja o un inmenso muro fronterizo. En los dos últimos casos, las referencias estéticas son remediaciones de la fotografía documental.
Migración (dificultades y peligros)
La migración para ChatGPT 3.5 también tiene un imaginario simbólico relacionado con las "Dificultades y peligros" (challenges and dangers) a los que se exponen los migrantes. Los cuatro programas sintetizan imaginarios simbolizados por hombres mexicanos en centros de detención, prisioneros o hacinados en espacios para una posible deportación. Es significativo que, en el caso de los "Sueños y esperanzas", los protagonistas eran niños o mujeres, mientras que en este caso los riesgos asociados a la detención y deportación están relacionados con hombres de mediana edad. En estas representaciones, las dificultades y peligros de la migración los sufren los hombres mexicanos, no los hombres anglosajones o de otras procedencias. Todos los imaginarios simbólicos, sintetizados en estos casos, son una remediación de la fotografía documental e informativa, con una gran diversidad de encuadres y puntos de vista con un tratamiento altamente realista y detallado.
Análisis comparativo
El análisis comparativo de los resultados obtenidos en el uso de los cuatro programas de generación de imágenes permite identificar coincidencias claras en la producción simbólica de los imaginarios sintetizados y algunas diferencias en sus resultados estéticos y formales. La producción simbólica de los imaginarios asociados a la frontera México-Estados Unidos presenta coincidencias en los cuatro programas de imagen generativa en la representación de elementos comunes, tales como: el muro fronterizo como símbolo infranqueable de la separación de familias y comunidades mexicanas; la violencia simbolizada por el decomiso de armas o acciones militares en el territorio mexicano; la mujer mexicana como protagonista de la migración expuesta a la detención, la preocupación y el cansancio; los niños mexicanos como protagonistas solitarios en situaciones de detención; la brecha económica simbolizada por la precariedad del lado mexicano; el "sueño americano" perseguido por niños y mujeres jóvenes, simbolizado por la bandera de estadounidense; los migrantes simbolizados por niños, mujeres y hombres mexicanos, como protagonistas exclusivos de la migración y sus problemáticas.
Formal y estéticamente, los programas son muy similares, aunque todos sintetizan imágenes con claros referentes basados en la fotografía documental o informativa, figurativa, perspectivista y realista. Midjourney sintetiza las imágenes con algunos rasgos procedentes de la ilustración y la pintura, aunque de manera figurativa y fotorrealista. Leonardo.ai sintetizó imágenes más fotorrealistas con referencias fotodocumentales y presentando algunos errores formales (glitchs) en la formación de cuerpos y rostros. Stable Diffusion sintetiza imágenes a partir de una retórica visual construida según la cultura fotodocumental. Dall-E 2 sintetiza imágenes con referencias que provienen de una retórica visual del dibujo, la gráfica y la fotografía.
Por otra parte, un somero análisis de la relación entre un modelo de lenguaje avanzado (como ChatGPT 3.5) y los modelos de difusión de imagen generativa empleados revela que ChatGPT 3.5 asoció ideas específicas a cada uno de los conceptos clave en las descripciones de los imaginarios simbólicos, siempre ofreciendo un plano abstracto y general. Por ejemplo, para "Muro" asoció el sustantivo separación, "Violencia" lo asoció con tráfico de drogas, "Mujer" con explotación y abuso, "Infancia" con detención y soledad, "Desigualdad" con brecha económica, "Migración" con sueños y esperanzas como el American dream, además de con dificultades y peligros de los migrantes frente a la detención y la deportación.
Podemos observar que en ningún momento las descripciones del modelo de lenguaje definen o califican los términos de uno u otro lado de la frontera; de igual forma, tampoco definen si se trata de familias, comunidades, niños, mujeres, hombres, cuerpos armados o migrantes de una nacionalidad u otra, o de rasgos raciales de un tipo específico. Incluso el término American dream, anclado en la cultura estadounidense, es una concepto general que no refiere a ningún colectivo humano específico. En este sentido, ChatGPT 3.5 ofreció descripciones más abstractas y generales que los resultados generados por los cuatro modelos de imagen generativa. En cambio, los modelos de difusión empleados dieron como resultado, a partir de las descripciones de ChatGPT 3.5, imágenes con claros sesgos raciales, geopolíticos y culturales centrados únicamente en el lado mexicano y con figuras humanas asociadas exclusivamente con rasgos mexicanos, indígenas o latinoamericanos.
Los resultados de esta investigación permiten afirmar que, mientras una IA de lenguaje como ChatGPT 3.5 puede describir conceptos abstractos y complejos utilizando el texto, los programas de imagen generativa traducen estos conceptos en imágenes visuales de manera más situada y producen representaciones con sesgos ideológicos, geopolíticos y culturales localizados. La relación entre el texto generado por ChatGPT 3.5 y las imágenes sintetizadas por los modelos de difusión se expresa en conexiones complejas que incluyen además síntesis, rupturas y relaciones semánticas, así como interacciones multidimensionales, complementariedad y sinergia.
Discusión y conclusiones
Los programas como como Midjourney, Leonardo.ai, Stable Diffusion y Dall-E 2 son aparatos tecnoestéticos que pueden representar un cambio significativo en la producción simbólica y en el reparto de lo sensible. Esta investigación ha permitido profundizar en los procesos de generación de imágenes de estos cuatro programas, estableciendo un marco teórico conceptual para evaluar y explorar los imaginarios sociales y simbólicos que emergen en la frontera México-Estados Unidos y analizar sus sesgos ideológicos y tendencias estéticas. Las imágenes obtenidas son el producto de procesos de aprendizaje profundo y la manipulación de contenido almacenado en extensas bases de datos. La producción simbólica que hemos descubierto en este estudio se compone de imaginarios conceptuales y visuales que han sido establecidos de manera colectiva y retóricamente configurados en estas vastas reservas de datos, procedentes de internet, y mediante la gestión de las grandes corporaciones que detentan la propiedad de los programas aquí empleados.
La producción simbólica que hemos encontrado responde a una retórica visual digital estructurada en torno a cuatro regímenes retóricos digitales entrelazados: el lenguaje (texto escrito y lenguajes operativos inscritos en los programas), la síntesis visual (producto de los procesos del aprendizaje profundo), la retórica visual (los discursos de contenido ideológico y estético simbólicos en las imágenes) y la retórica de las bases de datos (la calidad y cantidad de información en una arquitectura de datos). Estos regímenes contribuyen a las cualidades inherentes de la producción digital, donde la interactividad, la hipertextualidad, la multimodalidad y la hibridación son elementos esenciales en el proceso y la arquitectura de las imágenes generativas y la síntesis visual.
La producción visual de imaginarios analizada revela sesgos ideológicos, políticos y raciales discriminatorios. Las imágenes refuerzan la percepción de que los migrantes son principalmente personas con rasgos mexicanos, indígenas o latinos, provenientes de contextos rurales y empobrecidos. Esta representación reproduce estereotipos mediáticos, ideológicos y políticos dominantes sobre la migración. Los modelos de IA, tanto de ChatGPT 3.5 como de imagen generativa, demuestran capacidad para sintetizar imaginarios sociales en representaciones simbólicas con discursos retóricos sobre la frontera, pero al mismo tiempo reproducen sesgos discriminatorios que refuerzan un reparto de lo sensible inscrito en los discursos hegemónicos (Rancière, 2009).
Los resultados permiten observar que, mientras ChatGPT 3.5 es capaz de describir los imaginarios simbólicos usando conceptos abstractos, los programas de imagen generativa pueden traducirlos en imágenes visuales con sesgos ideológicos, geopolíticos y culturales localizados. La relación entre el texto y las imágenes generativas establece conexiones complejas, incluyendo síntesis, rupturas y relaciones semánticas, así como interacciones multidimensionales.
La retórica visual digital de los cuatro programas muestra una notable convergencia en las representaciones simbólicas de la frontera México-Estados Unidos, aunque difiere un poco en su tratamiento formal. Los programas exhiben tendencias estéticas discernibles, que se basan en retóricas visuales arraigadas en tradiciones principalmente provenientes de la pintura, la gráfica y la fotografía documental e informativa.
Existe un claro sesgo ideológico, geopolítico y cultural en los imaginarios simbólicos (Castoriadis, 1975; Durand, 1984) obtenidos en esta investigación mediante los aparatos tecnoestéticos (Flusser, 2006; 2011; Déotte, 2012) de IA generativa, que producen representaciones visuales que corresponden a un régimen de visibilidad hegemónico globalizado e imperante en dichos sistemas (Zuboff, 2019). Es necesario tener una mirada crítica sobre cómo los algoritmos perpetúan imaginarios excluyentes sobre grupos históricamente oprimidos.
Este estudio nos ha permitido identificar los sesgos ideológicos, políticos y raciales presentes en estos programas y comprenderlos como artefactos tecnoestéticos que generan una producción simbólica acorde con un régimen de representaciones visuales dominantes en el capitalismo occidental. Estos programas moldean nociones de realidad sobre la migración, naturalizan la desigualdad y normalizan las representaciones simbólicas de mujeres, niños y hombres mexicanos con rasgos indígenas o latinos, como protagonistas y víctimas de la migración.
Es importante destacar que este estudio tiene limitaciones, incluida la imposibilidad de un análisis más profundo sobre la arquitectura lingüística, simbólica y retórica de las entradas (prompts) generadas por ChatGPT 3.5, así como sobre las interesantes y significativas relaciones entre textos e imágenes (Mitchell, 2019, pp. 45-47). También queda pendiente un análisis sobre las resonancias conceptuales y de producción de sentido que significa usar una inteligencia artificial para generar imágenes en programas de otras inteligencias artificiales.
Igualmente cabe señalar que en esta investigación no se ha abordado la realización de pruebas para la obtención de imágenes generativas con diferentes variables temporales, espaciales o de usuario. Sin embargo, esta limitación no resta importancia a los hallazgos obtenidos, sino que abre la puerta a futuras investigaciones que puedan profundizar en estos aspectos y enriquecer nuestra comprensión de la generación de imágenes a partir de programas de aprendizaje profundo.
La principal contribución de la presente investigación radica en proporcionar un marco teórico conceptual para el análisis de las imágenes generativas inscrito en las humanidades digitales, un enfoque que puede replicarse en otros contextos y sentar las bases para futuras investigaciones sobre la producción simbólica generativa, los estudios visuales, la retórica visual posdigital generativa y el análisis de sesgos ideológicos en imágenes producidas por modelos de difusión.
Notas
1 Ofrecemos aquí una traducción de las descripciones producidas por ChatGPT 3.5, producidas por la siguiente indicación (prompt): "Escribe los imaginarios simbólicos más relevantes sobre: muro, violencia, mujer, infancia, desigualdad y migración relacionados con la frontera México-Estados Unidos": 1. Muro frontera México-Estados Unidos:// Separación: el muro representa la separación de familias y comunidades.// 2. Violencia frontera México-Estados Unidos:// Narcotráfico: la frontera norte es a menudo asociada con la violencia relacionada con el tráfico de drogas y las guerras de cárteles.// 3. Mujer:// Mujeres migrantes: las mujeres migrantes a menudo son vistas como especialmente vulnerables a la explotación y el abuso en su búsqueda de cruzar la frontera.// 4. Infancia:// Niños migrantes: la imagen de niños migrantes detenidos en centros de detención o cruzando la frontera solos ha generado debate y preocupación internacional.// 5. Desigualdad:// Brecha económica: la frontera es a menudo vista como un lugar donde se manifiestan las desigualdades económicas entre México y Estados Unidos.// 6. Migración:// Sueños y esperanzas: la migración a través de la frontera a menudo se asocia con la búsqueda del "sueño americano" y la esperanza de una vida mejor.// Dificultades y peligros: también se asocia con los peligros y desafíos que enfrentan los migrantes en su viaje, incluyendo la detención y la deportación. [Nota: la doble barra // indica salto de línea.]
2 Un prompt negativo es una secuencia de texto que se utiliza para evitar que un modelo de lenguaje grande (LLM) genere texto con ciertas características no deseadas. Los prompts negativos se utilizan junto con prompts positivos para guiar al LLM hacia la generación de texto que sea a la vez relevante y seguro (Leonardo.ai, 2023).
Referencias
Bach, S. H., Sanh, V., Yong, Z. X., Webson, A., Raffel, C., ... y Rush, A. M. (2022). Promptsource: An integrated development environment and repository for natural language prompts. En Proceedings of the 60th Annual Meeting of the Association for Computational Linguistics: System Demonstrations. Association for Computational Linguistics. https://doi.org/10.18653/v1/2022.acl-demo.9
Bajohr, H. (2023). Dumb meaning: Machine learning and artificial semantics. Image, 18.
Bañuelos, J. (2022). Evolución del Deepfake: campos semánticos y géneros discursivos 2017-2021. Icono 14, 20(1). https://doi.org/10.7195/ri14.v20i1.1773
Burns, A. (2002). Extensions of vision: Hie representation of non-human points of view. Papers on Language and Literature, 38(4), 339.
Castoriadis, C. (1975). La institución imaginaria de la sociedad II. Tusquets.
Castoriadis, C. (1997). El imaginario social instituyente. Zona Erógena, 35.
Cassirer, E. (1923). He philosophy of symbolic forms. Vol. 1: Language. Yale University Press.
Celis, C. (2021). Imagen y poder en la era de la visión artificial: una interpretación a partir de Gilbert Simondon y Gilles Deleuze. Atenea, 523, 193-211. https://doi.org/10.29393/AtAt523-417CCIP10417
Celis, C. (2020). La allagmática en cuanto disciplina poshumanista: nuevas metodologías para el estudio de las imágenes en el contexto de las máquinas de visión algorítmica. Revista 180, 46, 26-37. https://doi.org/10.32995/rev180.Num-46.(2020).art-692
Celis, C. (2019). Notas sobre el estatuto político de la imagen en la era de la visión artificial. Barda, 5(8). https://www.cefc.org.ar/assets/files/barda8_celis.pdf
Conte, D. (2022). Contra el muro: representaciones e imaginarios en la frontera México-Estados Unidos. En Sobre el límite: frontera, migración e identidad en la literatura y el arte actuales (pp. 9-28). Dykinson. https://doi.org/10.2307/j.ctv36k5bsj.4
Déotte, J. L. (2012). ¿Qué es un aparato estético? Metales Pesados.
Dobson, J. E. (2023). The birth of computer vision. University of Minnesota Press.
Durand, G. (1984). L'imagination symbolique. Presses Universitaires de France.
Ervik, A. (2023). Generative AI and the collective imaginary: The technology-guided social imagination in AI-Imagenesis. Image, 37(1), 42. https://imagejournal.de/category/ausgaben/image-37-2023/
Flusser, V. (2006 [1983]). Towards a philosophy of photography. Reaktion Books.
Flusser, V. (2011 [1985]). Into the universe of technical images. University of Minnesota Press.
Giménez, G. (2007). La frontera norte como representación y referente cultural en México. Cultura y Representaciones Sociales, 2(3), 17-34.
Han, B. C. (2022). Infocracia: La digitalización y la crisis de la democracia. Taurus.
Harari, Y. N. (2018). Why technology favors tyranny. The Atlantic, 322 (3), 64-73.
Heaton, J. (2018). Ian Goodfellow, Yoshua Bengio, and Aaron Courville: Deep learning. [Reseña] Genetic Programming and Evolvable Machines, 19(1-2), 305-307. https://doi.org/10.1007/s10710-017-9314-z
Hernández, A. y Delgado, A. C. (2023). Migración y movilidad en las Américas. Siglo XXI.
Leonardo AI (2023). Prompts: Consejos y trucos. Intercom.help. https://intercom.help/leonardo-ai/es/articles/8067671-prompts-consejos-y-trucos#h_9fa6bfe353
Lian, L., Li, B., Yala, A. y Darrell, T. (2023). LLM-grounded diffusion: Enhancing prompt understanding of text-to-image diffusion models with large language models. arXiv preprint arXiv:2305.13655.
Lou, R., Zhang, K. y Yin, W. (2023). Is prompt all you need? No. A comprehensive and broader view ofinstruction learning. arXiv preprint arXiv:2303.10475.
Manovich, L. (2001). The language of new media. MIT Press.
Miller, A. I. (2019). The artist in the machine: The world of AI-powered creativity. Mit Press.
Meneses, G. A. (2013). El desierto de los sueños rotos: detenciones y muertes de migrantes en la frontera México-Estados Unidos, 1993-2013. El Colegio de la Frontera Norte.
Mitchell, W. T. (2019). La ciencia de la imagen: iconología, cultura visual y estética de los medios. Akal.
Morin, E. (1972). El cine o el hombre imaginario. Paidós.
Nilsson, N. J. (2010). The quest for artificial intelligence: A history of ideas and achievement. Cambridge University Press.
Offert, F. (2022). Ten years of image synthesis. [Blog] Zentralwerkstatt, 10 de noviembre. https://zentralwerkstatt.org/blog/ten-years-of-image-synthesis
OpenAI (2023a). ChatGPT. Sept. 21 version. [Large language model]. https://chat.openai.com/chat
OpenAI. (2023b). Generative models, 20 de julio. https://openai.com/re-search/generative-models
Panofsky, E. (1972). Estudios sobre iconología. Alianza.
Peirce, C. S. (1932). Collected papers. Charles Hartshorne y Paul Weiss (eds.). Harvard University Press.
Prado, I. M. S. (2022). México, Estados Unidos y la era post-global. Latin American Literatures in the World Literaturas Latinoamericanas en el Mundo, 259. https://doi.org/10.1515/9783110762143-016
Sudmann, A. (2018). Szenarien des Postdigitalen. Deep Learning als Medien Revolution. Machine Learing. Medien, Infrastrukturen und Technologien der künstlichen Intelligenz (pp. 55-74). Digitale Gesellschaft.
Rancière, J. (2009). El reparto de lo sensible: estética y política. LOM.
Ré, A. A., Costa, F. G., Celis, C. y Berti, A. F. (2020). Escrituras algorítmicas e imágenes invisibles: tecnoestética y política. Pensando, 11(23). https://revistas.ufpi.br/index.php/pensando/article/view/11120
Roberge, J. y Castelle, M. (eds.) (2021). The cultural life of machine learning: an incursion into critical AI studies. Palgrave Macmillan.
Sauer, A., Lorenz, D., Blattmann, A. y Rombach, R. (2023). Adversarial diffusion distillation. arXiv preprint arXiv:2311.17042.
Singh, V. y Rath, S. (2023). Introduction to diffusion models for image generation. A comprehensive guide. LearnOpenCV. https://learnopencv.com/image-generation-using-diffusion-models/
Wilde, L. R. (2023). Generative imagery as media form and research field: Introduction to a new paradigm. Image, 37(1), 6. https://imagejournal.de/category/ausgaben/image-37-2023/
Virilio, P. (1994). The vision machine. Indiana University Press.
Yang, L., Zhang, Z., Song, Y., Hong, S., Xu, R., ... y Yang, M. H. (2022). Diffusion models: A comprehensive survey of methods and applications. arXiv preprint arXiv:2209.00796. https://arxiv.org/abs/2209.00796
Yuval Noah Harari (2023). AI and the future of humanity. Yuval Noah Harari at the Frontiers Forum. [Canal YouTube], 14 de mayo. https://www.youtube.com/watch?v=LWiM-LuRe6w
Wu, Z., Pan, S., Chen, F., Long, G., Zhang, C. y Philip, S. Y. (2020). A comprehensive survey on graph neural networks. IEEE Transactions on Neural Networks and Learning Systems, 32(l), 4-24. https://doi.org/10.1109/TNNLS.2020.2978386
Zuboff, S. (2020). Capitalismo de la vigilancia. [Reseña] Política Exterior, 34(194), 7-12.
Zylinska, J. (2020). AI art: machine visions and warped dreams. Open Humanities Press.
Zylinska, J. (2017). Nonhuman photography. MIT Press.