OpenAI tiene novedades, esta semana. La organización especializada en Inteligencia Artificial Generativa lanzó un nuevo generador de imágenes en ChatGPT, que reemplaza a DALL-E. El renovado sistema trae una serie de cambios y mejoras: los resultados son más refinados y en ocasiones con mayor realismo.
También hay algunas fallas y problemáticas. Ahora es posible incluir a celebridades en las creaciones de esta IA, un permiso que puede ser divertido, pero que deriva en una serie de riesgos e inconvenientes.
ChatGPT y su nuevo generador de imágenes: un paso en dirección a las deepfakes
La principal novedad en el modelo de IA que crea imágenes es la posibilidad (vedada en DALL-E) de incluir a figuras públicas. A continuación de este párrafo compartimos un ejemplo, que con el anterior generador simplemente era imposible: se indicaba que el pedido violaba las normas de uso.

“La generación de imágenes 4o es capaz, en muchos casos, de generar una representación de una figura pública basándose únicamente en una indicación de texto”, dicen desde OpenAI.
Leé también: Le pedimos a ChatGPT que sea sarcástico: “Qué desafío tan interesante”, ironiza el chatbot de OpenAI
“En este lanzamiento, no bloquearemos la capacidad de generar figuras públicas adultas, sino que implementaremos las mismas salvaguardas para la edición de imágenes de cargas fotorrealistas de personas. Por ejemplo, esto incluye tratar de bloquear la generación de (contenido que incluya a) menores y de material que viole nuestras políticas relacionadas con la violencia, incitación al odio, las instrucciones para actividades ilícitas, el contenido erótico, etcétera”, explicaron desde el grupo que dirige Sam Altman.

Por lo demás, los personajes públicos que deseen que no se genere su imagen pueden optar por no participar”.
Probamos el generador de imágenes de ChatGPT: es mejor, pero más lento
Cabe notar que esta actualización no es una cuarta edición de DALL-E, un modelo que nació en el 2021. En cambio, desde OpenAI promocionan un nuevo generador integrado a ChatGPT. En cualquier caso, el funcionamiento es similar: el sistema crea imágenes, dibujos, pinturas, etcétera, a partir de indicaciones por escrito, que en la jerga de la IA se conocen como “prompts”.
Un detalle: el modelo generativo se lanza para los usuarios de pago, en primera instancia. Según informó TechCrunch, imprevistamente se demorará para los que usan la versión gratuita de ChatGPT. El CEO de OpenAI explicó que esto se debe a la alta demanda registrada en las primeras horas, tras el despliegue.
Leé también: El uso continuo de ChatGPT se asocia a sentimientos como la soledad y la sobredependencia
En TN Tecno echamos mano desde la versión Plus. En nuestra prueba, encontramos los beneficios prometidos y también algunas falencias. Una de las principales: la generación de imágenes es mucho más lenta que en DALL-E. La explicación evidente: a más calidad, más demora.
Otra mejora sustancial en el generador de ChatGPT es la inclusión de textos en las imágenes. Antes, en DALL-E los resultados solían ser insólitos, con caracteres faltantes y palabras incongruentes. Para este, OpenAI dice que se usan las capacidades del modelo GPT-4o.

También se destaca lo que los desarrolladores de este modelo llaman “multiturno”. En concreto, es la capacidad de pulir los resultados, agregando prompts. La idea es que los usuarios podamos pedir cambios en las imágenes, con base en las anteriormente generadas.
Por otra parte, ahora el contenido se genera por defecto en formato .PNG.
Un detalle final, en este punto: DALL-E sigue con vida en ChatGPT, con un apartado separado en el que aún es posible usarlo tal como ocurría hasta hace poco.
Con su nuevo generador de imágenes, OpenAI se expone a riesgos: todo sea por la competencia
Al consentir incluir a celebridades en los prompts, ChatGPT se pone en la misma línea de Grok, el chatbot de xAI (de Elon Musk) que siempre tuvo ese permiso. Tal como señalamos, esta venia puede ser atractiva, pero trae consigo una serie de riesgos porque propicia la circulación de falsificaciones demasiado creíbles.

Claro, OpenAI se atajó al señalar que el generador sigue estableciendo restricciones. Por ejemplo, que no permite imágenes violentas, que inciten al odio o que incluyan menores. Además, informaron que las celebridades podrán solicitar que sus nombres sean excluidos, es decir, que nadie pueda usarlos en imágenes falsificadas.
Sin embargo, la experiencia real usualmente dista de las promesas de las gacetillas. Las deepfakes son facilitadoras de la desinformación y en ocasiones de la difamación. Si los resultados son cada vez más realistas, ¿cómo podremos distinguir si aquello que vemos ocurrió realmente o es resultado de una magia sintética?
Leé también: ¿Eso es real? Los secretos para descubrir si una imagen fue creada con Inteligencia Artificial
OpenAI propone otra solución: la inclusión de marcas de agua, una especie de signo delator para indicar que las imágenes fueron generadas con IA. Esto puede ser útil, no cabe duda, aunque en ocasiones no es suficiente.
Finalmente, para que se apliquen las restricciones que menciona la organización estadounidense serán necesarios esfuerzos continuos. Y la historia de las herramientas digitales nos ha enseñado que, en la práctica, la post-moderación no es sencilla. Porque a estos generadores les cabe la lógica del martillo: son herramientas que sirven para fines constructivos, como para destructivos.
Leé también: El generador de imágenes de OpenAI es sesgadamente estadounidense: “Contenido demasiado local”
En el primer despliegue son esperables las fallas. Según notó New York Post, el nuevo generador restringe los prompts que piden imágenes de chicas sexis, pero no se comporta del mismo modo si se pide que cree resultados con varones semidesnudos. El propio Altman pronto salió al ruedo a reconocer que se trató de un problema en el software.