Lo que la IA ve

27/03/2026 admin

Por mis anteriores publicaciones, sabéis que no paro quieto. No es que tenga más tiempo, es que a veces me desvelo y si «me quema la cama», pues me levanto y dejo volar la imaginación (mi padre me dijo una vez que la imaginación no servía para nada, qué equivocado estaba).

Pues bien, hoy ha sido uno de esos días que he dejado descargando un modelo «uncensored»: hoy día existen modelos ya entrenados que te puedes descargar y usarlos en LM Studio , una de las aplicaciones que te facilitan más la vida a la hora de trabajar de forma local con el contenido que quieras.

El equipo donde he realizado las imágenes que vais a ver a continuación es un i7-9700 a 3 Ghz, con 64 Gb de RAM y una NVIDIA GeForce #RTX4060 de 8 Gb, accesible prácticamente a cualquier bolsillo (ronda los 400 euros en marzo de 2026).

La imagen que encabeza este artículo está tomada de la página web de Mercedarias Granada FP , en concreto, en el apartado del Curso de Especialización en Ciberseguridad en Entornos de las Tecnologías de la Información, en la cual aparezco y también se entrevén algunos de los alumnos que estaban en el momento de la realización de la instantánea. Como es una imagen pública, podemos experimentar con ella.

Pues bien, empleando el modelo qwen3.5b-35b-uncensored-hauhaucs-aggressive (de 22 Gb de tamaño, esto no lo carga cualquiera: Windows toma 32 Gb de la RAM y se los presta a los 8 de la RTX; sé que con Linux iría mejor, pero me pasaré al pingüino definitivamente cuando Microsoft haga que .NET pueda levantar ventanas en Linux ), le he pedido que me haga un análisis forense detallado de la imagen que encabeza a este artículo y se la he adjuntado sin más. El prompt, para que sea exacto, ha de realizarse en inglés, así se entera mejor el agente, y le he dejado que lo genere, y me devuelve:

Subject: A classroom or meeting room setting.
Foreground: A white partition with cut-out letters (partially visible, looks like «H…»). This obscures the view slightly.
Mid-ground: Several people seated at desks facing a screen. They appear to be students or attendees. Most are wearing casual clothing (t-shirts). Some have laptops open.
Background: A large flat-screen TV mounted on a yellow wall. A man is standing next to it, presenting. He’s wearing a white polo shirt with yellow sleeves.
Lighting: Overhead fluorescent panel lights. Natural light coming from windows with blinds on the left and right.
Details: Water bottles on tables. Backpacks on chairs/floor. The room has wood paneling on the lower walls.

Bien, ya está hecho lo difícil, que la máquina sea capaz de describirme la escena. Traducido al español viene a ser:

Asunto: Un salón de clases o sala de reuniones.
En primer plano: una partición blanca con letras recortadas (parcialmente visible, parece «H…»). Esto oscurece ligeramente la vista.
En medio: varias personas sentadas en escritorios frente a una pantalla. Parecen ser estudiantes o asistentes. La mayoría lleva ropa informal (camisetas). Algunos tienen portátiles abiertos.
Fondo: un gran televisor de pantalla plana montado en una pared amarilla. Un hombre está de pie junto a él, presentando. Lleva una camiseta polo blanca con mangas amarillas.
Iluminación: Paneles de luces fluorescentes superiores. Luz natural procedente de ventanas con persianas a izquierda y derecha.
Detalles: Botellas de agua sobre mesas. Mochilas en sillas/suelo. La habitación tiene paneles de madera en las paredes inferiores.

Puede que sea un prompt algo pobre, pero vamos a ver qué es capaz de generar otra aplicación, que permite, online, hacer prompts y generar unas cuantas imágenes. Son las 8 primeras pero, también, le he pedido al agente que con el prompt que me ha proporcionado, genere él mismo otra imagen, cosa que no puede hacer porque «I am primarily text-based but often have an image generation capability attached. Let’s assume the role of providing the prompt and generating if possible, or describing how to generate it», vamos, que no. Pero, como buen samaritano, se ofrece a que Dall-E 3 me genere la imagen, que os pongo a continuación:

Por último, ¿observáis algún sesgo en las imágenes generadas?

Gracias por leerme.