Articulos

Lo que la IA ve

Por mis anteriores publicaciones, sabéis que no paro quieto. No es que tenga más tiempo, es que a veces me desvelo y si «me quema la cama», pues me levanto y dejo volar la imaginación (mi padre me dijo una vez que la imaginación no servía para nada, qué equivocado estaba).

Pues bien, hoy ha sido uno de esos días que he dejado descargando un modelo «uncensored»: hoy día existen modelos ya entrenados que te puedes descargar y usarlos en LM Studio , una de las aplicaciones que te facilitan más la vida a la hora de trabajar de forma local con el contenido que quieras.

El equipo donde he realizado las imágenes que vais a ver a continuación es un i7-9700 a 3 Ghz, con 64 Gb de RAM y una NVIDIA GeForce #RTX4060 de 8 Gb, accesible prácticamente a cualquier bolsillo (ronda los 400 euros en marzo de 2026).

La imagen que encabeza este artículo está tomada de la página web de Mercedarias Granada FP , en concreto, en el apartado del Curso de Especialización en Ciberseguridad en Entornos de las Tecnologías de la Información, en la cual aparezco y también se entrevén algunos de los alumnos que estaban en el momento de la realización de la instantánea. Como es una imagen pública, podemos experimentar con ella.

Pues bien, empleando el modelo qwen3.5b-35b-uncensored-hauhaucs-aggressive (de 22 Gb de tamaño, esto no lo carga cualquiera: Windows toma 32 Gb de la RAM y se los presta a los 8 de la RTX; sé que con Linux iría mejor, pero me pasaré al pingüino definitivamente cuando Microsoft haga que .NET pueda levantar ventanas en Linux ), le he pedido que me haga un análisis forense detallado de la imagen que encabeza a este artículo y se la he adjuntado sin más. El prompt, para que sea exacto, ha de realizarse en inglés, así se entera mejor el agente, y le he dejado que lo genere, y me devuelve:

Bien, ya está hecho lo difícil, que la máquina sea capaz de describirme la escena. Traducido al español viene a ser:

Puede que sea un prompt algo pobre, pero vamos a ver qué es capaz de generar otra aplicación, que permite, online, hacer prompts y generar unas cuantas imágenes. Son las 8 primeras pero, también, le he pedido al agente que con el prompt que me ha proporcionado, genere él mismo otra imagen, cosa que no puede hacer porque «I am primarily text-based but often have an image generation capability attached. Let’s assume the role of providing the prompt and generating if possible, or describing how to generate it», vamos, que no. Pero, como buen samaritano, se ofrece a que Dall-E 3 me genere la imagen, que os pongo a continuación:

Por último, ¿observáis algún sesgo en las imágenes generadas?

Gracias por leerme.