Argonauta chica escuchando musica con un fondo estilo ciberpunk
Sin categoría

Generando imágenes con Stable Diffusion XL

Difusión estable: ¿Qué es?

La difusión estable es una tecnología revolucionaria que ha ganado mucha atención en los últimos años debido a su capacidad para generar imágenes y videos de alta calidad. Se ha utilizado en varias aplicaciones, incluida la visión por computadora, el procesamiento de imágenes y la generación de video. En este artículo, profundizaremos en los detalles de la difusión estable, comprenderemos cómo funciona y analizaremos sus posibilidades y limitaciones.

¿Cómo funciona la difusión estable?

Stable diffusion o difusión estable se basa en el concepto de modelos de difusión, que se introdujeron en el campo de los gráficos por computadora en la década de 1980. La idea detrás de los modelos de difusión es simular el comportamiento de las partículas a medida que se mueven a través de un medio, como el aire o el agua. Al simular este comportamiento, los investigadores pueden crear animaciones realistas y efectos especiales para películas y programas de televisión.

El algoritmo de difusión estable lleva este concepto un paso más allá al introducir un término de estabilidad en la ecuación. Este término de estabilidad asegura que las imágenes generadas no solo sean visualmente atractivas sino también físicamente plausibles. En otras palabras, el algoritmo genera imágenes que son consistentes con las leyes de la física y no contienen artefactos o inconsistencias.

Posibles aplicaciones de difusión estable.

La difusión estable ofrece un amplio abanico de posibilidades en varios campos, entre ellos:

Visión por computador

La difusión estable se puede utilizar en la visión por computadora para generar imágenes y videos de alta calidad. Por ejemplo, se puede usar para crear datos sintéticos para entrenar modelos de aprendizaje automático, lo que reduce la necesidad de recopilar datos del mundo real. Además, se puede utilizar para mejorar la imagen, eliminar el ruido y super-resolución.


Generación de vídeo

La difusión estable se puede utilizar para generar videos de alta calidad para diversas aplicaciones, como producción de películas y televisión, publicidad y realidad virtual. Se puede utilizar para crear animaciones realistas, movimientos de personajes y escenas de fondo.


Imágenes medicas

La difusión estable se puede utilizar en imágenes médicas para generar imágenes de alta calidad para el diagnóstico y la planificación del tratamiento. Por ejemplo, se puede usar para crear tomografías computarizadas sintéticas, resonancias magnéticas e imágenes de ultrasonido, lo que reduce la necesidad de procedimientos invasivos. Además, se puede utilizar para mejorar la calidad de las imágenes médicas del mundo real, mejorando la precisión del diagnóstico.

Como probar el nuevo Stable diffusion XL

Simplemente tendremos que ir a github a la siguiente dirección y tendremos disponible un notebook preparado para ejecutar el modelo en collab, la URL es la siguiente: https://github.com/Stability-AI/StableSwarmUI/tree/master/colab podemos acceder directamente desde collab.

Si ejecutamos las dos celdas tendremos un enlace parecido a este:

Enlace a la UI grafica de Stable diffusion XL https://portsmouth-containers-judy-beth.trycloudflare.com/

Una vez dentro nos llevará a la UI, llamada StableSwarmUI, que debería tener el siguiente aspecto:

Una vez en la UI solo nos queda introducir nuestro texto y pulsar el botón «Generate Image», la primera vez tardará unos segundos por que tiene que cargar el modelo, las siguientes peticiones deberían tardar entre 20 y 30 segundos dependiendo de las opciones que elijamos.

Os dejo algunos ejemplos con los que he estado probando, el resultado, al menos a mi me parece increíble:

La propia UI te guarda los «prompts» que he usado os dejo aquí el listado de las imágenes anteriores:

  • landscape in the mountains, falling sun, river in the center, yellow trees, orange sky with clouds
  • penguin with rollerblades skating in a city, graffiti style
  • sailor argonaut navigating inside electronic circuit modern style urban ciberpunk
  • sailor navigating inside electronic circuit modern style urban ciberpunk

¿Que «prompts» te han parecido interesantes en tus ejecuciones?

¡Ahora es vuestro turno!

Espero que el articulo o mas bien un registro de los pasos que he seguido para probarlo os haya parecido tan interesante como a mi, saludos argonautas y hasta la próxima!!!

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *