El generador de paisaje GauGAN AI de NVIDIA ahora puede crear escenas desde cero a partir de descripciones escritas

NVIDIA ha estado haciendo muchas cosas interesantes con la IA. Una de esas cosas es GauGAN AI, algo así como un predecesor de la aplicación Canvas de NVIDIA, que revisamos aquí cuando intenté recrear algunas de mis fotografías de paisajes con él. Bueno, GauGAN2 está aquí ahora y se ha vuelto más inteligente. Mucho más inteligente. Ya no solo pintas píxeles de colores donde quieres que estén las cosas. ¡Oh no, ahora realmente entiende lo que dices!

Y a diferencia de Canvas, que se puede descargar gratis pero limitado a aquellos con una GPU NVIDIA RTX, cualquiera puede probar GauGAN2 a través de su práctica interfaz web.

La parte GAN de GuaGAN significa redes generativas de confrontación. En pocas palabras, se trata de dos redes que compiten entre sí. Uno está generando algo que espera que parezca real, mientras que el otro está mirando ese algo para ver si es real o falso en comparación con las cosas reales que sabe que existen en el mundo real. Esta segunda mitad de la ecuación también puede volver al generador y decirle cómo mejorar.

Esa es una explicación muy, muy simplificada del proceso, pero así es esencialmente como funciona GuaGAN para generar sus paisajes de IA. Y ahora puede generarlos ingresando una frase simple, como las sugerencias de NVIDIA “puesta de sol en la playa” u “olas del océano golpeando rocas en la playa”. O puede hacer lo que hice y ver qué tan bien maneja “bosque brumoso con montañas al fondo y un cielo azul” y ver qué sucede.

Bueno, esto pasó …

No es exactamente lo que había imaginado, pero está bastante cerca. Ciertamente no vi tantas nubes en mi cabeza, pero las montañas del bosque brumoso son acertadas. Y esto fue solo desde una sola línea de texto sin realmente dibujar nada en la pantalla manualmente.

Sin embargo, no solo tienes que pintar o describir una escena. Puede hacer una combinación de ambos, generando un mapa de segmentación de su descripción y luego ajustándolo cepillando información y detalles adicionales. NVIDIA dice que GuaGAN2 es uno de los primeros ejemplos en combinar múltiples modalidades dentro de una sola red, lo que lo convierte en una poderosa herramienta de generación de imágenes para crear arte realista con una combinación de palabras y bocetos simples.

En última instancia, NVIDIA quiere que sea más rápido e inteligente permitir que los artistas conviertan fácilmente sus ideas en imágenes. En lugar de tener que dibujar una escena completa desde cero, podrán describir una escena y hacer que la IA genere algo que los usuarios puedan usar como punto de partida para su trabajo. NVIDIA dice, “este punto de partida se puede personalizar con bocetos para hacer una montaña específica más alta o agregar un par de árboles en primer plano o nubes en el cielo”.

Es una pieza de tecnología fascinante y estoy deseando ver que esto mejore en el futuro. Ya a partir de mis pruebas simples con GauGAN2, ya ha recorrido un largo camino desde que probé Canvas hace solo un par de meses.

Si desea obtener más información, diríjase al Blog de NVIDIA y asegúrese de probarlo usted mismo.

Publicaciones relacionadas

Botón volver arriba