PinkWhale

Imagenes artísticas con una IA: VQGAN


¿Qué es VQGAN Y CLIP?

VQGAN es una inteligencia artificila desarrollada con técnicas de machine learning, más concretamente usa transformers. Por primera vez se consigue crear imagenes de alta definición usando esta técnica, la cual anteriormente solo podía desarrollar imagenes de baja resolución debido al exponencial uso de recursos conforme aumentan el número de píxeles.

CLIP es otra inteligencia artificial que permite convertir textos en imagenes. Es decir, le decimos a CLIP con texto, qué queremos que cree, por ejemplo «a red car», y esta lo crea usando VQGAN.

El resultado es simplemente asombroso. Además entenderá lo que queremos, por ejemplo, podremos acompañar con adjetivos lo que queramos crear, si decimos un «un coche rojo, estilo Van Gogh», lo entenderá y lo hará.

Todo este código está publicada bajo licencia MIT, esto quiere decir, que podremos usar el programa como queramos: modificarlo, redistribuirlo, e incluso comercializarlo. La licencia MIT es la más libre que existe y da libertad absoluta de uso, por tanto podremos hacer lo que queramos con el código.


over 1 year ago

Eric Li