Incluso el CEO de Nvidia está obsesionado con la herramienta NotebookLM AI de Google
Luma AI afirma que su creador de imágenes Photon es más rápido que cualquier modelo comparable disponible actualmente.
La lista de modelos de imágenes generativas de IA sigue creciendo.
El lunes, la empresa de inteligencia artificial Luma lanzó Photon, su nuevo modelo de conversión de texto a imagen. Dirigido a diseñadores y creativos, el modelo se basa en el generador de vídeo Dream Machine de Luma, que permite a los usuarios crear clips de vídeo cortos a partir de las imágenes que cargan.
Al igual que Dream Machine, Photon está diseñado para todos y dirigido a aquellos que "construyen el mundo que nos rodea, desde diseñadores, cineastas, pensadores visuales hasta pequeñas empresas y educadores", explica el comunicado. Esto incluye casos de uso para todo, desde moda hasta arquitectura.
Con salida de múltiples imágenes y representación de texto nítido, Photon se basa en la arquitectura Universal Transformer personalizada de Luma, que según la compañía lo hace "800% más rápido y más barato que otros modelos comparables". Al igual que generadores similares, los usuarios pueden modificar sus indicaciones a medida que avanzan y editar y personalizar las imágenes resultantes.
Luma también anunció una API Photon, que podría lanzarse antes de finales de 2024. La API escalable permitirá a los desarrolladores crear contenido de texto a imagen y de imagen a imagen.
"La verdadera magia de Luma AI es convertirse en el hogar del ADN creativo único de cada creador (sus referencias, su estilo, su historia) mientras Dream Machine aprende y evoluciona con el viaje creativo de cada usuario", Anjney Midha, socia general de a16z. y miembro de la junta directiva de Luma AI, en el comunicado.
Luma quiere que los usuarios piensen en Dream Machine y Photon como verdaderos colaboradores creativos que pueden comprender los contextos y necesidades únicos de los usuarios. Una característica permite a los usuarios cargar una foto de una persona y crear un "personaje" reutilizable de ella que Photon puede representar en varios escenarios de una sola imagen, una herramienta ideal para campañas de lluvia de ideas. Los usuarios pueden cargar la imagen de la persona e incluir "@character" en su mensaje para activar la función.
Sin embargo, durante una demostración de ZDNET, Photon pareció tener algunos problemas al representar expresiones de apariencia natural para personajes en ciertas posiciones, lo que inmediatamente trae a la mente preocupaciones sobre deepfakes y otros posibles usos indebidos.
Las pautas de uso de Luma incluyen una nota sobre moderación de contenido que indica que la empresa eliminará ciertas imágenes generadas.
En particular, Luma afirma que los datos de entrada y salida de Photon no se utilizan para entrenar los modelos de la empresa. Cuando se le preguntó sobre el conjunto de datos de entrenamiento de Luma durante la demostración, el CEO Amit Jain dijo que no podía revelar qué incluye y si contiene material extraído de Internet o contenido con licencia.
En términos de derechos de autor, las pautas son un poco más vagas. La empresa pide a los usuarios "no solicitar ni generar contenido que infrinja materiales con derechos de autor o marcas registradas" y "siempre respetar los derechos de propiedad intelectual".
Por último, la compañía también lanzó una nueva interfaz para Dream Machine, que ya está disponible en la web y en iOS. Según la empresa, se puede utilizar con lenguaje natural: no es necesario aprender a ser un mejor ingeniero rápido.
La nueva interfaz es fácil de usar y recuerda a otros generadores que identifican descriptores clave en su mensaje y ofrecen un menú desplegable de alternativas similares en caso de que desee modificar su idea o explorar diferentes variaciones. El servicio está dirigido a cualquier usuario que desee explorar un concepto de diseño, repetir una idea de producto, realizar una lluvia de ideas y colaborar con los miembros del equipo a través de la práctica infraestructura del panel de estado de ánimo de Luma.
El "servicio de IA visual" también ofrece funciones de personalización para imágenes y vídeos, así como niveles de suscripción de pago gratuitos y a partir de 10 dólares al mes.