Google desafía a OpenAI con Imagen 3 y Veo, rivales de DALL-E 3 y Sora
Google I/O: Google presenta nuevos modelos de IA generativa, VEO y Imagen 3
VEO: El modelo de generación de vídeo más avanzado de Google
VEO es el modelo de generación de vídeo más avanzado de Google hasta la fecha. Es capaz de crear vídeos en alta definición 1080p que pueden durar más de un minuto, cubriendo una amplia gama de estilos visuales y cinematográficos. Lo más relevante es la consistencia y coherencia del metraje generado por VEO, con personas, animales y objetos que se mueven de manera realista a lo largo de las tomas.
Gracias a su comprensión avanzada del lenguaje natural y la semántica visual, VEO puede generar vídeos que reflejan fielmente la visión creativa del usuario. Es capaz de entender términos cinematográficos como "timelapse" o "tomas aéreas de un paisaje", ofreciendo así un control creativo sin precedentes.
Google ha estado invitando a cineastas y creadores a experimentar con VEO, a semejanza de lo que OpenAI ha estado haciendo con DALL-E 2. Un ejemplo de esto es la colaboración con el cineasta Donald Glover y su estudio creativo Gilga, quienes ya han experimentado con VEO en un proyecto cinematográfico.
Ejemplo de uso de VEO
Donald Glover: "VEO nos ha permitido explorar nuevas posibilidades creativas. Pudimos generar rápidamente una amplia gama de tomas, desde escenas de acción hasta secuencias de ensueño, y todo ello con un nivel de realismo impresionante. VEO está abriendo nuevas fronteras para la narración cinematográfica."
Cineasta y fundador de Gilga
Imagen 3: El modelo de texto a imagen de mayor calidad de Google
Imagen 3 es el modelo de IA de texto a imagen de Google como Midjourney o DALL-E 3 de mayor calidad hasta la fecha. Imagen 3 genera imágenes fotorrealistas y detalladas con menos artefactos (defectos visuales) que sus predecesores. Este modelo no solo entiende mejor el lenguaje natural y la intención detrás de los prompts introducidos por los usuarios, sino que también incorpora pequeños detalles que mejoran la fidelidad de las imágenes generadas.
Al igual que VEO, Imagen 3 está disponible en vista previa privada para un grupo selecto de creadores dentro de ImageFX. Próximamente estará disponible en Vertex AI Function.
Ejemplo de uso de Imagen 3
Generación de imágenes de paisajes
Prompt: "Una vasta pradera verde con un arroyo serpenteante y montañas nevadas al fondo"
Imagen generada: Una imagen fotorrealista de una pradera verde con un arroyo serpenteante y montañas nevadas al fondo. La imagen es detallada y realista, con nubes y sombras que añaden profundidad y dimensión.
Artículos relacionados