Meta desafía a ChatGPT con el lanzamiento de LLaMA 3 y el impulso de Meta AI
Meta, la empresa creada por Mark Zuckerberg, no parecía especialmente interesada en el ámbito de la inteligencia artificial (IA). El metaverso parecía centrar toda su atención, pero en realidad su división de IA estaba trabajando duro en los últimos meses. Esos esfuerzos han dado su fruto y hoy la compañía ha hecho un anuncio que puede ponerla a la vanguardia en el popular segmento de los grandes modelos de lenguaje (LLM), en el que OpenAI, Microsoft y Google también compiten.
Llama 3: El último gran modelo de lenguaje de Meta
La primera versión de Llama, lanzada en febrero de 2023, pasó algo desapercibida, pero ocurrió justo lo contrario en julio de 2023 cuando los ingenieros de Meta presentaron Llama 2. Más tarde, con Llama 2, la empresa se diferenció de la competencia por usar un modelo de código abierto (aunque no lo es del todo) y se convirtió en pilar para un gran número de desarrollos paralelos basados en ese modelo. De hecho, fue también especialmente interesante porque cualquiera podía descargarlo para tener su propio ChatGPT funcionando desde su PC.
Características de Llama 3
Los esfuerzos de Meta se han ido incrementando y ahora presentan Llama 3, la última gran versión de su modelo fundacional de código abierto. Según la compañía, Llama 3 supera a otros modelos similares en diversos benchmarks y destaca especialmente como asistente para programar. Las comillas del "código abierto" son importantes: el desarrollo usa una licencia comunitaria que, como en casos anteriores, no es exactamente lo mismo aunque se parezca bastante al código abierto.
Versiones y disponibilidad
Llama 3 está disponible actualmente en dos versiones: 8b y 70b, con 8.000 y 70.000 millones de parámetros respectivamente. Ambas se pueden descargar desde Meta con registro previo y ambas versiones están a su vez disponibles en dos vertientes: una preentrenada (el modelo crudo que predice el siguiente token a generar) y una pulida (para seguir las instrucciones de los usuarios). Ambas tienen un límite de contexto de 8.192 tokens, modesto si lo comparamos con propuestas como la de Claude 3 Opus, que admite ventanas de contexto de 200.000 tokens.
Entrenamiento y un gigantesco modelo 400b a la vista
Meta entrenó ambos modelos en un gigantesco clúster con 24.000 GPU en el caso del modelo 70b. Zuckerberg comentó en una entrevista con Dwarkesh Patel que ese entrenamiento podría haber seguido y esa variante podría haber sido mejor, pero prefirieron pasar a entrenar nuevos desarrollos y ofrecer esa versión 70b que, a pesar de todo, no estaba saturada por el entrenamiento. "Tras ingerir 15 billones de tokens, probablemente podríamos haberla alimentado con más tokens y se hubiera vuelto algo mejor", explicó Zuckerberg.
Meta AI se refuerza con Llama 3 y estrena versión web
El primer gran beneficiado de este lanzamiento es el chatbot de la compañía llamado Meta AI. Este desarrollo se lanzó en septiembre de 2023 y debutó como asistente integrado en WhatsApp, Facebook o Instagram. Ahora llega la versión web en https://meta-ai.com y tanto en ella como en esos asistentes integrados el chatbot está basado en Llama 3. De momento, Meta AI no está en español ni en España. Es posible usar el chatbot en la web sin registro, pero por ejemplo para algunas opciones como la de generar imágenes será necesario acceder con una cuenta de Facebook.
Objetivo: ganar a ChatGPT y al resto
El segmento de los chatbots de IA se anima ahora más que nunca y tenemos ante nosotros una nueva e interesante propuesta que lo es más precisamente por su filosofía casi de código abierto y porque podrá ser utilizado como base para desarrollos paralelos. La posibilidad de contar con una versión web que usar tanto desde el PC como desde el móvil y no solo como asistente integrado en las apps de Meta es el otro punto destacado de un lanzamiento que aumenta la presión contra ChatGPT, referente absoluto en este mercado pero que poco a poco va estando acorralado ante unas alternativas que mejoran a pasos agigantados.
Artículos relacionados