Meta ha anunciado el lanzamiento de la próxima generación de su gran modelo de lenguaje, Llama 3, que según la compañía supera a la mayoría de los modelos de IA actuales. Esta nueva versión, que se lanzará hoy para proveedores de nube como AWS y pronto estará disponible en bibliotecas de modelos como Hugging Face, ofrece un rendimiento mejorado y características avanzadas.
Llama 3 presenta dos pesos de modelo diferentes, con 8B y 70B parámetros respectivamente, lo que lo hace extremadamente potente en términos de complejidad y capacidad de comprensión durante el entrenamiento. Aunque por ahora solo ofrece respuestas basadas en texto, Meta asegura que estas representan “un gran avance” sobre la versión anterior. La compañía destaca que Llama 3 muestra una mayor diversidad en sus respuestas, menos negativas falsas y una capacidad de razonamiento mejorada en comparación con su predecesor.
En pruebas de referencia, Meta afirma que ambas versiones de Llama 3 superaron a modelos similares como Gemma y Gemini de Google, Mistral 7B y Claude 3 de Anthropic. Específicamente, en la prueba de referencia MMLU, Llama 3 8B superó significativamente a Gemma 7B y Mistral 7B, mientras que Llama 3 70B ligeramente superó a Gemini Pro 1.5.
Es importante destacar que el post de Meta, que cuenta con más de 2,700 palabras, no hace mención de GPT-4, el modelo insignia de OpenAI. Sin embargo, Meta asegura que Llama 3 ha sido evaluado positivamente incluso por evaluadores humanos, superando a modelos como GPT-3.5 en diversas pruebas de desempeño.
Se espera que Llama 3 continúe evolucionando, con la posibilidad de ofrecer tamaños de modelo aún más grandes y respuestas multimodales en el futuro. Aunque Meta no ha proporcionado una vista previa de estas versiones más grandes, afirma que los modelos en entrenamiento muestran un rendimiento prometedor en las pruebas iniciales.
Para obtener más información sobre las capacidades y el rendimiento de Llama 3, puedes consultar el artículo completo en el blog oficial de Meta.