Meta ha anunciado el lanzamiento de la próxima generación de su gran modelo de lenguaje, Llama 3, que según la compañía supera a la mayoría de los modelos de IA actuales. Esta nueva versión, que se lanzará hoy para proveedores de nube como AWS y pronto estará disponible en bibliotecas de modelos como Hugging Face, ofrece un rendimiento mejorado y características avanzadas.

Llama 3 presenta dos pesos de modelo diferentes, con 8B y 70B parámetros respectivamente, lo que lo hace extremadamente potente en términos de complejidad y capacidad de comprensión durante el entrenamiento. Aunque por ahora solo ofrece respuestas basadas en texto, Meta asegura que estas representan “un gran avance” sobre la versión anterior. La compañía destaca que Llama 3 muestra una mayor diversidad en sus respuestas, menos negativas falsas y una capacidad de razonamiento mejorada en comparación con su predecesor.

En pruebas de referencia, Meta afirma que ambas versiones de Llama 3 superaron a modelos similares como Gemma y Gemini de Google, Mistral 7B y Claude 3 de Anthropic. Específicamente, en la prueba de referencia MMLU, Llama 3 8B superó significativamente a Gemma 7B y Mistral 7B, mientras que Llama 3 70B ligeramente superó a Gemini Pro 1.5.

Es importante destacar que el post de Meta, que cuenta con más de 2,700 palabras, no hace mención de GPT-4, el modelo insignia de OpenAI. Sin embargo, Meta asegura que Llama 3 ha sido evaluado positivamente incluso por evaluadores humanos, superando a modelos como GPT-3.5 en diversas pruebas de desempeño.

Se espera que Llama 3 continúe evolucionando, con la posibilidad de ofrecer tamaños de modelo aún más grandes y respuestas multimodales en el futuro. Aunque Meta no ha proporcionado una vista previa de estas versiones más grandes, afirma que los modelos en entrenamiento muestran un rendimiento prometedor en las pruebas iniciales.

Para obtener más información sobre las capacidades y el rendimiento de Llama 3, puedes consultar el artículo completo en el blog oficial de Meta.

Leave a Reply

Your email address will not be published. Required fields are marked *

You May Also Like

Xbox y Meta presentan la verdadera experiencia portátil con la edición especial del Meta Quest 3S

Meta y Microsoft dan un golpe sobre la mesa con el lanzamiento…

Predicciones de precios al 4 de junio: BTC, ETH, XRP, BNB, SOL, DOGE, ADA, SUI, HYPE y LINK bajo presión crítica del mercado

El mundo de las criptomonedas se encuentra en un punto de inflexión.…

¿Estallará la Burbuja de la Inteligencia Artificial en 2025 o Será su Gran Año?

En 2025, la inteligencia artificial (IA) se enfrenta a un punto de…

Samsung Anuncia el Despliegue de One UI 7 Basado en Android 15: Todo lo que Necesitas Saber Sobre la Actualización y el Calendario Oficial para Dispositivos Galaxy

El gigante tecnológico surcoreano Samsung continúa demostrando su capacidad para ofrecer a…

Discord abre sus puertas a juegos y aplicaciones integradas en su plataforma de chat

Los desarrolladores ahora tienen la oportunidad de crear juegos y aplicaciones que…

Bitcoin rebota mientras los inversionistas buscan refugio frente al ataque de aranceles

En un contexto de creciente incertidumbre económica y comercial, Bitcoin ha demostrado…

China en ascenso, Estados Unidos en crisis: ¿Estamos presenciando el nacimiento de un nuevo orden global?

El tablero geopolítico internacional está experimentando una transformación profunda y acelerada que…

Google despide a ingeniero por protestar contra contrato de defensa israelí

Un ingeniero de software despedido de Google afirma que la empresa lo…

Hallazgo fósil de 19 millones de años revela conexión entre Australia y Nueva Zelanda a través de un ave extinta

Un hallazgo fósil de 19 millones de años reescribe la historia de…

Dyson revoluciona la limpieza con su nueva función de realidad aumentada

Dyson presenta CleanTrace, una innovadora función que utiliza la realidad aumentada para…