La carrera armamentista de la IA continúa a buen ritmo: Anthropic está lanzando su modelo más nuevo, llamado Claude 3.5 Sonnet, que según dice puede igualar o superar al GPT-4o de OpenAI o al Gemini de Google en una amplia variedad de tareas. El nuevo modelo ya está disponible para los usuarios de Claude en la web y en iOS, y Anthropic también lo está poniendo a disposición de los desarrolladores.

Claude 3.5 Sonnet será finalmente el modelo intermedio en la línea de Anthropic: Haiku para su modelo más pequeño, Sonnet para la opción intermedia y Opus para su modelo de gama más alta. La compañía afirma que 3.5 Sonnet supera a 3 Opus, y sus puntos de referencia muestran que lo hace por un margen bastante amplio. El nuevo modelo también es aparentemente el doble de rápido que el anterior, lo que podría ser aún más relevante.

Los puntos de referencia de los modelos de IA siempre deben tomarse con cautela; hay muchos, es fácil elegir los que te hacen lucir bien, y los modelos y productos están cambiando tan rápido que nadie parece tener una ventaja por mucho tiempo. Dicho esto, Claude 3.5 Sonnet parece impresionante: superó a GPT-4o, Gemini 1.5 Pro y Llama 3 400B de Meta en siete de nueve puntos de referencia generales y cuatro de cinco puntos de referencia de visión. Nuevamente, no leas demasiado en eso, pero parece que Anthropic ha construido un competidor legítimo en este espacio.

¿Qué significa todo esto?

Anthropic dice que Claude 3.5 Sonnet será mucho mejor escribiendo y traduciendo código, manejando flujos de trabajo de varios pasos, interpretando gráficos y tablas, y transcribiendo texto de imágenes. Este nuevo y mejorado Claude también es aparentemente mejor para entender el humor y puede escribir de una manera mucho más humana.

Nueva función: Artifacts

Junto con el nuevo modelo, Anthropic también está introduciendo una nueva función llamada Artifacts. Con Artifacts, podrás ver e interactuar con los resultados de tus solicitudes a Claude: si le pides al modelo que diseñe algo para ti, ahora puede mostrarte cómo se ve y dejarte editarlo directamente en la aplicación. Si Claude te escribe un correo electrónico, puedes editar el correo electrónico en la aplicación de Claude en lugar de tener que copiarlo a un editor de texto. Es una pequeña característica, pero ingeniosa: estas herramientas de IA necesitan convertirse en algo más que simples chatbots, y características como Artifacts simplemente le dan a la aplicación más cosas por hacer.

Artifacts en realidad parece ser una señal de la visión a largo plazo para Claude. Anthropic ha dicho durante mucho tiempo que se enfoca principalmente en negocios (incluso mientras contrata a personas de tecnología de consumo como el cofundador de Instagram, Mike Krieger) y dijo en su comunicado de prensa anunciando Claude 3.5 Sonnet que planea convertir a Claude en una herramienta para que las empresas “centralicen de manera segura su conocimiento, documentos y trabajo en curso en un espacio compartido”. Eso suena más a Notion o Slack que a ChatGPT, con los modelos de Anthropic en el centro de todo el sistema.

Por ahora, sin embargo, el modelo es la gran noticia. Y el ritmo de mejora aquí es increíble de observar: Anthropic lanzó Claude 3 Opus en marzo, diciendo con orgullo que era tan bueno como GPT-4 y Gemini 1.0, antes de que OpenAI y Google lanzaran mejores versiones de sus modelos. Ahora, Anthropic ha hecho su próximo movimiento, y seguramente no pasará mucho tiempo antes de que su competencia también lo haga. Claude no se menciona tanto como Gemini o ChatGPT, pero está muy metido en la carrera.

Leave a Reply

Your email address will not be published. Required fields are marked *

You May Also Like

Cómo la compra de una agencia de K-pop está llevando a la caída del multimillonario tecnológico más rico de Corea

Kim Beom-su, fundador de Kakao Corp., enfrenta una batalla legal significativa tras…

Apple Lanza Actualizaciones Urgentes para Corregir Vulnerabilidades Zero-Day Activamente Explotadas en sus Dispositivos

Apple ha lanzado actualizaciones de seguridad críticas para sus sistemas operativos, incluidos…

Samsung Galaxy A56 y Galaxy A36: Lo que sabemos sobre su inminente lanzamiento

Samsung se prepara para sorprender al mercado con la llegada de sus…

AMD retrasa Ryzen 9000 por precaución: Nuevas fechas de lanzamiento anunciadas

AMD ha decidido retrasar ligeramente el lanzamiento de sus esperados CPUs de…

Apple Continúa Innovando con la Aplicación Calendario en iOS 18.3

Apple ha lanzado la esperada actualización iOS 18.3, trayendo consigo una serie…

Microsoft trabaja con Nvidia, AMD e Intel para mejorar el escalado en juegos de PC

Microsoft ha anunciado una colaboración con Nvidia, AMD e Intel para potenciar…

Los Reporteros de Semafor Lanzan Señales de Noticias con IA

En un movimiento innovador, Semafor está revolucionando la forma en que se…

Las mejores ofertas de videojuegos para PS5 en el Presidents’ Day 2025

El Presidents’ Day ha llegado y, con él, una de las mejores…

Ofertas de Pokémon Day 2025: Las Mejores Ofertas Directas de los Minoristas

Introducción: Lo mejor de Pokémon Day 2025: Ofertas y Reposiciones Directas de…

Venus: El planeta abrasador que nunca tuvo agua suficiente para la vida

El planeta Venus, vecino más cercano de la Tierra, ha sido un…