La carrera armamentista de la IA continúa a buen ritmo: Anthropic está lanzando su modelo más nuevo, llamado Claude 3.5 Sonnet, que según dice puede igualar o superar al GPT-4o de OpenAI o al Gemini de Google en una amplia variedad de tareas. El nuevo modelo ya está disponible para los usuarios de Claude en la web y en iOS, y Anthropic también lo está poniendo a disposición de los desarrolladores.
Claude 3.5 Sonnet será finalmente el modelo intermedio en la línea de Anthropic: Haiku para su modelo más pequeño, Sonnet para la opción intermedia y Opus para su modelo de gama más alta. La compañía afirma que 3.5 Sonnet supera a 3 Opus, y sus puntos de referencia muestran que lo hace por un margen bastante amplio. El nuevo modelo también es aparentemente el doble de rápido que el anterior, lo que podría ser aún más relevante.
Los puntos de referencia de los modelos de IA siempre deben tomarse con cautela; hay muchos, es fácil elegir los que te hacen lucir bien, y los modelos y productos están cambiando tan rápido que nadie parece tener una ventaja por mucho tiempo. Dicho esto, Claude 3.5 Sonnet parece impresionante: superó a GPT-4o, Gemini 1.5 Pro y Llama 3 400B de Meta en siete de nueve puntos de referencia generales y cuatro de cinco puntos de referencia de visión. Nuevamente, no leas demasiado en eso, pero parece que Anthropic ha construido un competidor legítimo en este espacio.
¿Qué significa todo esto?
Anthropic dice que Claude 3.5 Sonnet será mucho mejor escribiendo y traduciendo código, manejando flujos de trabajo de varios pasos, interpretando gráficos y tablas, y transcribiendo texto de imágenes. Este nuevo y mejorado Claude también es aparentemente mejor para entender el humor y puede escribir de una manera mucho más humana.
Nueva función: Artifacts
Junto con el nuevo modelo, Anthropic también está introduciendo una nueva función llamada Artifacts. Con Artifacts, podrás ver e interactuar con los resultados de tus solicitudes a Claude: si le pides al modelo que diseñe algo para ti, ahora puede mostrarte cómo se ve y dejarte editarlo directamente en la aplicación. Si Claude te escribe un correo electrónico, puedes editar el correo electrónico en la aplicación de Claude en lugar de tener que copiarlo a un editor de texto. Es una pequeña característica, pero ingeniosa: estas herramientas de IA necesitan convertirse en algo más que simples chatbots, y características como Artifacts simplemente le dan a la aplicación más cosas por hacer.
Artifacts en realidad parece ser una señal de la visión a largo plazo para Claude. Anthropic ha dicho durante mucho tiempo que se enfoca principalmente en negocios (incluso mientras contrata a personas de tecnología de consumo como el cofundador de Instagram, Mike Krieger) y dijo en su comunicado de prensa anunciando Claude 3.5 Sonnet que planea convertir a Claude en una herramienta para que las empresas “centralicen de manera segura su conocimiento, documentos y trabajo en curso en un espacio compartido”. Eso suena más a Notion o Slack que a ChatGPT, con los modelos de Anthropic en el centro de todo el sistema.
Por ahora, sin embargo, el modelo es la gran noticia. Y el ritmo de mejora aquí es increíble de observar: Anthropic lanzó Claude 3 Opus en marzo, diciendo con orgullo que era tan bueno como GPT-4 y Gemini 1.0, antes de que OpenAI y Google lanzaran mejores versiones de sus modelos. Ahora, Anthropic ha hecho su próximo movimiento, y seguramente no pasará mucho tiempo antes de que su competencia también lo haga. Claude no se menciona tanto como Gemini o ChatGPT, pero está muy metido en la carrera.