La carrera armamentista de la IA continúa a buen ritmo: Anthropic está lanzando su modelo más nuevo, llamado Claude 3.5 Sonnet, que según dice puede igualar o superar al GPT-4o de OpenAI o al Gemini de Google en una amplia variedad de tareas. El nuevo modelo ya está disponible para los usuarios de Claude en la web y en iOS, y Anthropic también lo está poniendo a disposición de los desarrolladores.

Claude 3.5 Sonnet será finalmente el modelo intermedio en la línea de Anthropic: Haiku para su modelo más pequeño, Sonnet para la opción intermedia y Opus para su modelo de gama más alta. La compañía afirma que 3.5 Sonnet supera a 3 Opus, y sus puntos de referencia muestran que lo hace por un margen bastante amplio. El nuevo modelo también es aparentemente el doble de rápido que el anterior, lo que podría ser aún más relevante.

Los puntos de referencia de los modelos de IA siempre deben tomarse con cautela; hay muchos, es fácil elegir los que te hacen lucir bien, y los modelos y productos están cambiando tan rápido que nadie parece tener una ventaja por mucho tiempo. Dicho esto, Claude 3.5 Sonnet parece impresionante: superó a GPT-4o, Gemini 1.5 Pro y Llama 3 400B de Meta en siete de nueve puntos de referencia generales y cuatro de cinco puntos de referencia de visión. Nuevamente, no leas demasiado en eso, pero parece que Anthropic ha construido un competidor legítimo en este espacio.

¿Qué significa todo esto?

Anthropic dice que Claude 3.5 Sonnet será mucho mejor escribiendo y traduciendo código, manejando flujos de trabajo de varios pasos, interpretando gráficos y tablas, y transcribiendo texto de imágenes. Este nuevo y mejorado Claude también es aparentemente mejor para entender el humor y puede escribir de una manera mucho más humana.

Nueva función: Artifacts

Junto con el nuevo modelo, Anthropic también está introduciendo una nueva función llamada Artifacts. Con Artifacts, podrás ver e interactuar con los resultados de tus solicitudes a Claude: si le pides al modelo que diseñe algo para ti, ahora puede mostrarte cómo se ve y dejarte editarlo directamente en la aplicación. Si Claude te escribe un correo electrónico, puedes editar el correo electrónico en la aplicación de Claude en lugar de tener que copiarlo a un editor de texto. Es una pequeña característica, pero ingeniosa: estas herramientas de IA necesitan convertirse en algo más que simples chatbots, y características como Artifacts simplemente le dan a la aplicación más cosas por hacer.

Artifacts en realidad parece ser una señal de la visión a largo plazo para Claude. Anthropic ha dicho durante mucho tiempo que se enfoca principalmente en negocios (incluso mientras contrata a personas de tecnología de consumo como el cofundador de Instagram, Mike Krieger) y dijo en su comunicado de prensa anunciando Claude 3.5 Sonnet que planea convertir a Claude en una herramienta para que las empresas “centralicen de manera segura su conocimiento, documentos y trabajo en curso en un espacio compartido”. Eso suena más a Notion o Slack que a ChatGPT, con los modelos de Anthropic en el centro de todo el sistema.

Por ahora, sin embargo, el modelo es la gran noticia. Y el ritmo de mejora aquí es increíble de observar: Anthropic lanzó Claude 3 Opus en marzo, diciendo con orgullo que era tan bueno como GPT-4 y Gemini 1.0, antes de que OpenAI y Google lanzaran mejores versiones de sus modelos. Ahora, Anthropic ha hecho su próximo movimiento, y seguramente no pasará mucho tiempo antes de que su competencia también lo haga. Claude no se menciona tanto como Gemini o ChatGPT, pero está muy metido en la carrera.

Leave a Reply

Your email address will not be published. Required fields are marked *

You May Also Like

El Volvo EX90: Innovación eléctrica con tecnología LiDAR que puede afectar a las cámaras de los smartphones

Volvo ha dado un salto tecnológico con su SUV eléctrico de última…

Google Refuerza la Seguridad en Android con Reinicio Automático tras Tres Días de Inactividad

La seguridad digital es un tema que gana cada vez más protagonismo…

Tesla cobrará a propietarios de Model Y para ampliar la autonomía

Descubre cómo Tesla planea desbloquear más autonomía en los Model Y, con…

Nvidia realizará la presentación principal en CES 2025 mientras circulan rumores sobre la RTX 5090

El CEO de Nvidia, Jensen Huang, ofrecerá una presentación principal en CES…

Notion Calendar: La Nueva Aplicación de Calendario que Revoluciona la Organización de Reuniones

Descubre cómo Notion Calendar, la reciente incorporación tras la adquisición de Cron…

Para no dejarlo escapar: el Amazfit Cheetah Pro con Inteligencia Artificial, GPS, navegación y llamadas,

Con el Black Friday 2024 en pleno auge, Amazfit presenta una oferta…

OpenAI soluciona la “pereza” de GPT-4 con actualizaciones innovadoras

En un esfuerzo por mejorar el rendimiento de GPT-4, OpenAI presenta nuevas…

GEEKOM QS: El primer Mini-PC del mundo basado en un SoC Qualcomm Snapdragon X Elite

Introducción En el mundo de la computación personal, la revolución de los…

DirecTV y Dish se Fusionan: Un Nuevo Gigante del Streaming por Satélite en EE. UU.

DirecTV ha acordado adquirir Dish TV, Sling TV y el resto del…