La carrera armamentista de la IA continúa a buen ritmo: Anthropic está lanzando su modelo más nuevo, llamado Claude 3.5 Sonnet, que según dice puede igualar o superar al GPT-4o de OpenAI o al Gemini de Google en una amplia variedad de tareas. El nuevo modelo ya está disponible para los usuarios de Claude en la web y en iOS, y Anthropic también lo está poniendo a disposición de los desarrolladores.

Claude 3.5 Sonnet será finalmente el modelo intermedio en la línea de Anthropic: Haiku para su modelo más pequeño, Sonnet para la opción intermedia y Opus para su modelo de gama más alta. La compañía afirma que 3.5 Sonnet supera a 3 Opus, y sus puntos de referencia muestran que lo hace por un margen bastante amplio. El nuevo modelo también es aparentemente el doble de rápido que el anterior, lo que podría ser aún más relevante.

Los puntos de referencia de los modelos de IA siempre deben tomarse con cautela; hay muchos, es fácil elegir los que te hacen lucir bien, y los modelos y productos están cambiando tan rápido que nadie parece tener una ventaja por mucho tiempo. Dicho esto, Claude 3.5 Sonnet parece impresionante: superó a GPT-4o, Gemini 1.5 Pro y Llama 3 400B de Meta en siete de nueve puntos de referencia generales y cuatro de cinco puntos de referencia de visión. Nuevamente, no leas demasiado en eso, pero parece que Anthropic ha construido un competidor legítimo en este espacio.

¿Qué significa todo esto?

Anthropic dice que Claude 3.5 Sonnet será mucho mejor escribiendo y traduciendo código, manejando flujos de trabajo de varios pasos, interpretando gráficos y tablas, y transcribiendo texto de imágenes. Este nuevo y mejorado Claude también es aparentemente mejor para entender el humor y puede escribir de una manera mucho más humana.

Nueva función: Artifacts

Junto con el nuevo modelo, Anthropic también está introduciendo una nueva función llamada Artifacts. Con Artifacts, podrás ver e interactuar con los resultados de tus solicitudes a Claude: si le pides al modelo que diseñe algo para ti, ahora puede mostrarte cómo se ve y dejarte editarlo directamente en la aplicación. Si Claude te escribe un correo electrónico, puedes editar el correo electrónico en la aplicación de Claude en lugar de tener que copiarlo a un editor de texto. Es una pequeña característica, pero ingeniosa: estas herramientas de IA necesitan convertirse en algo más que simples chatbots, y características como Artifacts simplemente le dan a la aplicación más cosas por hacer.

Artifacts en realidad parece ser una señal de la visión a largo plazo para Claude. Anthropic ha dicho durante mucho tiempo que se enfoca principalmente en negocios (incluso mientras contrata a personas de tecnología de consumo como el cofundador de Instagram, Mike Krieger) y dijo en su comunicado de prensa anunciando Claude 3.5 Sonnet que planea convertir a Claude en una herramienta para que las empresas “centralicen de manera segura su conocimiento, documentos y trabajo en curso en un espacio compartido”. Eso suena más a Notion o Slack que a ChatGPT, con los modelos de Anthropic en el centro de todo el sistema.

Por ahora, sin embargo, el modelo es la gran noticia. Y el ritmo de mejora aquí es increíble de observar: Anthropic lanzó Claude 3 Opus en marzo, diciendo con orgullo que era tan bueno como GPT-4 y Gemini 1.0, antes de que OpenAI y Google lanzaran mejores versiones de sus modelos. Ahora, Anthropic ha hecho su próximo movimiento, y seguramente no pasará mucho tiempo antes de que su competencia también lo haga. Claude no se menciona tanto como Gemini o ChatGPT, pero está muy metido en la carrera.

Leave a Reply

Your email address will not be published. Required fields are marked *

You May Also Like

Apple elimina soporte para aplicaciones web en iPhone para usuarios de la Unión Europea

Apple ha tomado la decisión oficial de suspender el soporte para aplicaciones…

Cómo la IA podría cambiar la carga de vehículos eléctricos

Nuevas herramientas de IA podrían proporcionar a las compañías eléctricas datos en…

X incorpora función de video en vivo a Spaces en lugar de revivir Periscope

La plataforma X ha dado un paso innovador al añadir la capacidad…

Ciberestafas a adultos mayores: la nueva cara del “cuento del tío” en la era digital

Columna de opinión por Maximiliano Ripani. Experto en Ciberseguridad de ZMA IT…

Debate Vice-Presidencial: Las Falsedades de JD Vance Sobre Inmigración y Sus Consecuencias

En el reciente debate vice-presidencial entre el gobernador de Minnesota, Tim Walz,…

Microsoft busca persuadir a usuarios de Windows 10 para que actualicen con mensajes a pantalla completa

Microsoft está desplegando una estrategia para convencer a los usuarios de Windows…

El Google TV Streamer: ¿El rival definitivo del Apple TV 4K?

Google ha presentado el Google TV Streamer, un nuevo dispositivo de transmisión…

Apple redefine el futuro: el iPhone de 2027 será de cristal, curvado y completamente pantalla

Un rediseño histórico con motivo del 20º aniversario del iPhone Apple se…

Microsoft y el debate sobre el uso justo del contenido en la web abierta

El jefe de Inteligencia Artificial de Microsoft, Mustafa Suleyman, ha desatado un…

Cómo Transmitir los Juegos Olímpicos como un Campeón

¿Cómo transmitir los Juegos Olímpicos 2024?Por una vez, la respuesta para cómo…