La empresa de inteligencia artificial de Elon Musk, xAI, está progresando en la implementación de entradas multimodales en su chatbot Grok, según documentos públicos para desarrolladores. Esta mejora permitirá a los usuarios cargar imágenes en Grok y recibir respuestas en formato de texto.

El anuncio inicial se realizó en una entrada de blog el mes pasado por parte de xAI, donde se mencionaba que Grok-1.5V ofrecería “modelos multimodales en varios dominios”. Los últimos documentos para desarrolladores indican avances en la entrega de un nuevo modelo.

Los desarrolladores pueden aprovechar un script de Python de ejemplo en los documentos, el cual muestra cómo utilizar la biblioteca del kit de desarrollo de software de xAI para generar respuestas basadas en texto e imágenes. Este script permite la lectura de archivos de imagen, configura un texto de consulta y utiliza el SDK de xAI para generar una respuesta.

Esta actualización representa un gran avance para Grok, lanzado por xAI en noviembre de 2023 y disponible para usuarios que cuentan con la suscripción X Premium Plus. La versión más reciente, Grok 1.5 en marzo, incluyó mejoras en las capacidades de razonamiento.

El modelo está entrenado con datos de texto de fuentes públicas hasta el tercer trimestre de 2023 y conjuntos de datos revisados por humanos, según una publicación de blog de X. Aunque Grok-1 no fue entrenado en datos de X, tiene conocimiento en tiempo real del mundo, incluyendo publicaciones en X.

xAI, fundada por Elon Musk en marzo de 2023, es una compañía relativamente nueva en el campo de la IA y compite con rivales como el ChatGPT de OpenAI. Sin embargo, su modelo Grok 1.5 está cerrando la brecha con GPT-4 en diversos benchmarks, abarcando desde problemas de competición escolar hasta secundaria.

Los chatbots conversacionales multimodales parecen ser la próxima frontera para la IA, con múltiples avances anunciados en eventos como Google I/O y el lanzamiento de GPT-4o por parte de OpenAI. La carencia de capacidades multimodales había dejado a Grok rezagado, hasta ahora.

Leave a Reply

Your email address will not be published. Required fields are marked *

You May Also Like

Microsoft Revoluciona Windows 11 con la Función Copilot de IA para Pantallas Anchas

Microsoft ha anunciado una emocionante actualización para Windows 11, enfocada en la…

La pregunta de $50 mil millones de Elon Musk llega al límite

El próximo jueves, los accionistas de Tesla enfrentarán una decisión crucial: aprobar…

DHS Prioriza la Seguridad ante Ciberataques desde China hasta 2025

El Departamento de Seguridad Nacional (DHS) de Estados Unidos ha identificado la…

Elon Musk enfrenta a los ‘rompedores de juramentos’ de Tesla en la lucha por su paquete de pago de $56 mil millones

El CEO de Tesla, Elon Musk, está reuniendo a las tropas en…

Ford, Mercedes y Tesla lideran ranking global por sostenibilidad

Ford, Mercedes-Benz y Tesla se destacan como los líderes en un nuevo…

Microsoft nombra a Pavan Davuluri como nuevo jefe de Windows y Surface

Microsoft ha designado a Pavan Davuluri como el nuevo líder de Windows…

Tesla Reporta Menos Entregas de Vehículos en Segundo Trimestre Consecutivo

Tesla ha publicado su más reciente informe trimestral de producción y entrega,…

Empresas líderes de IA se comprometen a combatir el abuso infantil en línea

Las principales empresas de tecnología, incluyendo Google, Meta, OpenAI, Microsoft y Amazon,…

Volkswagen invertirá hasta $5 mil millones en Rivian en una nueva empresa conjunta de vehículos eléctricos

Volkswagen invertirá $1 mil millones en Rivian como parte de una nueva…

Error en iOS 17.5: Fotos Eliminadas Vuelven a Aparecer en iPhones, Usuarios Alarmados

Los propietarios de iPhone están experimentando un inconveniente alarmante tras la última…