La empresa de inteligencia artificial de Elon Musk, xAI, está progresando en la implementación de entradas multimodales en su chatbot Grok, según documentos públicos para desarrolladores. Esta mejora permitirá a los usuarios cargar imágenes en Grok y recibir respuestas en formato de texto.

El anuncio inicial se realizó en una entrada de blog el mes pasado por parte de xAI, donde se mencionaba que Grok-1.5V ofrecería “modelos multimodales en varios dominios”. Los últimos documentos para desarrolladores indican avances en la entrega de un nuevo modelo.

Los desarrolladores pueden aprovechar un script de Python de ejemplo en los documentos, el cual muestra cómo utilizar la biblioteca del kit de desarrollo de software de xAI para generar respuestas basadas en texto e imágenes. Este script permite la lectura de archivos de imagen, configura un texto de consulta y utiliza el SDK de xAI para generar una respuesta.

Esta actualización representa un gran avance para Grok, lanzado por xAI en noviembre de 2023 y disponible para usuarios que cuentan con la suscripción X Premium Plus. La versión más reciente, Grok 1.5 en marzo, incluyó mejoras en las capacidades de razonamiento.

El modelo está entrenado con datos de texto de fuentes públicas hasta el tercer trimestre de 2023 y conjuntos de datos revisados por humanos, según una publicación de blog de X. Aunque Grok-1 no fue entrenado en datos de X, tiene conocimiento en tiempo real del mundo, incluyendo publicaciones en X.

xAI, fundada por Elon Musk en marzo de 2023, es una compañía relativamente nueva en el campo de la IA y compite con rivales como el ChatGPT de OpenAI. Sin embargo, su modelo Grok 1.5 está cerrando la brecha con GPT-4 en diversos benchmarks, abarcando desde problemas de competición escolar hasta secundaria.

Los chatbots conversacionales multimodales parecen ser la próxima frontera para la IA, con múltiples avances anunciados en eventos como Google I/O y el lanzamiento de GPT-4o por parte de OpenAI. La carencia de capacidades multimodales había dejado a Grok rezagado, hasta ahora.

Leave a Reply

Your email address will not be published. Required fields are marked *

You May Also Like

Runway Usa Miles de Videos de YouTube para Entrenar su Generador de Video AI

Runway ha revolucionado el campo de la inteligencia artificial (IA) con su…

Asteroide 2024 YR4 Activa Red Mundial de Defensa Espacial: Un Desafío Global a la Protección Planetaria

Recientemente, el asteroide 2024 YR4 ha sido identificado como una amenaza potencial…

El Ayaneo Next Lite: Próximo Competidor de Steam Deck con SteamOS se Prepara para su Lanzamiento

Conoce los detalles del próximo lanzamiento de Ayaneo, el competidor de Steam…

Apple Lanza Cargador MagSafe Más Rápido para iPhone 16 con Carga Inalámbrica de 25W

Apple ha presentado un nuevo cargador MagSafe más potente durante su evento…

Starlink Direct to Cell: Revolucionando la Conectividad Global con Internet Satelital para Móviles

Starlink Direct to Cell: Revolucionando la Conectividad Global con Internet Satelital para…

Elon Musk Publica Deepfake de Kamala Harris en X: Violación de Políticas de la Plataforma

Elon Musk, propietario de la plataforma X, ha publicado un video deepfake…

Cómo configurar horarios de sueño en iOS: Mejora tu rutina de descanso

Los horarios de sueño en iOS son una herramienta poderosa que te…

ChatGPT cumple dos años: la IA que ha revolucionado la investigación científica

En tan solo dos años desde su lanzamiento, ChatGPT ha dejado una…

El Polar Grit X2 Pro: Un Reloj Inteligente a la Deriva

Descubre el análisis completo del nuevo Polar Grit X2 Pro, un reloj…

Manor Lords: El juego de estrategia medieval que desafía y cautiva

Manor Lords, el esperado juego de estrategia de construcción de pueblos medievales,…