La empresa de inteligencia artificial de Elon Musk, xAI, está progresando en la implementación de entradas multimodales en su chatbot Grok, según documentos públicos para desarrolladores. Esta mejora permitirá a los usuarios cargar imágenes en Grok y recibir respuestas en formato de texto.

El anuncio inicial se realizó en una entrada de blog el mes pasado por parte de xAI, donde se mencionaba que Grok-1.5V ofrecería “modelos multimodales en varios dominios”. Los últimos documentos para desarrolladores indican avances en la entrega de un nuevo modelo.

Los desarrolladores pueden aprovechar un script de Python de ejemplo en los documentos, el cual muestra cómo utilizar la biblioteca del kit de desarrollo de software de xAI para generar respuestas basadas en texto e imágenes. Este script permite la lectura de archivos de imagen, configura un texto de consulta y utiliza el SDK de xAI para generar una respuesta.

Esta actualización representa un gran avance para Grok, lanzado por xAI en noviembre de 2023 y disponible para usuarios que cuentan con la suscripción X Premium Plus. La versión más reciente, Grok 1.5 en marzo, incluyó mejoras en las capacidades de razonamiento.

El modelo está entrenado con datos de texto de fuentes públicas hasta el tercer trimestre de 2023 y conjuntos de datos revisados por humanos, según una publicación de blog de X. Aunque Grok-1 no fue entrenado en datos de X, tiene conocimiento en tiempo real del mundo, incluyendo publicaciones en X.

xAI, fundada por Elon Musk en marzo de 2023, es una compañía relativamente nueva en el campo de la IA y compite con rivales como el ChatGPT de OpenAI. Sin embargo, su modelo Grok 1.5 está cerrando la brecha con GPT-4 en diversos benchmarks, abarcando desde problemas de competición escolar hasta secundaria.

Los chatbots conversacionales multimodales parecen ser la próxima frontera para la IA, con múltiples avances anunciados en eventos como Google I/O y el lanzamiento de GPT-4o por parte de OpenAI. La carencia de capacidades multimodales había dejado a Grok rezagado, hasta ahora.

Leave a Reply

Your email address will not be published. Required fields are marked *

You May Also Like

El futuro de Xbox se revelará el 15 de febrero: Microsoft detalla sus planes

Microsoft está listo para revelar su visión para el futuro de Xbox…

Samsung Galaxy Ring: Análisis Completo del Nuevo Anillo Inteligente

El Samsung Galaxy Ring marca una nueva era en el mundo de…

Evento de lanzamiento del iPhone 16 de Apple en septiembre de 2024

Apple ha confirmado que su próximo gran evento de lanzamiento se celebrará…

Meta abandona los chatbots de celebridades y apuesta por AI Studio para creadores

Meta ha decidido cerrar sus chatbots de inteligencia artificial (IA) que permitían…

Samsung detalla mejoras de audio para teléfonos, tabletas y TVs: Auracast, Audio 360 y Auto Switch

Samsung ha lanzado una serie de mejoras en su tecnología de audio…

Cómo ver el Xbox Developer Direct 2024: Novedades de Juegos y Detalles del Evento

El mundo de los videojuegos se prepara para el primer gran evento…

Google actualiza su IA Gemini

Google ha lanzado una importante actualización para su IA Gemini con el…

Microsoft revela cuánto cuesta mantener Windows 10 seguro después de 2025

Descubre cuánto tendrás que pagar para mantener Windows 10 seguro después de…

Por qué la NASA sigue respaldando a Boeing a pesar del fiasco del Starliner

La semana pasada, la nave espacial Starliner de Boeing aterrizó en Nuevo…

Adobe Presenta Innovadoras Herramientas de IA para Crear Animaciones y Mejorar Videos

Adobe está revolucionando el mundo de la creación de contenido con sus…