La empresa de inteligencia artificial de Elon Musk, xAI, está progresando en la implementación de entradas multimodales en su chatbot Grok, según documentos públicos para desarrolladores. Esta mejora permitirá a los usuarios cargar imágenes en Grok y recibir respuestas en formato de texto.

El anuncio inicial se realizó en una entrada de blog el mes pasado por parte de xAI, donde se mencionaba que Grok-1.5V ofrecería “modelos multimodales en varios dominios”. Los últimos documentos para desarrolladores indican avances en la entrega de un nuevo modelo.

Los desarrolladores pueden aprovechar un script de Python de ejemplo en los documentos, el cual muestra cómo utilizar la biblioteca del kit de desarrollo de software de xAI para generar respuestas basadas en texto e imágenes. Este script permite la lectura de archivos de imagen, configura un texto de consulta y utiliza el SDK de xAI para generar una respuesta.

Esta actualización representa un gran avance para Grok, lanzado por xAI en noviembre de 2023 y disponible para usuarios que cuentan con la suscripción X Premium Plus. La versión más reciente, Grok 1.5 en marzo, incluyó mejoras en las capacidades de razonamiento.

El modelo está entrenado con datos de texto de fuentes públicas hasta el tercer trimestre de 2023 y conjuntos de datos revisados por humanos, según una publicación de blog de X. Aunque Grok-1 no fue entrenado en datos de X, tiene conocimiento en tiempo real del mundo, incluyendo publicaciones en X.

xAI, fundada por Elon Musk en marzo de 2023, es una compañía relativamente nueva en el campo de la IA y compite con rivales como el ChatGPT de OpenAI. Sin embargo, su modelo Grok 1.5 está cerrando la brecha con GPT-4 en diversos benchmarks, abarcando desde problemas de competición escolar hasta secundaria.

Los chatbots conversacionales multimodales parecen ser la próxima frontera para la IA, con múltiples avances anunciados en eventos como Google I/O y el lanzamiento de GPT-4o por parte de OpenAI. La carencia de capacidades multimodales había dejado a Grok rezagado, hasta ahora.

Leave a Reply

Your email address will not be published. Required fields are marked *

You May Also Like

Apple lanza actualizaciones iOS 18.3 y macOS Sequoia 15.3: Más de 20 mejoras de seguridad y nuevas funcionalidades

Apple ha lanzado hoy las actualizaciones iOS 18.3, iPadOS 18.3 y macOS…

Microsoft detiene actualizaciones a Windows 11 por una clave de registro que compromete la estabilidad del sistema Una nueva barrera impide a millones de ordenadores seguir actualizándose a Windows 11

En un giro inesperado que ha tomado por sorpresa a millones de…

Descubrimiento del ‘Asteroide de Navidad’: Un Posible Impacto con la Tierra en 2032

Un asteroide del tamaño de un campo de fútbol ha sido descubierto…

Google podría resolver problemas con el escáner de huellas dactilares en el Pixel 9 con tecnología ultrasónica

La próxima línea de Pixel 9 de Google contará con un escáner…

Porsche revela su segundo SUV eléctrico, el Macan, desde $80,450

Porsche ha presentado su esperado SUV eléctrico, el Macan, con un precio…

EE.UU. y Reino Unido Firman Tratado Internacional de IA

El 5 de septiembre de 2024, EE.UU., el Reino Unido y la…

Alerta de seguridad para más de 1.8 mil millones de usuarios de Gmail: implementa estos pasos críticos ahora

En la era digital actual, proteger nuestras cuentas en línea es más…

Iztapalapa: no explotó una pipa. Explotó el sistema de control

Columna escrita por Fernando Arrieta, Director Regional de G-CERTI Global Certification Lo…

Adobe revoluciona la edición de audio en Premiere Pro con potentes funciones impulsadas por IA

Adobe ha lanzado emocionantes actualizaciones en Premiere Pro, potenciando la edición de…

El Auge de las Stablecoins en 2025: Un Nuevo Horizonte para las Finanzas Globales

Un ecosistema cripto que no se detiene ante barreras regulatorias En un…