La nueva función de razonamiento visual de GPT-4 permite identificar coordenadas a partir de elementos como arquitectura o señales viales

ChatGPT, el modelo de inteligencia artificial desarrollado por OpenAI, ha alcanzado nuevos niveles de precisión en el análisis visual, permitiendo identificar ubicaciones geográficas a partir de imágenes. Esta innovación ha despertado tanto entusiasmo como preocupación, dado que ofrece la posibilidad de deducir las coordenadas exactas de una foto sin necesidad de tener acceso a los metadatos, es decir, sin requerir información adicional que normalmente se incluye en los archivos de imagen, como los datos GPS. En este artículo, exploraremos cómo funciona esta nueva capacidad, sus implicaciones para la privacidad y las medidas necesarias para usarla de manera segura.

Cómo ChatGPT identifica ubicaciones a partir de imágenes

La capacidad de ChatGPT para identificar ubicaciones geográficas a partir de fotografías es el resultado de la integración de dos tecnologías avanzadas: visión computacional y procesamiento de lenguaje natural. Al recibir una imagen, el modelo analiza una serie de elementos visuales que podrían incluir arquitectura, vegetación, señales viales, matrículas de vehículos, idiomas en los carteles, diseño urbano y estilo arquitectónico. Estos detalles, que pueden parecer triviales a simple vista, permiten al sistema comparar la imagen con su vasto banco de datos geográficos, culturales y visuales, y deducir con asombrosa precisión la ubicación donde fue tomada la foto.

Por ejemplo, una simple imagen de un menú de restaurante, un paisaje urbano o incluso una postal turística, podría ofrecer suficientes pistas para identificar no solo la ciudad, sino también la ubicación exacta, como un barrio o una plaza, si se toman en cuenta elementos visuales como el estilo de los edificios o la tipografía en los carteles.

El funcionamiento detrás de este razonamiento visual se basa en el análisis detallado de las características visuales. A través de las versiones avanzadas de modelos como GPT-4 y o3, OpenAI ha logrado entrenar a ChatGPT para reconocer y asociar patrones visuales con lugares reales. Este desarrollo también se extiende a modelos como GPT-4o, que perfecciona aún más la precisión y la velocidad con la que el modelo puede ofrecer respuestas sobre ubicaciones.

La privacidad, un tema clave en el uso de esta tecnología

Aunque las capacidades de ChatGPT para identificar ubicaciones a partir de imágenes representan una fascinante aplicación de la inteligencia artificial, también plantean serias preocupaciones en torno a la privacidad. En este sentido, expertos en seguridad y privacidad han señalado los riesgos inherentes a esta función, especialmente en el contexto del doxxing, que es la revelación no autorizada de información personal sensible.

A diferencia de otros modelos de IA que requieren metadatos para localizar una imagen, la capacidad de ChatGPT para hacer esto sin necesidad de datos adicionales expone a los usuarios a la posibilidad de que detalles mínimos en sus imágenes, tales como señales viales, elementos arquitectónicos o incluso las texturas de las calles, sean suficientes para deducir la ubicación exacta donde se capturó la foto.

TechSpot y TechCrunch, dos de los medios más destacados en temas de tecnología, advierten que esta nueva característica podría ser utilizada para hacer un seguimiento no autorizado de personas. De hecho, según algunos especialistas, es posible que una persona pueda ser “doxxed” con tan solo una foto tomada en un lugar público, sin que la persona se dé cuenta de que está dejando pistas que pueden ser interpretadas por la IA.

OpenAI, al ser consciente de estos riesgos, ha reiterado que su intención no es crear un sistema que promueva prácticas como el doxxing. Un portavoz de la compañía afirmó que sus modelos han sido diseñados con salvaguardas para evitar que puedan ser utilizados para identificar a personas en situaciones privadas. La compañía también ha implementado restricciones para rechazar cualquier solicitud que implique obtener información privada o sensible.

¿Cómo se activa esta función en ChatGPT?

Para acceder a la función de análisis de imágenes, los usuarios deben contar con una versión avanzada de ChatGPT, como GPT-4, que incluye capacidades de razonamiento visual. El proceso para activar la funcionalidad es relativamente sencillo: basta con cargar una fotografía, hacer una pregunta como “¿Dónde fue tomada esta foto?” y esperar la respuesta del modelo. En algunos casos, la respuesta incluirá una descripción contextual del lugar junto con las coordenadas exactas.

La versatilidad de esta función permite que incluso las imágenes cotidianas, como selfies o fotos tomadas en restaurantes o viajes, puedan ser utilizadas para deducir la ubicación precisa. Sin embargo, como veremos más adelante, los usuarios deben tener en cuenta ciertas precauciones al compartir este tipo de imágenes.

Precauciones a la hora de compartir imágenes

Aunque las capacidades de ChatGPT para identificar ubicaciones a partir de imágenes son impresionantes, los usuarios deben ser cautelosos al compartir fotografías que puedan revelar detalles sobre su ubicación o información personal. Las recomendaciones de expertos en privacidad incluyen:

Evitar compartir imágenes tomadas desde el interior de la vivienda, ya que esto puede revelar elementos del entorno exterior, como vistas de la calle o señales distintivas que podrían ser utilizadas para localizar el lugar.
No publicar fotografías en tiempo real que muestren ubicaciones sensibles, como el interior de hogares, oficinas o sitios privados.
Revisar cuidadosamente cada imagen antes de compartirla en redes sociales o enviarla por mensajería, asegurándose de que no haya detalles visuales que puedan identificar la ubicación.
Eliminar los metadatos de las imágenes siempre que sea posible. Sin embargo, como ya se explicó, aunque los metadatos pueden ser útiles, no son necesarios para la funcionalidad de razonamiento visual de GPT-4 y otros modelos avanzados.

El potencial positivo de esta tecnología

A pesar de los riesgos asociados con la privacidad, también existen aplicaciones beneficiosas para esta nueva capacidad de ChatGPT. El razonamiento visual podría ser utilizado en una variedad de campos, incluyendo la accesibilidad, la investigación científica y la respuesta a emergencias.

Por ejemplo, esta herramienta podría facilitar la identificación de lugares en situaciones de desastre natural, donde las imágenes tomadas por los usuarios podrían ser analizadas para determinar ubicaciones precisas y así orientar las labores de rescate. También podría ayudar a personas con discapacidades visuales a acceder a información sobre su entorno mediante la interpretación de imágenes, lo que podría mejorar su calidad de vida.

Además, en el campo de la investigación, la capacidad de identificar ubicaciones a partir de imágenes podría ser utilizada para analizar patrones urbanos, estudiar la distribución de ciertos tipos de arquitectura, o incluso para facilitar la planificación de proyectos urbanos.

El desarrollo de la función de razonamiento visual de ChatGPT representa un avance significativo en la inteligencia artificial, ofreciendo una nueva forma de interactuar con imágenes y obtener información útil de ellas. Sin embargo, también es importante considerar los riesgos que implica el uso de esta tecnología, especialmente en lo que respecta a la privacidad y la seguridad de las personas. OpenAI ha tomado medidas para evitar el uso indebido de la herramienta, pero es responsabilidad de los usuarios tomar precauciones al compartir imágenes que podrían revelar información sensible. A medida que la IA continúa avanzando, es fundamental que se sigan implementando salvaguardas para proteger los derechos y la privacidad de los individuos.

La nueva función de razonamiento visual de GPT-4 permite identificar coordenadas a partir de elementos como arquitectura o señales viales

Up next

Por qué los robots no pueden marcar la casilla ‘No soy un robot’: el desafío de los sistemas de inteligencia artificial

Tags

Share article

Cómo ChatGPT identifica ubicaciones a partir de imágenes

La privacidad, un tema clave en el uso de esta tecnología

¿Cómo se activa esta función en ChatGPT?

Precauciones a la hora de compartir imágenes

El potencial positivo de esta tecnología

Apple revoluciona la inteligencia artificial en iOS 18: Siri ahora puede resumir mensajes de texto

HP deja de usar su DRM de cebo y cambio en impresoras LaserJet

La histórica teoría sobre la vitamina B1 de 1958 finalmente se confirma: científicos estabilizan carbeno en agua

EE.UU. y Reino Unido Firman Tratado Internacional de IA

WhatsApp incorpora nombres de usuario: el cambio que transforma la privacidad en la app de mensajería más usada del mundo

El Vision Pro de Apple carece de seguimiento de ubicación

Minecraft potencia la exploración autónoma: presentan IA capaz de recolectar diamantes sin intervención humana

El Futuro de los Gadgets de Inteligencia Artificial: ¿Solo los Teléfonos?

OpenAI lanza o1, su primer modelo con habilidades de “razonamiento”

La Coincidencia Inesperada entre Mario & Luigi: Brothership y The Super Mario Bros. Movie: Un Vínculo Hermano que Trasciende la Pantalla

tecnofuturo.24

La IA predictiva no adivina el futuro. Pero lo perfila con datos y precisión quirúrgica

Apple presenta Liquid Glass en iOS 26: una interfaz elegante que despierta inquietudes sobre accesibilidad y usabilidad

Meta AI App: El nuevo epicentro de filtraciones privadas y desinformación digital

Anbernic RG406V: El regreso glorioso del juego retro en formato moderno con un 72% de descuento

La nueva función de razonamiento visual de GPT-4 permite identificar coordenadas a partir de elementos como arquitectura o señales viales

Up next

Tags

Share article

Cómo ChatGPT identifica ubicaciones a partir de imágenes

La privacidad, un tema clave en el uso de esta tecnología

¿Cómo se activa esta función en ChatGPT?

Precauciones a la hora de compartir imágenes

El potencial positivo de esta tecnología

You May Also Like