ChatGPT: La Inteligencia Artificial que Puede «Ver» y «Hablar»
Un Pasado Visionario
Más de una década atrás, la película ‘Her‘ nos llevó a un futuro donde los asistentes de inteligencia artificial no solo interactuaban por voz, sino que también podían «ver» el entorno. En una época en la que Siri prometía mucho, las ideas de la película parecían lejanos sueños. Sin embargo, OpenAI está acortando ese camino hacia la realidad.
La Nueva Era de ChatGPT
Recientemente, ChatGPT ha dado un salto significativo al permitir que, en su modo de voz avanzado, pueda acceder a nuestra cámara. Esto significa que el chatbot ahora puede procesar imágenes en tiempo real gracias al modelo multimodal GPT-4o. Además, se presentará una opción que permitirá compartir la pantalla, lo que lo convierte en una herramienta aún más poderosa y versátil.
Procesamiento de Vídeo en Tiempo Real
Activar esta nueva función será sencillo. Solo hay que abrir la aplicación de ChatGPT, seleccionar el modo de voz avanzado y pulsar el botón de la cámara. En la pantalla, el usuario podrá elegir entre la cámara delantera o trasera. Esta interacción permitirá que ChatGPT actúe como un asistente en tiempo real, ofreciendo ayuda al identificar objetos y guiando al usuario en diversos procesos.
Demostraciones Prácticas
Durante una presentación reciente, un integrante del equipo pidió a ChatGPT que lo asistiera en la preparación de café utilizando un filtro. Sorprendentemente, el modelo reconoció los objetos en la mesa y brindó instrucciones detalladas. Este tipo de interacción es solo el comienzo de lo que promete ser una experiencia aún más enriquecedora y funcional.
Casos de Uso Innovadores
Desde la revelación de esta funcionalidad en mayo, OpenAI ha mostrado diferentes escenarios que van desde un padre ayudando a su hijo con matemáticas hasta el chatbot jugando juegos como piedra, papel o tijera. Uno de los ejemplos más destacados es la capacidad de proporcionar descripciones en lenguaje sencillo del entorno, lo que puede ser de gran ayuda para personas con discapacidad visual.
Accesibilidad y Facilidad de Uso
Para compartir la pantalla con ChatGPT, solo es necesario pulsar un menú y seleccionar la opción correspondiente. Sin embargo, aunque esta tecnología promete mucho, es importante tener en cuenta que la IA puede cometer errores. Aun así, OpenAI se posiciona como un líder en la evolución de la inteligencia artificial.
Disponibilidad y Futuro en Europa
La nueva función estará disponible en muchos países en los próximos días para los suscriptores de ChatGPT Plus y Pro. A pesar de las expectativas, todavía hay incertidumbre sobre su llegada a Europa debido a regulaciones. El CEO de OpenAI, Sam Altman, ha expresado el deseo de cumplir con las normativas locales mientras buscan expandir su tecnología a la región.
Reflexiones Finales
ChatGPT se adentra en una nueva era donde la inteligencia artificial no solo puede comunicarse, sino también interactuar con el mundo visual que nos rodea. La evolución de esta tecnología abre un abanico de posibilidades que pueden transformar nuestra forma de interactuar con los dispositivos y mejorar la accesibilidad para todos.