Actualización a nuevo nivel

OpenAI revela aplicación Todo-en-Uno: ChatGPT ahora escucha, ve y habla

Cabe destacar que, si bien la generación de videos aún no está disponible, la aplicación puede crear imágenes fijas que representan fotogramas de video

OpenAI ha dado un paso importante hacia un futuro donde los chatbots, los generadores de imágenes y los asistentes de voz se fusionen sin problemas en una única interfaz conversacional. Su nueva aplicación fusiona las capacidades de ChatGPT con el reconocimiento de voz, el procesamiento de imágenes e incluso el análisis de video.

Esta tecnología innovadora, denominada GPT-4o, permite a los usuarios interactuar con la aplicación a través de comandos de voz, imágenes y videos. Puede analizar un problema matemático escrito en papel a través de una transmisión de video en vivo, responder a indicaciones de conversación e incluso generar historias sobre la marcha.

OpenAI ofrece esta aplicación gratuita para computadoras de escritorio y teléfonos inteligentes, lo que marca su primera incursión en aplicaciones de escritorio para ChatGPT. Anteriormente, OpenAI ofrecía funcionalidades similares dentro de varios productos gratuitos y de pago. Ahora, los han consolidado en un sistema todo en uno fácil de usar.

Este avance se basa sobre los cimientos establecidos por el ChatGPT original lanzado a finales de 2022. Esa tecnología, aclamada como una posible alternativa a los motores de búsqueda y asistentes de voz, revolucionó la interacción humano-máquina al manejar las solicitudes de una manera más conversacional.

Desde entonces, OpenAI ha integrado en su tecnología capacidades de procesamiento de audio, video e imágenes, creando una experiencia de "IA multimodal". Esto esencialmente combina chatbots con herramientas impulsadas por IA para generar imágenes, sonidos y videos.

Sin embargo, persisten los desafíos. Los chatbots entrenados con grandes cantidades de datos de internet son propensos a errores e incluso pueden fabricar información, un fenómeno conocido como "alucinación". Estos problemas ahora también se están migrando potencialmente a los asistentes de voz avanzados. Además, los chatbots luchan con tareas del mundo real como reservar vuelos o programar reuniones. Empresas como OpenAI están trabajando para transformarlos en "agentes de IA" capaces de manejar tales tareas de manera confiable.

La nueva aplicación de OpenAI representa un salto significativo al consolidar múltiples funcionalidades en un sistema único y eficiente impulsado por GPT-4o. Esto les permite ofrecerlo de forma gratuita, allanando el camino para una forma más natural y versátil de interactuar con las máquinas.

Fuente: The New York Times


Comentarios


Suscríbete a nuestro Newsletter

Recibe nuestro Newsletter diariamente registrándote con tu email y mantente informado con las noticias más relevantes del día.

Suscribirme



También te puede interesar


Mas articulos

Gaceta Ucayalina Radio - Música y Noticias
0:000:00