Posiblemente, la Siri real
El asistente tan esperado de Apple: ¿Siri 2.0 impulsado por IA?
Esta actualización podría involucrar modelos de lenguaje grande (LLM) para mejorar la confiabilidad, convirtiendo a Siri en un compañero mejorado
¿Recuerda el revolucionario asistente de voz que Apple presentó con el iPhone 4S en 2011? Siri, con su capacidad para manejar tareas a través de comandos de voz, parecía ser el futuro. Avancemos 13 años, y el estado actual de Siri está muy lejos de esas promesas iniciales. Sin embargo, los rumores de la WWDC sugieren un posible renacimiento. Esos primeros comerciales de iPhone mostraban una experiencia de usuario perfecta. Imagínese pedir pizza, verificar el tráfico o programar reuniones, todo a través de comandos de voz. La realidad, sin embargo, ha sido mucho menos impresionante. Siri a menudo lucha con tareas básicas, lo que lleva a muchos a abandonarlo por completo.
Pero hay un rayo de esperanza. Según informes de Bloomberg y The New York Times, Apple se está preparando para presentar una revisión importante de Siri en la WWDC. Más allá de la confiabilidad, los rumores apuntan a un Siri que finalmente se puede integrar dentro de las aplicaciones. Esto significa que el asistente podría realizar acciones en su nombre, esencialmente imitando sus toques y deslizamientos con el dedo. Imagine pedir esa pizza a través de Siri, con los detalles de pago extraídos de su Apple Wallet, una ventanilla única real.
Esta funcionalidad se alinea con la visión original de Apple para Siri. Esos primeros comerciales mostraban un asistente que podía manejar tareas complejas, no solo recuperación de información básica. Las limitaciones actuales de Siri son frustrantes porque los ingredientes necesarios (correos electrónicos, contactos y aplicaciones) están disponibles en su teléfono.
Hay dos razones principales por las que Siri no ha cumplido con su potencial. La primera es la tecnología subyacente. El reconocimiento de voz y la comprensión del lenguaje no han sido lo suficientemente robustos. Afortunadamente, los avances en los LLM, como los que impulsan Whisper y Gemini de Google, ofrecen mejoras significativas en la comprensión.
La segunda razón de las deficiencias de Siri es la falta de una experiencia de usuario clara. Los usuarios a menudo luchan por saber qué puede hacer Siri o cómo interactuar con él. Del mismo modo, los desarrolladores no han encontrado la mejor manera de integrar Siri en sus aplicaciones. La incapacidad de Siri para comprender qué aplicación de lista de tareas usa es un buen ejemplo.
Apple podría estar preparando una solución. Los investigadores publicaron un artículo a principios de este año que detalla "Ferret-UI", un sistema de inteligencia artificial que descifra la información en pantalla. Imagine que esto funciona junto con un LLM: el LLM comprende la aplicación en la que se encuentra (por ejemplo, Ticketmaster), mientras que Ferret-UI identifica elementos específicos como el "botón comprar".
Si bien el escepticismo está justificado (las afirmaciones anteriores de Apple sobre Siri no siempre se han cumplido), esta posible renovación podría cambiar las reglas del juego. Finalmente, podríamos ver al Siri que nos prometieron hace años. Tal vez los comerciales futuros no sean exageraciones, tal vez Siri realmente simplifique nuestras vidas, pidiendo esa sopa de tomate o guiando a Malkovich hacia la paz interior. Esta WWDC podría marcar el comienzo de un Siri verdaderamente inteligente y útil.
Fuente: The Verge
Suscríbete a nuestro Newsletter
Recibe nuestro Newsletter diariamente registrándote con tu email y mantente informado con las noticias más relevantes del día.
También te puede interesar
Mas articulos