Este martes en la conferencia de desarrolladores I/O de Google, la empresa mostró varias novedades relacionadas a su sistema operativo Android, YouTube, Google Maps y otros. Sin embargo, uno de ellos, relacionado con la inteligencia artificial y el llamado "machine learning" -un modo en el que la máquina 'aprende' de sus experiencias- llamó poderosamente la atención. Se trata de Google Duplex, un adelanto en el área que incluso es capaz de engañar a un humano en una conversación telefónica.
El sistema permite llevar a cabo órdenes complejas y con una tarea específica, como programar una cita, hacer una reserva en un restaurante o en el caso de la demostración (hora 1:56:00 del video), encontrar una hora en la peluquería, demostrando que en el área de los asistentes virtuales se encuentra varios pasos por delante de Siri de Apple, Cortana de Microsoft o Alexa de Amazon.
A diferencia de los asistentes de voz entrecortados y sin emociones que conocemos en la actualidad, Duplex suena "humano". COn mucho cuidado podemos distinguir su lado robótico, ya que habla de forma muy suave como cualquier persona, incluso arrojando inflexiones como "humm..." para dar la impresión de ser un humano dubitativo o en espera de algo.
Posterior a la presentación, Yaniv Leviathan y Yossi Matias, encargados del proyecto, afirmaron que Google Duplex está diseñado para sonar natural, y para que la experiencia de conversación sea cómoda, aunque es una tarea más sencilla en el papel que en la realidad. Esto porque al hablar de forma espontánea, la mayoría de las personas habla rápido, con errores, tonos de voz disparejos, menos claros o con modismos, por lo que al hablarle a una máquina usa oraciones igual de complejas para darle una instrucción.
"El reconocimiento de voz es difícil y la tasa de errores muy alta", afirman en el blog de Google, añadiendo que también deben enfrentarse con los ruidos fuertes y problemas de calidad de sonido, algo que se suma a la complejidad de conversaciones más largas, cuando las oraciones se basan en el contexto.
De acuerdo a los ingenieros, el sistema se basa en una red neuronal capacitada gracias a una colección de conversaciones telefónicas anónimas, y que emplea un modo de reconocimiento de voz. Así, aseguran que Duplex "es capaz de llevar a cabo conversaciones sofisticadas y puede completar la mayoría de sus tareas de forma totalmente autónoma, sin participación humana". Además, puede reconocer si un usuario le ha asignado una tarea fuera de su alcance, como programar una cita inusualmente compleja.
Como es de esperar, estos adelantos no sólo se encuentran limitados a usuarios específicos, ya que las empresas también podrán ofrecer el sistema a sus clientes, quienes podrán hacer reservas con un robot, solicitar información determinada y otros.
"Permitir que las personas interactúen con la tecnología de forma tan natural como interactúan entre sí ha sido una promesa de larga data", señalan los encargados del proyecto. "Google Duplex da un paso en esta dirección, haciendo realidad la interacción con la tecnología a través de conversaciones naturales en escenarios específicos".
Aunque en la presentación no se ahondó en el tema de la privacidad, es claro que Google utiliza todo lo que conoce de los usuarios, como los lugares de interés con Google Maps, nuestros gustos con YouTube, el buscador, el análisis de los correos y la publicidad a la que ingresamos.
De acuerdo a Google, la empresa continuará trabajando en este sistema, que estará en período de pruebas en los próximos meses y en donde un selecto grupo de personas podrá apreciar su potencial. Por el momento, la plataforma se encuentra desarrollada sólo en idioma ingles, así que es probable que pase mucho tiempo antes que veamos algo similar en español.
Fuente: Blog de Google