Pronto comunicarse en un idioma desconocido podría ser más sencillo gracias a la inteligencia artificial.

Google, la compañía tras uno de los traductores más populares del mundo, está desarrollando un nuevo proyecto llamado Translatotron, que toma oraciones habladas en un idioma y las traduce en palabras habladas de otro. Sin embargo, este no es un traductor cualquiera.

Según destaca Tech CrunchTranslatotron no utiliza un texto intermedio, ya que trabaja solo con el audio. Una función que en la práctica lo hace más rápido, y más importante aún, le permite reflejar la cadencia y el tono de la voz del hablante. Elementos clave de la comunicación.

Translatotron ha estado por varios años en desarrollo al interior del equipo centrado en IA de Google, y aunque todavía sigue en una fase experimental, su funcionamiento se basa en una red de secuencia a secuencia que captura la voz y la procesa como un espectrograma , que es una representación visual de frecuencias.

Eso da origen a un nuevo espectrograma en el idioma de destino, que es capaz de generar una voz similar a la original.

Todo este proceso no solo es más rápido que una traducción que involucra texto, sino que además permite que existan menos probabilidades de que algo se pierda o se interprete de manera errónea en el camino.

Pero claro, aún hay mucho por delante. Los investigadores a cargo del proyecto admiten que la precisión de la traducción todavía no es tan buena como los sistemas tradicionales, que han tenido más tiempo para perfeccionarse. Pero muchas de las traducciones que se han hecho hasta ahora son aceptables, y el hecho de que incluyan expresiones ya es un valor agregado.

En ese escenario, mientras se sigue perfeccionando Translatotron, desde Google plantean que este es un punto de partida que demuestra la viabilidad de esta alternativa de traducción.

En la página de GitHub de Google Research puedes escuchar algunos intentos de traducción de Translatotron.