¿Cómo un computador logra derrotar al campeón mundial de Go, considerado el juego de estrategia más complejo del mundo? ¿Cómo puede aprender a jugar juegos Atari autónomamente, alcanzado un rendimiento similar al de un jugador humano promedio? La respuesta está en el Deep Learning (Aprendizaje Profundo), una técnica que ha revolucionado la Inteligencia Artificial.

Su nombre deriva de la utilización de redes neuronales artificiales con muchas capas de neuronas en tareas de aprendizaje de máquinas. Si la red neuronal posee muchas capas se dice que es profunda (deep), en contraposición a tener un número reducido de capas y ser poco profunda (shallow). Una red con muchas capas, posee muchas neuronas y muchas conexiones entre éstas y, por lo mismo, una gran capacidad de aprendizaje.

La capacidad de aprendizaje es fundamental para construir sistemas de reconocimiento de alto rendimiento, pues el paradigma actual de construcción de estos sistemas es que se aprendan a reconocer los objetos de interés utilizando ejemplos. Los ejemplos consisten en imágenes, miles o millones, en las cuales se encuentran los objetos a ser reconocidos y por cada imagen existe un indicador del tipo de objeto presente; por ejemplo, una imagen de un auto en una carretera y el indicador "auto". Para resolver una cierta tarea de reconocimiento, la red deep debe ser entrenada mediante estos ejemplos y aprender que dada una imagen de entrada debe generar a su salida el indicador correcto. Todo lo que la red va aprendiendo se guarda en las conexiones entre neuronas (sinapsis). De allí la importancia de contar con muchas neuronas, muy conectadas y por ende con gran capacidad de aprendizaje.

El aprendizaje profundo es una técnica de uso reciente, a pesar de que se investiga en el uso de redes neuronales desde mediados del siglo pasado. El boom a partir del año 2012 tiene que ver con aspectos técnicos del aprendizaje de máquinas: primero, la introducción de nuevas redes neuronales con estructuras específicas (redes convolucionales) que requieren que menos parámetros internos sean aprendidos; y el uso de técnicas de aprendizaje de mayor sofisticación, las cuales permiten entrenar redes con muchas capas de manera rápida y robusta.

Pero también influye la existencia de computadores con mayor capacidad de procesamiento, con memorias más grandes y con unidades de cómputo especializadas (GPU - Graphics Processing Unit). Este factor es fundamental, pues entrenar una red profunda de muchas capas, con miles de neuronas, utilizando millones de imágenes, requiere gran cantidad de memoria y gran capacidad de procesamiento. El cuarto factor, frecuentemente ignorado, es la tendencia a desarrollar redes profundas bajo el paradigma de código abierto, lo que significa que en la actualidad miles de investigadores y desarrolladores se encuentren resolviendo aplicaciones de deep learning en forma colaborativa, usando frameworks de trabajo estándares, como por ejemplo TensorFlow, Caffe o PyTorch, los cuales facilitan el compartir las redes diseñadas y entrenadas.

Considerando que a nivel mundial la Inteligencia Artificial está revolucionado prácticamente todas las industrias (retail, banca, salud, Internet, comunicaciones, etc.), haciéndolas más eficientes e incluso creando la posibilidad de que muchos empleos se transformen o en algunos casos sean eliminados, es importante preguntarse ¿cómo debiéramos prepararnos en Chile para este tsunami tecnológico? La respuesta obvia es formar especialistas en esta materia.

La buena noticia es que en algunas universidades chilenas ya existen académicos e investigadores trabajando en este tema. A modo de ejemplo, en la Facultad de Ciencias Físicas y Matemáticas de la Universidad de Chile, existen cursos de pregrado en los cuales se enseña deep learning a los estudiantes de ingeniería y programas de Magister y Doctorado en Ingeniería Eléctrica, donde existen líneas de especialización en esta materia. En el ámbito del uso industrial de estas tecnologías, en el Centro Avanzado de Tecnología para la Minería (AMTC) utilizamos deep learning en aplicaciones tan diversas como el reconocimiento de personas desde máquinas mineras en movimiento, el análisis de imágenes hiperespectrales de alta dimensión, la toma de decisiones en vehículos mineros autónomos y el análisis de grandes cantidades de datos capturadas mediante redes de sensores e IoT (Internet of Things).

El Deep Learning llegó para quedarse y debemos fortalecer la formación de especialistas en esta materia, así como también fomentar su aplicación en la resolución de problemas de alta complejidad en industrias de relevancia para nuestro país, como la minería.