¿Es posible que la Inteligencia artificial pueda “ver” y reconocer más allá de la capacidad humana? ¿Es posible que la IA se pueda engañar a sí misma de las imágenes que crea y trata de interpretar? Los avances de esta tecnología en el reconocimiento visual ha dado pasos agigantados durante el último año. Sin ir más lejos, la última actualización de ChatGPT proporcionó a esta máquina la capacidad de reconocer imágenes, leerlas e interpretarlas de acuerdo a los datos que tiene a su disposición.
Es un arma de doble filo. En muchos casos no solo es capaz de leer imágenes, sino que también reproducirlas al punto de que poco se pueda distinguir entre lo real y lo digital. Bien lo han sabido autoridades mundiales o celebridades que han visto su cara, su imagen, e incluso su cuerpo, en situaciones donde jamás han estado. El desarrollo de todo esto es una de las grandes preocupaciones de Juan Carlos Niebles.
El experto en este tema es ingeniero Eléctrico de la Universidad del Norte, en Colombia, M.Sc en Ciencias en Ingeniería Eléctrica e Informática de la Universidad de Illinois y PhD en Ingeniería Eléctrica de la Universidad de Princeton. Ha sido galardonado con el Premio de Investigación de Facultad de Google (2015), la Beca de Investigación de Microsoft (2012), el Premio de Investigación de Google (2011) y una Beca Fulbright (2005).
Actualmente se desempeña como director de Investigación en Salesforce AI Research, como académico del Departamento de Ciencias de la Computación de la Universidad de Stanford y como codirector del Vision and Learning Lab (SVL).
Sus áreas de investigación se centran en la visión por computador y el aprendizaje automático, con un enfoque en el reconocimiento visual y la comprensión de acciones y actividades humanas, objetos, escenas y eventos. Su objetivo es, según reconoce, permitir que los computadores y los robots perciban el mundo visual mediante el desarrollo de algoritmos novedosos de visión para el análisis automático de imágenes y videos.
Se presentó recientemente como expositor de Congreso Futuro 2024: “¿IAhora qué hacemos?”. Allí, mostró a la audiencia cuáles son los peligros y beneficios de que la IA mejore cada día más y a pasos agigantados, dejando incluso atrás la regulación a los posibles riesgos que pueda generar esta incursión tecnológica.
En entrevista con Qué Pasa, Niebles comenta sobre los principales beneficios y riesgos que pueda tener el campo del reconocimiento visual en la Inteligencia Artificial. Además, comenta cuáles debiesen ser los pasos para orientar esta impresionante tecnología por los pasos correctos.
¿Cómo partió el interés en el reconocimiento visual y el aprendizaje automático?
Parte de la inteligencia artificial es tratar de replicar las habilidades que exhibe la inteligencia natural. En la inteligencia natural, el mejor ejemplo que tenemos es el de los humanos está percibir el mundo y el entorno de manera visual. Interpretan visualmente el entorno, son capaces de reconocer objetos, reconocer las escenas y reconocer lo que ocurre, mediante el análisis o el procesamiento en el cerebro de las imágenes que los ojos capturan. Una de las habilidades que quería replicar la comunidad de IA a partir de la inteligencia natural era el reconocimiento visual y el análisis visual. Y por supuesto, eso derivó a que muchos investigadores en el mundo trabajaran en este tema del análisis de imágenes y reconocimientos visuales en videos.
Por otro lado, el aprendizaje automático está también relacionado con la habilidad de los humanos para reconocer o aprender nuevos conceptos mediante sus experiencias. Entonces la idea era: cómo podemos construir un algoritmo o una máquina que —al igual que las personas— sea capaz de aprender o adquirir nuevos conocimientos y habilidades a través de las experiencias y de un proceso de aprendizaje. Entonces vino la idea de utilizar métodos estadísticos, probabilísticos que recogían una gran cantidad de datos para replicar el mecanismo de aprendizaje en las máquinas.
A partir de esa inspiración de lo que hace la inteligencia en el mundo natural, las personas en el mundo de las ciencias de la computación y la inteligencia artificial empezaron a estudiar estos dos temas: el reconocimiento visual y el aprendizaje automático.
¿Cómo ve el futuro de la IA, y esta aplicación de reconocer imágenes en la vida cotidiana?
En general, veo que el futuro de la IA tiene un gran potencial para transformar muchísimas áreas de nuestra vida y del quehacer humano. En particular, la visión por computador o el análisis de imágenes tiene muchas aplicaciones interesantes en el tema de robótica. En el momento en que nosotros lleguemos a tener robots que puedan movilizarse y desenvolverse en nuestros ambientes cotidianos, una capacidad importante para ellos va a ser la de reconocer visualmente dónde están, saber con quién están interactuando, mirar cómo moverse y para eso el análisis de imágenes va a ser crucial. Creo que el análisis de imágenes es un área muy interesante para poder avanzar.
¿Existen límites éticos para las aplicaciones de esta tecnología?
Claro que sí. El hecho de que hoy estas tecnologías de inteligencia artificial estén avanzando de manera tan rápida, ha hecho que en pocos años el tema haya salido de los laboratorios, de las universidades y de prototipos investigativos, y se esté convirtiendo en productos. Hoy en día hay mucha gente que está desarrollando productos potenciados por la inteligencia artificial. Cuando la inteligencia artificial ya empieza a impactar la vida de la gente, es el momento para que el tema no sea únicamente tratado por los ingenieros y los tecnólogos, sino que se empiece a tomar una perspectiva mucho más multidisciplinaria, donde se involucren economistas, humanistas, sociólogos, personas expertas en ética que permitan desarrollar la tecnología de una manera que se asegure que traerá un impacto positivo en la sociedad y en la humanidad.
Yo sí creo que debe haber límites. Dónde están los límites y dónde aplicarlos es un tema bastante complejo, y creo que la mejor forma de enfrentarlo es mediante esta vista multidisciplinar que involucre expertos de todas las áreas, que van desde la tecnología hasta temas de legales, sociales y humanos, para poder darle una vista bastante global al tema y abordarlo de la forma correcta.
¿Es posible que una IA pueda generar un rostro que sea imposible saber si es real o deepfake, incluso indetectable para otra IA?
Es difícil dar una respuesta que pase la prueba del tiempo, pues toda esta tecnología está avanzando de manera muy rápida. Claramente la tecnología de generación de imágenes ha avanzado muchísimo y, como tal, podemos generar imágenes muy realistas. Pero también tenemos herramientas más poderosas que detectan imágenes reales versus falsas. Creo que una de las formas en que este tema se puede enfrentar es mirar el tema de firmas digitales para las imágenes reales, o alguna especie de huella dentro de la misma imagen que permita saber la procedencia y de esa forma tener un registro para saber de dónde viene.
Pero por otro lado también está el tema de educación. ¿Cómo hacemos que el público pueda enfrentarse a contenido de manera crítica, que sepan enfrentarse al contenido, saber cuáles son las fuentes y entender que es algo crucial? Sin dudas, el desarrollo tecnológico va de la mano también con la educación del público: cómo consumir la información en los medios, cómo consumir la información en las redes sociales y hoy por hoy, cómo consumir la información producida por la IA.
¿Qué mensaje es el que espera dar a la audiencia de Congreso Futuro?
La tecnología de inteligencia artificial tiene un gran potencial de transformar nuestro mundo, nuestra sociedad y la humanidad. Pienso que esa transformación puede ser muy positiva, puede traer muchas herramientas que nos van a permitir facilitar nuestra vida. Y estamos en un momento bastante temprano todavía del desarrollo de la inteligencia artificial. Eso significa que estamos a tiempo de tomar las precauciones para asegurarnos de que el futuro de la inteligencia artificial sea un futuro positivo.
Creo que parte de tomar precauciones, se trata de que la tecnología no solamente sea desarrollada por los tecnólogos, sino que también involucre múltiples disciplinas, como economistas, éticos y humanistas, entre otros, para que nos aseguremos que llevemos la tecnología por el camino que queremos.