¿Quiere conocer la jerga de la IA? Aprenda lo básico, de la PNL a las redes neuronales

MARTIN TOGNOLA
MARTIN TOGNOLA

Una guía de algunos de los conceptos más importantes para desmitificar la tecnología que está en boca de todos.


El auge de la inteligencia artificial, una tecnología que pretende imitar el pensamiento humano, ha ido acompañado de una desconcertante variedad de nuevos términos. De la IA generativa al aprendizaje automático, pasando por las redes neuronales y las alucinaciones, hemos adquirido todo un vocabulario nuevo. He aquí una guía de algunos de los conceptos más importantes que subyacen a la IA para ayudar a desmitificar una de las revoluciones tecnológicas más impactantes de nuestra vida:

Algoritmo: Los algoritmos actuales son un conjunto de instrucciones que debe seguir un computador. Los diseñados para buscar y clasificar datos son ejemplos de algoritmos informáticos que trabajan para recuperar información y ponerla en un orden determinado. Pueden consistir en palabras, números o códigos y símbolos, siempre que detallen pasos finitos para completar una tarea. Pero los algoritmos tienen sus raíces en la antigüedad, remontándose al menos a las tablillas de arcilla de la época babilónica. Un algoritmo euclidiano para la división se sigue utilizando hoy en día, y cepillarse los dientes podría incluso destilarse en un algoritmo, aunque uno notablemente complejo, teniendo en cuenta la orquestación de movimientos finos que van en ese ritual diario.

No te pierdas en Pulso


Aprendizaje automático: una rama de la IA que se basa en técnicas que permiten a los ordenadores aprender de los datos que procesan. Anteriormente, los científicos habían intentado crear inteligencia artificial programando conocimientos directamente en un computador.

A un sistema de aprendizaje automático se le pueden dar millones de fotos de animales de la web, cada una etiquetada como gato o perro. Este proceso de alimentación de información se conoce como “entrenamiento”. Sin saber nada más sobre animales, el sistema puede identificar patrones estadísticos en las imágenes y utilizarlos para reconocer y clasificar nuevos ejemplos de gatos y perros.

Aunque los sistemas de ML son muy buenos reconociendo patrones en los datos, son menos eficaces cuando la tarea requiere largas cadenas de razonamiento o una planificación compleja.

Procesamiento del Lenguaje Natural: una forma de aprendizaje automático que puede interpretar y responder al lenguaje humano. Es el motor de Siri de Apple y Alexa de Amazon.com. Gran parte de las técnicas actuales de PLN seleccionan una secuencia de palabras en función de su probabilidad de satisfacer un objetivo, como resumir, preguntar y responder o traducir, explica Daniel Mankowitz, investigador científico de DeepMind, filial de Google que investiga sobre inteligencia artificial.

A partir del contexto del texto circundante, puede saber si la palabra “club” se refiere a un bocadillo, al juego del golf o a la vida nocturna. Las raíces de este campo se remontan a los años 50 y 60, cuando el proceso de ayudar a los ordenadores a analizar y comprender el lenguaje requería que los propios científicos codificaran las reglas. Hoy en día, los computadores están entrenados para hacer esas asociaciones lingüísticas por sí mismos.

Redes neuronales: técnica de aprendizaje automático que imita la forma en que actúan las neuronas en el cerebro humano. En el cerebro, las neuronas pueden enviar y recibir señales que impulsan pensamientos y emociones. En inteligencia artificial, grupos de neuronas artificiales, o nodos, envían y reciben información entre sí de forma similar. Las neuronas artificiales son esencialmente líneas de código que actúan como puntos de conexión con otras neuronas artificiales para formar redes neuronales.

A diferencia de las antiguas formas de aprendizaje automático, se entrenan constantemente con nuevos datos y aprenden de sus errores. Por ejemplo, Pinterest utiliza redes neuronales para encontrar imágenes y anuncios que llamen la atención del consumidor, analizando montañas de datos sobre los usuarios, como las búsquedas, los tableros que siguen y los pines en los que hacen clic y guardan. Al mismo tiempo, las redes analizan los datos publicitarios de los usuarios, como el contenido que les lleva a hacer clic en los anuncios, para conocer sus intereses y ofrecerles contenidos más pertinentes.

Aprendizaje profundo: una forma de IA que emplea redes neuronales y aprende continuamente. El “profundo” en aprendizaje profundo se refiere a las múltiples capas de neuronas artificiales de una red. En comparación con las redes neuronales, que son mejores para resolver problemas más pequeños, los algoritmos de aprendizaje profundo son capaces de un procesamiento más complejo gracias a sus capas interconectadas de nodos. Aunque se inspiran en la anatomía del cerebro humano, escribe el doctorando de la Universidad de Oxford David Watson en un artículo de 2019, las redes neuronales son frágiles, ineficientes y miopes cuando se comparan con el rendimiento de un cerebro humano real. La popularidad de este método se ha disparado desde que un trío de investigadores de la Universidad de Toronto publicó un artículo histórico en 2012.

Grandes modelos lingüísticos: algoritmos de aprendizaje profundo capaces de resumir, crear, predecir, traducir y sintetizar texto y otros contenidos porque se entrenan con cantidades ingentes de datos. Un punto de partida habitual para programadores y científicos de datos es entrenar estos modelos con conjuntos de datos de código abierto y disponibles públicamente en Internet.

Los LLM surgen de un modelo “transformador” desarrollado por Google en 2017, que hace que sea más barato y eficiente entrenar modelos con enormes cantidades de datos. El primer modelo GPT de OpenAI, lanzado en 2018, se basó en el trabajo de transformador de Google. (GPT significa transformadores generativos preentrenados). Los LLM conocidos como modelos de lenguaje multimodal pueden operar en diferentes modalidades, como lenguaje, imágenes y audio.

IA Generativa: un tipo de inteligencia artificial que puede crear varios tipos de contenido, como texto, imágenes, vídeo y audio. La IA generativa es el resultado de la introducción de información o instrucciones, denominadas instrucciones, por parte de una persona en un modelo básico, que produce un resultado basado en la instrucción recibida. Los modelos de base son una clase de modelos entrenados a partir de cantidades ingentes y diversas de datos que pueden utilizarse para desarrollar aplicaciones más especializadas, como chatbots, asistentes de escritura de código y herramientas de diseño. Estos modelos y sus aplicaciones incluyen generadores de texto como ChatGPT de OpenAI y Google Bard, y Dall-E de OpenAI y Stable Diffusion de Stability.ai, que generan imágenes.

El interés por la inteligencia artificial generativa se disparó el pasado noviembre con el lanzamiento de ChatGPT, que facilitaba la interacción con la tecnología subyacente de OpenAI escribiendo preguntas o indicaciones en lenguaje cotidiano. Del mismo modo, Dall-E 2 de OpenAI crea imágenes de aspecto realista.

Estos modelos se entrenan tanto en Internet como en conjuntos de datos más adaptados para encontrar patrones de largo alcance en secuencias de datos, lo que permite al software de IA expresar una próxima palabra o párrafo adecuado mientras escribe o crea.

Chatbots: programa informático que puede entablar conversaciones con personas en lenguaje humano. Los chatbots modernos se basan en la IA generativa, en la que las personas pueden hacer preguntas o dar instrucciones a modelos fundacionales en lenguaje humano. ChatGPT es un ejemplo de chatbot que utiliza un modelo de lenguaje generativo, en este caso, el GPT de OpenAI. Las personas pueden mantener conversaciones con ChatGPT sobre temas que van desde la historia a la filosofía y pedirle que genere letras de canciones al estilo de Taylor Swift o Billy Joel o que sugiera ediciones del código de programación informática. ChatGPT es capaz de sintetizar y resumir inmensas cantidades de texto y convertirlo en salidas en lenguaje humano sobre cualquier número de temas que existen actualmente en el lenguaje.

Alucinación: cuando un modelo de fundamentos produce respuestas que no están basadas en hechos o en la realidad, pero que se presentan como tales. Las alucinaciones difieren del sesgo, un problema distinto que se produce cuando los datos de entrenamiento tienen sesgos que influyen en los resultados del LLM. Las alucinaciones son uno de los principales defectos de la IA generativa, lo que ha llevado a muchos expertos a abogar por la supervisión humana de los LLM y sus resultados.

El término ganó reconocimiento tras una entrada de blog de 2015 del miembro fundador de OpenAI Andrej Karpathy, que escribió sobre cómo los modelos pueden “alucinar” respuestas de texto, como inventar pruebas matemáticas plausibles.

Inteligencia Artificial General: una forma hipotética de inteligencia artificial en la que una máquina puede aprender y pensar como un ser humano. Aunque la comunidad de la IA no ha llegado a un amplio consenso sobre lo que supondrá la AGI, Ritu Jyoti, analista tecnológico de la empresa de investigación IDC, afirma que necesitará autoconciencia y conciencia para poder resolver problemas, adaptarse a su entorno y realizar una gama más amplia de tareas.

Empresas como Google DeepMind trabajan en el desarrollo de algún tipo de inteligencia artificial. DeepMind ha explicado que su programa AlphaGo se enfrentó a numerosos juegos de aficionados, lo que le ayudó a desarrollar una comprensión del juego humano razonable. Después jugó miles de veces contra diferentes versiones de sí mismo, aprendiendo cada vez de sus errores.

Con el tiempo, AlphaGo mejoró y se hizo cada vez mejor en el aprendizaje y la toma de decisiones, un proceso conocido como aprendizaje por refuerzo. DeepMind aseguró que su programa MuZero llegó a dominar el Go, el ajedrez, el shogi y el Atari sin necesidad de que se le explicaran las reglas, una demostración de su capacidad para planificar estrategias ganadoras en entornos desconocidos. Algunos podrían considerar este avance como un paso gradual hacia la inteligencia artificial.

Comenta

Por favor, inicia sesión en La Tercera para acceder a los comentarios.