El agente “Operator” de OpenAI puede comprar alimentos y presentar informes de gastos

FILE PHOTO: Illustration shows OpenAI logo
El logo de OpenAI se ve en esta ilustración tomada el 20 de mayo de 2024. Foto: Dado Ruvic/ Reuters

La herramienta refleja la proliferación de agentes de IA que automatizan tareas.




OpenAI anunció que su agente “Operator” se puso en marcha para algunos usuarios el jueves, creando la posibilidad de que la inteligencia artificial automatice tareas como la compra de alimentos y la presentación de informes de gastos.

Operator forma parte de una nueva generación de agentes de IA que pueden actuar en nombre de los usuarios. Funciona accediendo a Internet a través de su propio navegador y puede hacer clic, desplazarse y escribir como lo haría una persona. Entre sus posibles usos están hacer reservas en restaurantes y trasladar datos corporativos de un lugar a otro.

Muchas empresas tecnológicas, además de OpenAI, han anunciado el desarrollo de capacidades similares.

Operator está disponible en lo que OpenAI denomina “vista previa de investigación” -una indicación de que el producto tiene limitaciones y cometerá errores a medida que evolucione- para los usuarios de ChatGPT Pro en Estados Unidos. ChatGPT Pro cuesta US$ 200 al mes.

El director de operaciones de OpenAI, Brad Lightcap, afirmó en una entrevista que Operator puede ahorrar tiempo en casa y en el trabajo, donde hay “enormes oportunidades” para automatizar tareas comunes. Pero para empezar, la empresa quería que Operator funcionara con sus usuarios más activos, que están “más dispuestos a reconocer que el producto es todavía en gran medida un avance de investigación”, según Lightcap.

“Se trata de una diferencia fundamental en la forma en que las personas interactúan con los ordenadores”, afirma. “Es un reto técnico difícil, y sólo es tan bueno como útil”.

OpenAI también está trabajando con empresas tecnológicas como Instacart, Uber, eBay, Priceline, OpenTable y Etsy para que sus páginas web sean más accesibles a los usuarios en la página de inicio del operador. Estas empresas no tienen ninguna relación financiera con OpenAI en el marco de la colaboración con Operator, según Lightcap.

News Corp, propietaria del Wall Street Journal, tiene un acuerdo de licencia de contenidos con OpenAI.

El anuncio de hoy supone la primera incursión oficial de OpenAI en la cada vez más intensa carrera de los agentes de IA. A medida que la tecnología de agentes ha ido evolucionando, empresas de software empresarial como Microsoft, Salesforce y Workday han lanzado versiones de agentes que pueden hacer cosas como resumir informes y ponerse en contacto con clientes potenciales y candidatos a un puesto de trabajo.

Google y la empresa de IA Anthropic también han lanzado recientemente agentes similares a Operator, que pueden navegar por páginas web e interactuar con menús y botones.

Una diferencia clave entre las empresas es su alcance. ChatGPT tiene 300 millones de usuarios activos semanales, y OpenAI declaró el pasado otoño que contaba con un millón de clientes empresariales de pago. Esa base de usuarios presenta una de las oportunidades más significativas, en comparación con las de algunos de sus competidores, para que los agentes lleguen a un gran número de usuarios. OpenAI, sin embargo, se rehusó a decir cuántas personas pagan por su plan Pro.

Operator utiliza un nuevo modelo de IA llamado “Computer-Using Agent”, o CUA, que según OpenAI combina las capacidades de visión de su modelo GPT-4o con un “razonamiento avanzado”. La empresa se mostró más optimista sobre las mejoras en imagen y razonamiento de sus modelos a lo largo del año pasado, y CUA fue entrenado para interactuar con el texto, los botones y los menús que la gente suele ver en las páginas web.

Aun así, la usabilidad es un reto para los agentes de IA. Aunque han prometido ahorrar tiempo y eficiencia haciendo cosas por los usuarios, la mayoría de la gente no los utiliza en su vida cotidiana. Apple lanzó su asistente de IA Apple Intelligence en su sistema operativo iPhone el pasado otoño, pero aún no se utiliza para ayudar en las tareas cotidianas. Incluso para las empresas, la mayoría de los agentes de IA se están probando o utilizando de forma limitada, donde es menos probable que expongan datos privados de la empresa o abran riesgos de ciberseguridad.

Lightcap afirma que OpenAI podría plantearse añadir controles específicos para clientes corporativos, pero que actualmente está centrada en su primer grupo de usuarios. Según Lightcap, OpenAI ha incorporado funciones de privacidad, seguridad y control que ayudan a garantizar que el agente no se desvíe de su programación y, lo que es más importante, que el usuario mantenga el control de la IA.

Algunos de los daños o usos indebidos de Operator, según la empresa, incluyen sitios web diseñados para engañar a los usuarios, usuarios que intentan engañar al bot e “inyecciones de aviso” que dirigen a los usuarios para que envíen información sensible o dinero a sitios maliciosos.

Operator tiene una función llamada “modo de toma de control” que pide a los usuarios que tomen el control para introducir datos de pago o información de inicio de sesión. Según OpenAI, Operator también pide aprobación antes de completar tareas de alto riesgo, como el envío de correo electrónico, y no funcionará para transacciones bancarias ni para tomar una decisión sobre una solicitud de empleo. La empresa añadió que Operator no utilizará datos que los usuarios hayan compartido previamente con ChatGPT para realizar acciones.

Para Instacart, hacer que sus servicios de entrega de comestibles sean más accesibles en Operator significa que la empresa puede aprovechar el potencial de los agentes de IA -y el alcance de OpenAI entre los usuarios- sin hacer ese trabajo por su cuenta. “No estamos tratando de crear un agente”, afirmó Daniel Danker, Director de Producto de Instacart.

La colaboración de Uber con OpenAI en Operator “nos da la oportunidad de dar forma al desarrollo del producto”, según Sachin Kansal, director de producto de la empresa de viajes compartidos.

A pesar de sus limitaciones actuales, OpenAI determinó que Operator estaba listo para un lanzamiento limitado después de “tomarse el tiempo necesario para hacerlo bien”, dijo Lightcap.

-Traducido del inglés por Pulso.

Comenta

Los comentarios en esta sección son exclusivos para suscriptores. Suscríbete aquí.