Los editores se preparan para enfrentarse a Microsoft y Google por las herramientas de IA
Los directivos de los medios quieren una compensación por el uso de sus contenidos en ChatGPT, Bing y Bard. En las últimas semanas, los ejecutivos del sector editorial han empezado a examinar hasta qué punto sus contenidos se han utilizado para “entrenar” herramientas de inteligencia artificial.
Desde la llegada de los chatbots, capaces de mantener conversaciones, componer sonetos y aprobar el LSAT (prueba estandarizada para estudiar Derecho en EE.UU.), mucha gente se asombra de las capacidades de la tecnología de inteligencia artificial (IA).
Los editores de contenidos en línea comparten esa sensación de asombro. Pero también ven una amenaza para sus negocios y se dirigen a un enfrentamiento con los creadores de la tecnología.
En las últimas semanas, los ejecutivos del sector editorial han empezado a examinar hasta qué punto sus contenidos se han utilizado para “entrenar” herramientas de inteligencia artificial como ChatGPT, cómo deben ser compensados y cuáles son sus opciones legales, según personas relacionadas con las reuniones organizadas por News Media Alliance, un grupo comercial del sector editorial.
“Tenemos un contenido valioso que se utiliza constantemente para generar ingresos para otros a costa de las inversiones que hacemos, que requiere un trabajo humano real y que tiene que ser compensado”, dijo Danielle Coffey, vicepresidenta ejecutiva y consejera general de News Media Alliance.
ChatGPT, lanzado el pasado noviembre por la empresa matriz OpenAI, funciona como herramienta independiente, pero también se está integrando en el motor de búsqueda Bing de Microsoft Corp. y en otras herramientas. Google, de Alphabet Inc., abrió esta semana al público su propio programa conversacional, Bard, que también puede generar respuestas similares a las humanas.
Reddit ha mantenido conversaciones con Microsoft sobre el uso de su contenido en el entrenamiento de inteligencia artificial, dijeron personas familiarizadas con las discusiones. Un representante de Reddit no hizo comentarios.
Robert Thomson, director ejecutivo de News Corp, empresa matriz de The Wall Street Journal, dijo en una reciente conferencia de inversores que ha “iniciado conversaciones con cierta parte que permanecerá en el anonimato”.
“Está claro que están utilizando contenidos de su propiedad, por lo que debería haber, obviamente, alguna compensación”, señaló Thomson.
En el centro del debate está la cuestión de si las empresas de inteligencia artificial tienen derecho a extraer contenidos de Internet e introducirlos en sus modelos de entrenamiento. Una disposición legal denominada “uso justo” permite utilizar material protegido por derechos de autor sin permiso en determinadas circunstancias.
En una entrevista, el director ejecutivo de OpenAI, Sam Altman, afirmó que “hemos hecho mucho con el uso justo” en lo que respecta a ChatGPT. La herramienta se entrenó con datos de hace dos años. También indicó que OpenAI ha llegado a acuerdos por contenidos, cuando estaba justificado.
“Estamos dispuestos a pagar mucho por datos de muy alta calidad en determinados ámbitos”, como la ciencia, sostuvo Altman.
Una de las preocupaciones de los editores es que las herramientas de IA puedan restar tráfico y dinero publicitario a sus sitios web. La versión de Microsoft de la tecnología incluye enlaces en las respuestas a las preguntas de los usuarios, mostrando los artículos en los que se basó para proporcionar una receta de sopa de pollo o sugerir un itinerario para un viaje a Grecia, por ejemplo.
“En Bing Chat, no creo que la gente lo reconozca, pero se puede hacer clic en todo”, dijo en una entrevista Satya Nadella, CEO de Microsoft, refiriéndose al intercambio de valor inherente a esos enlaces. Los ejecutivos del sector editorial afirman que es una incógnita cuántos usuarios harán clic realmente en esos enlaces y viajarán a sus sitios.
Microsoft lleva muchos años pagando directamente a los editores en forma de acuerdos de licencia de contenidos para su plataforma MSN. Algunos ejecutivos del sector afirman que esos acuerdos no incluyen los productos de inteligencia artificial. Microsoft no ha querido hacer comentarios.
En las primeras pruebas realizadas el martes, el Bard de Google a menudo ofrecía respuestas a las consultas sin proporcionar enlaces a las fuentes de noticias subyacentes.
Cuando se le pidió que resumiera las noticias más importantes del New York Times, Bard respondió con una lista de artículos, entre ellos la noticia de la decisión del gobierno de Biden de enviar ayuda militar a Ucrania y una nueva ronda de sanciones contra Rusia. Terminaba la respuesta: “Para más información sobre estas y otras noticias, visite el sitio web del NYT”, sin proporcionar enlaces ni citas para la respuesta.
Sissie Hsiao, vicepresidente a cargo de Google Assistant, señaló que la compañía “está profundamente comprometida en apoyar un ecosistema de contenido saludable y vibrante” y “dará la bienvenida a las conversaciones con las partes interesadas”. Indicó que cuando las herramientas de IA se integren en las búsquedas, la empresa dará prioridad al envío de tráfico valioso a los creadores de contenidos.
Google ya ha llegado a acuerdos para pagar a algunos editores, entre ellos News Corp, por utilizar sus contenidos en un producto llamado Google News Showcase, que aún no se ha lanzado en Estados Unidos.
Las nuevas tensiones en torno a las herramientas de IA añaden otra dimensión a las ya tensas relaciones entre las grandes empresas tecnológicas y el mundo editorial. Los editores han confiado en empresas tecnológicas como Google y Facebook, de Meta Platforms Inc., para que sus contenidos lleguen a un público amplio, pero también han presionado cada vez más a esas firmas para que paguen por utilizarlos.
En la última sesión del Congreso se presentó una ley que permitiría a los editores estadounidenses negociar colectivamente sin entrar en conflicto con la normativa antimonopolio, y se espera que se vuelva a presentar en breve, según personas familiarizadas con la situación. Según una de estas personas, la legislación pretende abarcar los acuerdos comerciales, incluidos los relativos a las herramientas de inteligencia artificial.
Algunos litigios han empezado a poner a prueba los límites del web-scraping para entrenar la IA cuando se trata de imágenes y código, pero hasta ahora no ha habido ningún caso importante relacionado con el texto. Las empresas tecnológicas suelen argumentar que sus acciones están cubiertas por el uso justo. En febrero, Getty Images demandó en Delaware a la empresa de IA artística Stability AI, alegando que había infringido los derechos de autor de Getty. Stability AI dice que no comenta litigios pendientes.
La semana pasada, la Oficina de Derechos de Autor de EE.UU. dijo que había puesto en marcha una iniciativa para estudiar las cuestiones que plantea la IA, incluido “el uso de materiales protegidos por derechos de autor en el entrenamiento de la IA”.
Entre los pactos comerciales que OpenAI ya ha alcanzado, Altman señaló un acuerdo el pasado otoño con Shutterstock Inc, la empresa de fotografía de archivo que se ha expandido a todo, desde video a modelos en 3D. Como parte del acuerdo, OpenAI obtuvo la licencia de los datos de Shutterstock y Shutterstock pudo utilizar la tecnología de OpenAI. Al mismo tiempo, Shutterstock abrió un fondo para compensar a los artistas cuyo trabajo sirvió para entrenar a la IA.
“Creemos que es razonable y racional que nuestros colaboradores reciban una compensación”, ha declarado Paul Hennessy, Director General de Shutterstock.
Los editores están estudiando activamente la posibilidad de llegar a acuerdos similares. Para complicar el debate, muchas empresas de medios de comunicación están adoptando al mismo tiempo esta tecnología. BuzzFeed y el editor de Sports Illustrated son algunas de las empresas que han dicho que recurrirán a herramientas de IA para crear y personalizar algunos contenidos.
Durante años, a los editores ya les preocupaba que el motor de búsqueda de Google empezara a dar respuestas concretas a consultas de los usuarios como “¿Quién está en el reparto de sucesiones?”, sin enlaces a las propiedades de los medios, ofreciendo lo que denomina “paneles de conocimiento”.
Bing Chat va incluso más allá, respondiendo a las preguntas de una forma tan exhaustiva que los usuarios podrían tener pocos incentivos para hacer clic en los enlaces que se ofrecen.
“La proporción de lo que está disponible para que los editores controlen ha ido disminuyendo inexorablemente desde 2010″, dijo Rand Fishkin, el CEO de SparkToro y un veterano de la industria de optimización de motores de búsqueda. “Parece que ese es el camino de Internet”, añadió.
Comenta
Por favor, inicia sesión en La Tercera para acceder a los comentarios.