A mediados de 2023, Reddit comenzó a cobrar a algunas empresas por el acceso a sus datos, luego de que su plataforma se convirtiera en un punto de interés para distintas compañías dedicadas a la inteligencia artificial (IA) generativa.

Para las firmas dedicadas a esta tecnología, los 19 años de comentarios de usuarios en la red social —fundada en 2005— pueden ser de utilidad para entrenar sus modelos.

Reddit, que acaba de salir a la bolsa en 2024, informó recientemente su primer beneficio trimestral, según reporta el Wall Street Journal.

Se afirma que aquello fue posible, en parte, gracias a los acuerdos de licencia de datos que consiguió con Google y OpenAI el año pasado.

Esta última empresa es la responsable de modelos como ChatGPT y Sora, el producto más reciente de la compañía que tiene la capacidad de crear videos a partir de textos que entregan los usuarios.

Durante la conferencia Tech Live organizada por el citado periódico en octubre, el director ejecutivo y cofundador de Reddit, Steve Huffman, enfatizó que la firma tiene que dejar de entregar datos de forma gratuita a los gigantes de la tecnología.

En sus palabras, se trata de una “carrera armamentista (...) pero estamos en conversaciones con casi todo el mundo, así que veremos dónde aterrizan estas cosas”.

Por qué Reddit se convirtió en la empresa favorita de la Inteligencia Artificial.

Por qué Reddit atrae a las empresas dedicadas a la Inteligencia Artificial

El interés por Reddit de las empresas dedicadas a la IA generativa se debe a la extensa cantidad de datos que la plataforma ha acumulado con el paso de los años.

A esto se le suma que están organizados por temas y utiliza un sistema de votación en vez de un algoritmo para clasificar la calidad del contenido.

Los datos reunidos por el Journal detallan que, en los primeros meses de 2024, la categoría de ingresos de Reddit que incluye licencias creció a 81,6 millones de dólares.

En 2023 estaba en los 12,3 millones de dólares.

Según rescata el citado periódico, la diversificación de la publicidad y la entrada en un mercado creciente como el de la IA también ha contribuido a que aumente el interés de los inversores, hasta el punto en que se ha convertido en una “favorita”.

De hecho, se afirma que el valor de sus acciones se ha más que duplicado en los últimos tres meses, principalmente gracias a sus datos útiles para los sistemas de IA.

Por qué las empresas de Inteligencia Artificial necesitan datos para entrenar a sus sistemas

Las compañías que desarrollan modelos de IA necesitan datos para que sus sistemas puedan responder a las indicaciones y consultas que hacen los usuarios.

Para ello, buscan que entreguen resultados precisos y que tengan un tono conversacional.

Como Reddit tiene casi dos décadas en línea, cuenta con una extensa cantidad de textos escritos por usuarios que han abordado —y siguen abordando— múltiples temáticas.

El director ejecutivo de DatologyAI —una startup que selecciona datos para entrenar modelos de IA— , Ari Morcos, aseguró al citado periódico que “es como maná del cielo”.

“Todo lo que tienen que hacer es empaquetar el conjunto de datos y contratar vendedores”, agregó.

Sin embargo, según el Journal, Reddit no ha revelado los términos de sus acuerdos ni cuánto tiempo durarán.

Por qué Reddit se convirtió en la empresa favorita de la Inteligencia Artificial.

Qué distingue a Reddit de otras plataformas y cómo esto contribuye a que sea atractiva para las empresas de IA

El director del instituto de investigación EpochAI, Jaime Sevilla, enfatizó al citado medio que uno de los puntos que distingue a Reddit es que sus usuarios pueden votar a favor o en contra de las publicaciones y comentarios de los demás.

Asimismo, pueden ganar los llamados puntos de karma por publicar contenido popular.

Según explicó el experto, los votos y el karma pueden ser utilizados como señales para los modelos de IA sobre qué es probable que sea contenido de alta calidad frente a material de baja calidad.

En cambio, por otro lado, muchas plataformas determinan la popularidad de las publicaciones y comentarios solo contando los “me gusta” o la cantidad de seguidores.

Reddit, además, se distingue porque la mayoría de sus usuarios ocupan seudónimos.

El académico de medios digitales en la Universidad Metropolitana de Toronto, Richard Lachman, planteó al Journal que aquello contribuye a que sean más honestos y a que se sientan con menos presiones al momento de interactuar con otros usuarios.

Aseguró que cuanto más auténtico sea un contenido, más útil será para entrenar un modelo de IA.

Otro de los puntos distintivos de la plataforma es que está dividida en más de 100.000 “subreddits” dedicados a todo tipo de tópicos, que pueden abordar desde deportes y cultura hasta política y religión, por mencionar solo algunos ejemplos.

En palabras de Lachman, “Reddit es como un bufé abierto las 24 horas”.