La primera alerta internacional que indicaba que algo extraño ocurría en China se activó cuando el reloj del Hospital de Niños de Boston marcaba las 23.12 horas del 30 de diciembre. El responsable de la alarma fue HealthMap, una plataforma digital creada por investigadores de ese recinto y que utiliza inteligencia artificial para intentar predecir dónde puede aparecer una nueva patología. Su tecnología, que escanea fuentes como reportes noticiosos, mensajes publicados en redes sociales y discusiones en salones de chat, le permitió generar un reporte sobre una neumonía no identificada que se propagaba por la ciudad de Wuhan. HealthMap le asignó una gravedad nivel 3 en una escala de cinco, doce días antes de que un hombre de 61 años que había visitado un mercado local se convirtiera en la primera muerte reportada por Covid-19.
Cuatro horas antes de ese aviso, la epidemióloga Marjorie Pollack ya había empezado a elaborar su propia alerta. La especialista del Programa para Monitoreo de Enfermedades Emergentes (ProMed) -otro grupo que se dedica al rastreo digital de enfermedades emergentes- había recibido un email que la perturbó. El correo decía “Acá esto está circulando en internet”, e incluía un enlace a un posteo de un foro chino llamado Pincong. El mensaje discutía un aviso de la agencia de salud de Wuhan y planteaba la pregunta: “¿¿¿Neumonía no explicada???”. Pollack le encargó a su equipo analizar la información, lo que llevó a la elaboración de un detallado reporte que se distribuyó 30 minutos después que el de HealthMap.
“Existe una cantidad increíble de datos en blogs, sitios de conversación y reportes de noticias que nos dan pistas diarias sobre brotes que están ocurriendo”, comentó John Brownstein, jefe de innovación en el Hospital de Niños de Boston y en la Escuela de Medicina de Harvard, en una entrevista otorgada a ABC News. Fue él quien creó HealthMap en 2006, luego de que el brote de Síndrome respiratorio agudo severo (SARS) matara a casi 800 personas a inicios de la década pasada. “Se nos ocurrió que había un volumen enorme de datos en línea… eran como migajas digitales que iban quedando por el uso de redes sociales y otros medios”, explicó a la cadena televisiva Boston 25.
Hoy la plataforma de Brownstein junto a ProMed, BlueDot y otras similares se han convertido en los protagonistas de un emergente campo de investigación bautizado como epidemiología digital. Marcel Salathe dicta esta cátedra en la Escuela Politécnica Federal de Lausana, en Suiza, y hace dos años publicó en la revista Life Science, Society and Policy un informe donde describía el explosivo crecimiento de este campo durante la última década: “Lo que empezó como un pequeño y diverso grupo de investigadores en varios campos donde se recolectaba un creciente nivel de datos con fines epidemiológicos, hoy se ha convertido en una disciplina por sí sola”. El académico agrega que la expansión de esta área, cuyos expertos monitorean menciones de síntomas sospechosos, cuadros de fiebre y otras referencias, se ha visto impulsada por la propagación extensiva de los teléfonos móviles y “el creciente poder de aprendizaje de las máquinas, necesario para darle sentido a toda la información disponible”.
Actualmente, los reportes de ProMed y HealthMap complementan los análisis de instituciones como la Organización Mundial de la Salud (OMS) y los Centros para el Control y la Prevención de Enfermedades de Estados Unidos (CDC). Pero antes del Covid-19, ya habían dado muestras de su eficacia: el primer acierto de HealthMap se produjo durante la pandemia de la gripe porcina H1N1 de 2009, cuando su tecnología usó reportes noticiosos en español para alertar sobre la misteriosa enfermedad respiratoria que había aparecido en Veracruz, México. Cinco años después, la plataforma analizó los mensajes que aparecían en el timeline de la cuenta de Twitter de la OMS para rastrear el avance del virus del Ébola, que terminó matando a más de 11 mil personas en África.
Otras iniciativas como BlueDot van más allá de simplemente rastrear brotes emergentes. La empresa fundada en 2014 por Kamran Khan, infectólogo y profesor de medicina de la Universidad de Toronto, recopila datos de múltiples fuentes en línea y luego los coteja con datos de vuelos aéreos para tratar de establecer dónde una enfermedad infecciosa hará su próxima aparición. Según Khan, esa información no sólo resulta esencial para las operaciones de las aerolíneas, sino que también para el personal de salud, que suele ser el primero en interactuar con pacientes potencialmente infecciosos: “Si un viajero viene de un área donde está ocurriendo un brote, esa persona no va a acudir a la oficina de la agencia local de salud pública. Va a ir a la atención de urgencia. ¿Acaso el doctor de primera línea sabe cómo reconocer algo que quizás nunca ha visto antes?”, señaló a la revista Time.
A comienzos de enero, Isaac Bogoch, infectólogo del Hospital General de Toronto, se unió a Khan para analizar los datos de vuelos comerciales y así intentar determinar qué ciudades fuera de China estaban más conectadas con Wuhan. Ese mismo mes, las autoridades locales cancelaron todos los viajes aéreos al extranjero, pero no antes de que cinco millones de personas alcanzaran a huir. “Mostramos que el mayor volumen de vuelos desde Wuhan se dirigió a Tailandia, Japón y Hong Kong. Oh, sorpresa. Pocos días después empezamos a ver como los casos aparecían en esos lugares”, señaló Bogoch a Associated Press. Era el segundo acierto de ambos investigadores, quienes hace cuatro años usaron la misma técnica para anticipar la llegada del virus Zika desde Brasil a Florida, en Estados Unidos.
El intento de un gigante
A fines de la década pasada, Google creó su propio sistema de epidemiología digital llamado Flu Trends. El sistema rastreaba patrones en las búsquedas que hacían los usuarios sobre diversos síntomas asociados a la influenza, pero recibió muchas críticas porque en varios casos su tecnología sobreestimó la prevalencia de casos. Por ese motivo, la compañía cerró la plataforma en 2015 y entregó su tecnología a iniciativas como HealthMap para que estas mejoraran el sistema y construyeran sus propios modelos. De hecho, hoy Google trabaja con el equipo de Brownstein para desarrollar una plataforma de rastreo geográfico de la enfermedad de Lyme, la cual es propagada por las picadas de garrapatas.
Los sistemas informáticos que hoy rastrean la web en busca de información sobre brotes epidémicos se basan en la técnica del procesamiento del lenguaje natural (PLN, por sus siglas en inglés), una rama de la inteligencia artificial que hoy ayuda a que los buscadores web y los asistentes de voz digitales procesen los requerimientos de los usuarios. Pero su uso no es tan sencillo, tal como señala Clark Freifeld, investigador informático de la Universidad Northeastern y cofundador de HealthMap. Además de las dificultades de obtener datos útiles a partir de todo lo que se publica en redes sociales, el experto menciona a Tendencias otro problema: “En mi opinión, los medios de prensa locales siguen siendo las fuentes de mayor calidad en cuanto a datos en tiempo real de la salud poblacional. Desafortunadamente, al mismo tiempo que el volumen y el alcance de los datos aumentan, hemos visto un decaimiento en el respaldo que recibe el buen periodismo. Pese a que se han abierto muchas oportunidades nuevas, me preocupa perder una valiosa fuente de datos si el periodismo tradicional sigue debilitándose”.
Otra dificultad nace de las llamadas “pistas falsas” o “cortinas de humo” digitales. De hecho, en 2016 un estudio publicado por los Institutos Nacionales de la Salud en The Journal of Infectious Diseases, dio cuenta de un episodio ocurrido en 2007, cuando se produjo un aumento explosivo de las búsquedas del término “cólera” en Google. La culpa no era de un brote de esa enfermedad, sino que de la popular animadora televisiva Oprah Winfrey, quien había elegido El amor en tiempos del cólera para su club de lectura.
La alarma pública no alcanzó a activarse, pero para los expertos ese incidente muestra que la precisión del rastreo es un tema que requiere un ajuste constante. Por eso, la inteligencia artificial es esencial para filtrar lo que resulta irrelevante o repetitivo: “Tenemos una base de datos de millones de artículos y contenidos relacionados con brotes epidémicos. Podríamos usar, por dar una cifra, 100 mil ejemplos de episodios reales y contrastarlos con cosas que no están relacionadas con una nueva patología, como un ‘brote’ de anotaciones en un partido de béisbol. Así es como el sistema aprende a discernir entre lo que es útil y lo que no lo es”, afirma Freifeld en Knowable.
Pero también hay otros desafíos, tal como señala Nita Bharti, profesora del Centro de Dinámicas de Enfermedades Infecciosas de la Universidad Penn State. Ella es una escéptica y plantea que este tipo de tecnologías aún tiene muchas limitaciones, sobre todo en lo que concierne a dar cuenta de las zonas más humildes del mundo, donde la falta de acceso incide en una menor producción de tantos digitales: “Hay algunos puntos ciegos y poblaciones realmente subrepresentadas cuando se trata de ir acumulando datos, lo que hace que se tienda más bien a mostrar los segmentos con más recursos”, comentó la revista Time.
Además de factores como la precisión de los datos y la falta de información de ciertas regiones, también está el problema de la privacidad. Plataformas como Google y Facebook suelen aprovechar los datos de sus usuarios para que los avisadores puedan generar publicidad dirigida en base a los contenidos de sus búsquedas o los “me gusta”. Frente a eso, han surgido algunas posibles alternativas más abiertas en cuanto a la participación del público: en marzo, CrowdTangle –un sitio de monitoreo de redes sociales- habilitó una nueva función que permite que los propios usuarios, medios de comunicación, autoridades de salud e investigadores rastreen patrones en cuentas públicas portales como Facebook, Instagram y Reddit.
Al mismo tiempo, los inventores de HealthMap crearon en Estados Unidos el sitio COVID Near You, donde los mayores de 13 años pueden reportar sus síntomas en tiempo real. La idea del sistema, que sólo requiere identificarse según el código de área y al que ya se han sumado más de 400 mil personas, es rastrear minuto a minuto la progresión del virus. “Lo que intentamos hacer es armar a las autoridades de salud con la cantidad apropiada de datos en tiempo real sobre dónde están los casos, cuántas personas han sido infectadas, donde están los focos de infección y si el distanciamiento social está funcionando”, dijo Brownstein a CTV News.
A fines de marzo, investigadores de Scripps Research en Estados Unidos plantearon otra estrategia: lanzar un programa de investigación que busca analizar más velozmente la propagación del Covid-19 y otras enfermedades mediante el análisis de índices cardíacos, patrones de sueño y actividad física de los participantes. La idea es que los mayores de 18 años que ya usen relojes inteligentes o aparatos como Fitbit compartan sus datos con la aplicación MyDataHelps.
La idea ha atraído el interés de otras instituciones, como las universidades de Stanford y Duke, más el gobierno alemán, quienes han creado proyectos similares como CovIdentify y Corona-Datenspende. “Los relojes inteligentes y otros aparatos similares realizan muchas mediciones al día. Al menos llegan a 250 mil, lo cual los convierte en poderosos equipos de monitoreo. Lo que queremos es tomar esos datos y ver si podemos identificar quién se está enfermando de la manera más temprana posible, incluso antes de que ellos mismos se den cuenta”, señaló Michael Snyder, profesor y director de genética, en un comunicado de la Escuela de Medicina de Stanford.