Covid-19: anticipando el avance de la pandemia usando Google
Por Jaime Casassus, Francisco Gallego y Rodrigo Icaran, Instituto de Economía UC
Un grande desafío del manejo de la pandemia es identificar a tiempo la existencia de nuevos contagios. En Chile, diversos medios reportan que un alto porcentaje de personas enfermas no recibieron el resultado de su examen PCR mientras podían contagiar. Si esta información se recibe con tal nivel de retraso, resulta bastante improbable adoptar en su debido tiempo las medidas necesarias para moderar el avance de la enfermedad. Dicho de otro modo, hoy podríamos tomando decisiones adecuadas para semanas previas.
¿Qué podemos hacer entonces para identificar “en tiempo real” el avance de la pandemia? Aquí surge un potencial importante para información tomada de redes sociales. Un trabajo reciente de Harvard plantea que la enfermedad pudo ya haber estado circulando durante el segundo semestre de 2019 en algunas ciudades de Asia porque se observó un aumento explosivo –respecto de años previos- de búsquedas en internet sobre síntomas relacionados con la enfermedad: fiebre, tos, diarrea, entre otros. Existen otros análisis en esta misma línea para esta y otras enfermedades en otros países. Dado esto y el rezago en la entrega de resultados en nuestro país, comenzamos hace un tiempo a estudiar si esta metodología podría ser útil en Chile.
La intuición es simple: con síntomas inminentes de la enfermedad, las personas o sus cercano están más propensas a búsquedas en Google del tipo “examen”, “PCR”, “olfato” y otras palabras relacionadas tanto con la sintomatología como con la posibilidad de realizarse exámenes relacionados a la enfermedad. Si más personas se estuviesen contagiando en un momento dado se debiese observar un alza en las búsquedas relacionadas. Esta relación si parece cumplirse en Chile de un modo bastante robusto. Nuestro modelo de predicción (disponible en economia.uc.cl/blog-economia) es capaz de predecir con un alto grado de precisión, los casos reportados por la autoridad – incluyendo sus altibajos - entre 7 y 14 días después en la Región Metropolitana usando una combinación de búsquedas de Google. Aplicamos diferentes técnicas estadísticas para asegurarnos que esto no corresponde a una relación espuria.
Así, en principio, creemos que métodos como este pueden ser utilizados como insumo secundario para monitorear el avance de la pandemia (junto con iniciativas como el análisis de aguas servidas) y, eventualmente, anticipar un posible rebrote del virus, es evidente que deben ser interpretados con cautela. Factores como acceso a internet heterogéneo, por ejemplo, podrían llevar a establecer conclusiones erradas. De todas formas, análisis como este muestran la importancia de la utilización de datos no convencionales en políticas públicas, terreno en el cual aún parece haber un largo camino por recorrer.