A inicios de 2020, cuando la pandemia de coronavirus aún escondía muchas incógnitas, uno de los esfuerzos de la ciencia tuvo que ver en cómo detectar la enfermedad de una forma sencilla, rápida, de bajo costo, masiva y que tuviese el menor porcentaje de error posible. Así, además de los exámenes sanguíneos, de saliva o el ya conocido PCR, algunos científicos apuntaron a la inteligencia artificial (IA), el llamado “machine learning” y las bases de datos para analizar información y en lo posible, encontrar rastros del virus incluso antes que sus síntomas comenzaran a manifestarse. Y para ello ya existían algunos antecedentes en base a decenas de estudios, utilizando algo tan simple como la voz.

La premisa es simple: determinar si el hablante tiene cambios en su voz debido a modificaciones en los patrones del habla relacionados con la función pulmonar y otros parámetros respiratorios. Estos cambios son muy pequeños y ocurren cuando respiramos o tosemos. Y si bien muchos de los rastros detectados y procesados por algoritmos de IA pueden ser difíciles de escuchar para un oyente común, pueden identificarse y analizarse.

Uno de ellos fue desarrollado por las empresas IBM Research y Pfizer, quienes utilizaron pruebas de habla cortas para ayudar a predecir la eventual aparición de Alzheimer en personas cognitivamente sanas sobrepasando las predicciones basadas en escalas clínicas.

El modelo utiliza el procesamiento del lenguaje natural para analizar muestras de habla de uno a dos minutos de una prueba cognitiva breve, realizada clínicamente. Estas breves muestras de datos lingüísticos fueron proporcionadas por el Framingham Heart Study, un estudio de larga duración que rastrea varios aspectos de la salud en más de 5 mil personas y sus familias desde 1948. De acuerdo a IBM, el potencial para desarrollar modelos de IA entrenados con datos algún día podrían usarse para desarrollar métodos para predecir con mayor precisión esta enfermedad en una gran población, incluidas las personas sin indicadores actuales, antecedentes familiares o signos de deterioro cognitivo. El estudio fue publicado en The Lancet eClinicalMedicine en 2020 y los resultados son prometedores.

Otro experimento interesante lleva alrededor de un año y fue realizado por científicos de la Universidad Carnegie Mellon, con una aplicación de prueba que tenía como objetivo recopilar información de un gran número de personas para analizar las características de la voz, incluyendo a personas con Covid-19. El equipo tiene experiencia en tecnologías y análisis forenses de voz impulsados por IA y está perfilando a las personas a partir de sus voces. El sistema permite la extracción de “micro-firmas” o “huellas” que pueden correlacionarse con ciertos parámetros que pueden ser relevantes tanto para el Covid-19, como otras enfermedades.

La Universidad de Cambridge por su parte, también desarrolló su propia aplicación móvil para iOS y Android, y afirman que además del Covid-19 pueden encontrar problemas relacionados con el sistema cardiovascular, digestivo y respiratorio. En su estudio publicado en febrero pasado, analizaron 343 casos, investigando cómo se puede usar la voz para distinguir a los individuos sintomáticos con pruebas positivas de las personas con pruebas negativas, que también han desarrollado síntomas de Covid-19. De acuerdo a sus resultados, alcanzaron un 79% de rendimiento, combinando voz y síntomas como pérdida del gusto y del olfato. Sin embargo, al distinguir a los pacientes asintomáticos de los sanos, se observó una alta tasa de pacientes asintomáticos clasificados erróneamente como participantes sanos. Esto implicó que, con las características y el modelo actuales, era difícil identificar a los pacientes asintomáticos sólo por su voz.

Actualmente, dicen estar en el proceso de desarrollar modelos de aprendizaje que consideren todas las modalidades de audio (tos, respiración y habla) para establecer una predicción. Hoy cuentan con 65 mil grabaciones de sonido de 32 mil participantes.

Diga “Ahhh”

Actualmente en Chile no existe una manera de estimar la dificultad respiratoria generada por alguna enfermedad de modo remoto y automático. Los médicos pueden entrevistar a los pacientes por teléfono y hacerles preguntas específicas para evaluar la dificultar respiratoria, pero este procedimiento no se puede aplicar de modo masivo por la cantidad de personal de salud requerido. Tampoco es aplicable si se requiere evaluar a pacientes varias veces por día.

Por ello lo interesante del proyecto “Inteligencia artificial para la detección y seguimiento de dificultad respiratoria en población de riesgo Covid-19 usando la red telefónica”, uno de los 75 proyectos aprobados como parte del Concurso para la Asignación Rápida de Recursos para Proyectos de Investigación sobre el coronavirus, impulsado por el Ministerio de Ciencias y la Agencia Nacional de Investigación y Desarrollo (ANID) en 2020.

El trabajo busca la detección y seguimiento de la dificultad respiratoria de pacientes de riesgo usando la red de telefonía, por lo que ofrece una oportunidad de limitar los efectos de la pandemia con alcances positivos más allá de la actual contingencia.

En ese sentido, la idea de la investigación es detectar, prevenir y hacer seguimiento automático a la población con mayor riesgo al momento de contraer Covid-19, además de identificar enfermedades preexistentes o laborales producto de las faenas de gran riesgo pulmonar como el trabajo en la gran minería, gases peligrosos como el trabajo de bomberos, y el asma ocupacional, bisinosis en los panaderos, entre otras ocupaciones con alto compromiso respiratorio.

“Una de las motivaciones de esta investigación es detectar y hacer seguimiento automático de población de riesgo en Covid-19. Personas que pueden presentar comorbilidades o cuadros de enfermedades respiratorias y que tienen una probabilidad mucho más elevada de desarrollar complicaciones o de fallecer si se contagian de esta enfermedad, incluyendo sus posibles consecuencias. Con esta tecnología deseamos detectar y prevenir a estas personas, antes que se encuentren en un estado crítico de dificultad respiratoria. También, queremos hacer seguimiento de aquellos pacientes que quedaron con deficiencia respiratoria como secuela debido a la pandemia”, explica el profesor Néstor Becerra de la Universidad de Chile, quien cuenta con más de 25 años de experiencia en tecnologías de la voz.

Otro experimento que se está llevado a cabo con buenos resultados es el de Merlín Research, una empresa chilena conformada por profesionales de áreas como matemáticas, estadística, ciencias cognitivas y biología, y que cuenta con un acuerdo de cooperación con el Language Technologies Institute de la escuela de computación de Carnegie Mellon. Su CEO, Mauro Arancibia, explica que “actualmente existen muchos pilotos relacionados con la tecnología de detección del Covid-19 a través de la voz. Cuando dejamos que esta inteligencia artificial comience a aprender a partir de datos, puede hacerlo con cualquier cosa. El problema es qué aprende con esos datos que no necesariamente son generalizables. Es como si fuese un estudiante de matemáticas que es bueno porque contesta un sólo tipo de examen, pero ¿qué pasa si le das otro?”.

“En ese sentido hay varios estudios que se hicieron con pocos datos, e incluso datos auto generados que no es información contrastable con exámenes clínicos, como lo hizo el MIT por ejemplo. Nuestro avance está por sobre los 2 mil casos estudiados y comparamos personas con Covid-19 sintomático o asintomático. A medida que vamos aumentando los datos, incrementamos la capacidad de detección de estos casos en más de un 90%. Lo próximo es pasar a 4 mil casos, y para ello contamos con acuerdos con instituciones argentinas, importantes redes de salud en Chile y también otros países en Latinoamérica, con lo que el estudio alcanza un grado regional”, dice.

“En nuestro caso, el análisis demuestra que a mayor cantidad de datos, la precisión aumenta y valida el alcance de los algoritmos. Tenemos datos de pacientes de 19 a 72 años, abarcando un amplio rango estadístico y hasta esta fase de pruebas han funcionado bien, pero a medida que la cifra de personas suba el método mejora. Incluso hemos visto personas con PCR negativo, pero que a través de nuestra muestra aparece como positivo. Y la prueba PCR días después lo comprueba”, añade Arancibia.

En relación a su funcionamiento, el CEO de Merlin Research señala que “estas alteraciones -como una enfermedad por Covid-19- producen variaciones a nivel anatómico en el cuerpo. Entonces, al pedirle a la persona que haga el ejercicio de prolongar la letra A o las vocales por todo el tiempo que pueda respirar, la señal aparece en un espectograma y se observan ‘micro huellas’ provocadas por la afección. Esto puede ser a través de una llamada telefónica con datos anónimos -sólo se pide edad y sexo- y a las personas se les dice que serán parte de un experimento científico. Se les solicita que tosan, mencione si tiene algún síntoma, luego ingresamos estos datos al sistema y los comparamos con sus exámenes PCR. Podemos diferenciar entre una alergia o resfrío común. También podemos hacerlo a través de una aplicación, y el sistema es cómodo y de bajo costo”.