El pasado día 7 de octubre tuve la oportunidad de asistir a un webinar impartido por la Dra. Clara Prats, investigadora del grupo de Biología Computacional y Sistemas Complejos de la UPC. En esta conferencia online se expuso la experiencia de un grupo de investigadores de la UPC con respecto al análisis i control de los datos de la pandemia de COVID en Cataluña
En este post trataré de resumir y exponer algunas de las ideas que me parecieron más interesantes.
Biofísicos contra el COVID-19
Al finales del 2019 la Generalitat de Cataluña creó el Instituto de Desarrollo e Innovación en Salud en Cataluña (IRISCAT) que constituye una alianza entre los siete institutos de investigación vinculados al ICS cuyos objetivos eran:
- Mejorar los resultados en Salud de la comunidad autónoma
- Mejorar la coordinación y cooperación entre instituciones.
Esta institución no tardaría en encarar su primer gran reto (o como mínimo, el más apremiante) que consistiría en participar en la lucha contra la Pandemia del COVID-19. Con este fin el IRISCAT confió en un grupo de biofísicos especialistas en enfermedades infecciosas de la UPC para hacer un seguimiento de la enfermedad con el objetivo de aprender de ella y, de esta forma, poder predecir su evolución.
Debemos tener en cuenta que, a principios de año, poco se sabía del nuevo coronavirus chino y los investigadores (encabezados por la Dra. Prats) enfocaron sus esfuerzos en predecir mediante modelos matemáticos la evolución de los casos. Una vez superada la primera ola, en España ya se disponía de mayor información biológica, así que los investigadores se emplearon a fondo para encontrar índices y herramientas de análisis y control para, por un lado, hacer recomendaciones de salud pública y, por otro, mejorar la detección de los brotes de contagios.
Herramientas de predicción
Como hemos dicho, el desconocimiento sobre el virus era la norma en los primeros meses de la epidemia y, por tanto, los científicos de todo el mundo se ampararon en los modelos empíricos-analíticos para predecir la evolución de la primera ola. Estos modelos se basan en la observación, registro y análisis diario. El grupo de trabajo descubrió, a partir de los datos de Italia y China, que el modelo empírico de Gompertz se ajustaba casi a la perfección con los datos que se iban registrando cada día de estos países.

Mediante la adopción de este modelo se pudo, a partir los datos diarios, predecir (con un porcentaje de acierto lo suficientemente elevado) el número de casos que se detectarían a corto plazo. No obstante, como es lógico, la predicción más alejada en el tiempo (a 5 días) ofrecía una probabilidad de acierto menor (75%) que la de a un día (95%). Asimismo con este modelo se pudo predecir, a largo plazo y una vez pasado el pico de contagios de la primera ola, a qué ritmo bajarían los nuevos contagios. De esta forma, se pudo asistir a las autoridades en el diseño de la desescalada del confinamiento impuesto de forma general.
Más adelante, ante la necesidad de adecuar las escuelas a la nueva realidad en septiembre se optó por realizar simulaciones estocásticas para averiguar cómo afectaría un contagio de un alumno dentro de un aula. Los resultados de estas simulaciones sirvieron para diseñar las medidas de la reentré escolar y para descubrir que:
- Crear grupos burbuja de alumnos sólo era realmente necesario si el territorio correspondiente tenía una tasa de reproducción (R) elevada, es decir por encima de 3.
- A efectos de propagación de la enfermedad, no hay mucha diferencia entre aplicar a los contagiosos una cuarentena de 14 o de 10 días.
Índices y herramientas de monitorización
Una vez superada la primera ola y desconfinada la población los esfuerzos del grupo de trabajo se enfocaron a encontrar herramientas de detección precoz que posibilitasen advertir y aplanar con tiempo lo temible segunda ola. Para ello se requerían índices y herramientas para la monitorización de la epidemia.
Se determinó que los parámetros esenciales para evaluar el riesgo potencial de rebrote eran dos:
- El indicador de ritmo de contagios que se obtiene a partir del número reproductivo empírico (p7) y nos dice a cuantas personas llega a contagiar una persona contagiada.
- El indicador de casos potencialmente contagiosos que se obtiene con el número de casos activos por 100.000 habitantes (IA14)
El producto de ambos indicadores (p7 x IA14) da como resultado el crecimiento potencial efectivo (EPG, en inglés) o índice de riesgo de rebrote. Con este índice los investigadores ya contaban con una buena señal de alarma que permitiese al sistema sanitario anticiparse al colapso asistencial en las zonas críticas. De esta forma por parte del Departament de Salut se intensificaron las campañas de test & trace en las zonas con mayor EPG. Por otro lado, los datos de EPG también sirvieron para establecer una escala de riesgo que iba del nivel de riesgo más bajo con EPG<30, al nivel de riesgo más alto con EPG >200. Las autoridades sanitarias catalanas decidieron aplicar medidas restrictivas en las poblaciones con un EPG superior a 100.
Para ayudar a la correcta interpretación y detección del potencial riesgo que el EPG señala se optó por diseñar las siguientes visualizaciones de los datos:
- Diagramas de riesgo que relacionan los dos indicadores que forman el EPG (el número reproductivo en el eje Y y el potencial de contagio en el eje X), muestran su evolución y lo representan encima de una fondo de colores que indica la capacidad de test and trace que tiene la población en cuestión.

- Heatmaps con la evolución de los EPG en las diferentes áreas de salud de Cataluña.

Conclusiones
La experiencia acumulada por el equipo de la Dra. Prats en estos meses de trabajo intenso ha vuelto a poner en valor aquellas reflexiones que todo analista de datos suscribe. Éstas son:
- Cualquier análisis predictivo o de situación requiere de datos fiables y sin retrasos. Desafortunadamente, tanto a nivel catalán como español, los datos han llegado tardíamente y en muchas ocasiones, especialmente durante los primeros meses de pandemia, eran poco fiables.
- Las predicciones deben ir acompañadas de una evaluación de la fiabilidad o del error cometido. Por esto los investigadores siempre han sido reacios a dar una previsión largo plazo de los datos epidemiológicos.
Estas limitaciones y otras dificultades derivadas del desconocimiento de esta nueva enfermedad contribuyeron a entorpecer la correcta modelización de la pandemia. No obstante, creo que las herramientas ideadas de predicción y monitorización han resultados útiles y han permitido a la sociedad en general contar con unos indicadores de riesgo claros y objetivos.
Por último cabe decir que la gestión de la pandemia es un problema multifactorial y cuantas más personas estén implicadas en su control, mejor. Por otro lado, la coordinación entre todos los elementos implicados es esencial y, para ello, la compresión del trabajo que hace cada uno es importante. Por esto, es de agradecer el esfuerzo divulgativo que hace la Dra. Clara Prats para explicar el trabajo de análisis y predicción de datos epidemiológicos que lleva a cabo su grupo de investigación.
Agradecimientos.
Gracias a l’Institut de Recerca del Hospital Vall Hebron y al IRISCAT por organizar este evento formativo gratuito para los trabajadores del Hospital Vall d’Hebron. También quiero agradecer la exposición amena y concisa de la Dra. Clara Prats.
Si te has quedado con ganas de más puedes acceder a más análisis relevantes realizados por el equipo de Biología Computacional y Sistemas Complejos de la UPC haciendo clic en el siguiente enlace.