Predicción de casos covid-19 con Machine Learning

Guillermo Alfredo Peitzner Estrada
Estudiante de Ingeniería en Ciencias y Sistemas - USAC
guillermopeitzner@gmail.com


Las pandemias no son un fenómeno nuevo, han ocurrido desde que el ser humano se estableció en un territorio formando vínculos sociales, entre las cuatro pandemias más importantes podemos mencionar: La peste negra, la más devastadora de toda la humanidad que dejó más de 200 millones de fallecidos, afectó a toda la región de Eurasia y estuvo presente del 1347 al 1353 a. C., la plaga antonina comprendida entre el 165 a 180 d. C. en el imperio romano que dejó 5 millones de Muertos, la plaga justiniana que se originó en el imperio romano entre el 540 a 542 d. C. dejando más de 25 millones de víctimas mortales. Y la gripe española comprendida entre 1918 a 1920, la plaga afectó todos los países involucrados en la primera guerra mundial y dejó más de 50 millones de víctimas mortales [1]. Todas estas pandemias comparten algo en común, aparte de dejar una gran cantidad de muertos a su paso, su duración no se limita a un corto periodo de tiempo, estas pueden durar un par de años o incluso décadas.

El Covid-19 no es la primera pandemia que enfrenta Guatemala, a finales de 1918 y principios de 1919 se desarrolló la gripe española, la percepción inicial del país era de que era una enfermedad local producida por las pésimas condiciones de vida producidas por el terremoto de 1917. Luego de que las autoridades se percataron que no era una simple enfermedad tomaron medidas como cerrar todos los centros educativos, prohibición de eventos públicos, religiosos y mercados. El cierre incluso afectó las actividades económicas. los cuarteles donde se atendián los enfermos colapsaron y el personal médico combatió la pandemia exponiendo a sus pacientes al sol, ya que esto destruía al virus. El verano de marzo ayudó ha erradicar la pandemia. El total de víctimas que dejó la gripe española en Guatemala estuvo comprendido entre 75 a 150 mil equivalentes al 5% de la población de ese momento (2 millones) [2]. Comparado a la pandemia actual de Covid-19 (2021) con la de la gripe española se puede mencionar que esta solo ha dejado 6184 muertos hasta el 19 de febrero de 2021. A pesar de que la tasa de mortalidad es bastante baja 5% (febrero de 2021), Guatemala presenta las mismas deficiencias en el sistema de salud, un sistema colapsado y sin capacidad para atender un gran volumen de infectados.

El 20 de enero de 2021 el gobierno de Guatemala estableció medidas por el supuesto relajamiento de la población, que en ese momento se contaban con más de 150 mil casos. Entre las medidas que fueron establecidas podemos encontrar: la reducción de los horarios de los mercados municipales (6 de la mañana a 2 de la tarde), prohibición de ferias comunales, ley seca hasta las 21 horas, prohibición de velorios y entierros masivos, limitar el acceso a playas, lagos y ríos, uso universal de la mascarilla, distanciamiento físico de por lo menos 1.50 metros, higiene de manos con agua y jabón entre otras [3]. Al día 19 de febrero de 2021 Guatemala cuenta con más de 170 mil casos, esto deja evidencia que las medidas establecidas por el Gobierno de Guatemala no han sido eficaces; esto debido en una mayor parte a que la población no toma las medidas de seguridad planteadas por el gobierno y el crecimiento de casos en los próximos meses puede ser aún mayor si la población no acata estas medidas y si el país no empieza con el proceso de vacunación.

Covax es un mecanismo liderado por la Organización Mundial de la Salud (OMS) encargado de la distribución de vacunas contra el Covid-19 a los 187 países que han solicitado su ayuda, entre estos países se encuentra Guatemala. El objetivo de Covax es asegurar el acceso a la vacuna a países en desarrollo en un momento histórico en el que existe una gran desigualdad en la distribución de vacunas, esto advertido por la OMS. Entre las vacunas que se distribuirán encontramos: Pfizer (95% de efectividad) y AstraZeneca (70% de efectividad). En la primera fase se distribuirán 337.2 millones de dosis que pueden cubrir a un 3.3% de la población total de 145 países de ingresos medios y bajos. Como se puede observar en la Imagen 1, Guatemala solo contará con un total de 847,200 vacunas que llegarán a finales de marzo [4]. Siendo este un 4.98% porcentaje del total de la población (17M – agosto 2020).

Imagen 1: Lista provisional de distribución de vacunas de Covax Fuente: Covax

La población guatemalteca tiene que estar consciente que, aunque exista una luz al final del túnel, el trayecto para llegar a esta salida es largo (EST. 2022) [5]. Los retos que presenta Guatemala en cuanto a salubridad se pueden ver evidenciados en un sistema de salud colapsado, la falta de infraestructura para poder almacenar las futuras vacunas expone al país sumido en una corrupción que parece nunca tener fin [6]. Uno de los sectores de la población guatemalteca que está más expuesto a contraer el virus debido al tipo de actividad que realizan es el dedicado a la economía informal, la que representó el 34.7% del producto interno bruto en 2T 2020 [7], entre las actividades más importantes de la economía informal podemos encontrar el alojamiento y servicios de comida, comercio y reparación de vehículos, transporte y agricultura [8]. El sector informal comprende el 69.5% de toda la población económicamente activa, esto quiere decir que 7 de cada 10 guatemaltecos depende de sus ingresos para poder vivir [9]. Siendo conscientes que el recorrido es largo y que tenemos que atacar las medidas de prevención hasta la vacunación ¿Cómo Guatemala puede hacerle frente a lo que le resta a esta guerra? Para ganar una guerra lo más importante es conocer al rival, si lo conocemos podemos predecir sus movimientos “Ganará quién sabe cuándo luchar y cuándo no luchar” [10]. y de esta forma crear la estrategia más conveniente. Gracias a las Ciencias Computacionales se pueden crear modelos con los que podemos predecir la posible cantidad de casos que pueden ocurrir en el futuro, siendo conscientes de esta posible realidad, existe la oportunidad de estar preparado.

Imagen 2: Cantidad de Casos de Covid-19 en el Municipio de Guatemala desde el día cero al 06 de febrero de 2021. (Datos obtenidos del MSPAS) Fuente: Elaboración propia

El Ministerio de Salud Pública y Asistencia Social de Guatemala tiene a disposición un Tablero de Covid-19 , este cuenta con las estadísticas actuales más relevantes del desarrollo de la pandemia en el país. Entre los datos que podemos encontrar se encuentran los casos confirmados, tamizados y fallecidos por cada municipio a nivel nacional. Estos datos se encuentran tabulados por fecha, son constantemente actualizados y se pueden descargar en un formato de archivo separado por comas [11]. Haciendo uso del lenguaje de programación Python, librerías para la manipulación de archivos separados por comas [12] y generación de gráficos [13], se realizó la Imagen 2 que corresponde a la cantidad de casos confirmados por día en el municipio de Guatemala desde el día cero hasta el 06 de febrero de 2021.

Modelo predictivo

Ahora que conocemos el comportamiento de los datos a través del tiempo, ¿Cómo podemos crear un modelo predictivo a partir de los datos utilizados en la gráfica? Esta es la parte en donde el Machine Learning entra en acción.

Imagen 3: Series de tiempo Fuente: Amazon

El Machine Learning es un área importante de las ciencias computacionales, esta forma parte de la inteligencia artificial, su principal objetivo es crear técnicas para facilitar el aprendizaje por parte de las computadoras por medio del estudio de algoritmos que mejoran automáticamente a través de la experiencia. Estos algoritmos pueden crear modelos en base de datos de muestra para realizar predicciones o decisiones, esto sin el objetivo de estar programados exclusivamente para cumplir con esta función [14]. Una de las aplicaciones del Machine Learning es el pronóstico de series de tiempo, que es una serie de puntos indexados en orden de tiempo. Una serie de tiempo es una secuencia sucesiva de puntos igualmente espaciados a través del tiempo [15], esto se puede observar en la Imagen 3. Si comparamos la Imagen 2 y la Imagen 3 podemos apreciar que estas tienen un comportamiento bastante similar, comparten el mismo principio: puntos indexados a través del tiempo. Facebook creó una librería en Python de código abierto para la generación de modelos que tienen el comportamiento de series de tiempo [16], los únicos datos que son requeridos por esta librería son las fechas y las magnitudes asociadas a estas. Haciendo uso de los datos utilizados en la Imagen 2 y de la librería se generó la Imagen 4.

Imagen 4: Modelo predictivo generado a partir de los datos de la Imagen 1 Fuente: Elaboración propia

En la gráfica de la Imagen 3 los puntos corresponden los casos confirmados por fecha en el municipio de Guatemala, la gráfica de color azul corresponde a la prueba del modelo generado utilizando las mismas fechas, el modelo tiene bastantes ocurrencias respecto a los datos originales, aunque existan varios datos atípicos por parte de los datos originales, el modelo fue creado con una muestra de datos bastante baja, si se aumentan los datos de entrada el modelo mejorará, esto gracias a su naturaleza de mejora continua conforme a la experiencia. Con el modelo ya creado y probado, se pueden hacer predicciones del futuro como se puede observar en la Imagen 5 y en la Tabla 1, en las cuáles podemos ver una proyección de los casos para el mes de febrero de 2021 (ver recuadro naranja en Imagen 5).

Imagen 5: Modelo predictivo generado a partir de los datos de la Imagen 2 Fuente: Elaboración propia

Tabla 1: Predicción de número de casos por fecha Fuente: Elaboración propia

El 12 de febrero es el día con menor cantidad de casos mínimos estimados, el día 15 de febrero se estima la mayor cantidad de casos como estimación máxima, siendo un crecimiento del 290% en tan solo 3 días para llegar a un pico máximo de la estimación equivalente a 229, con un reporte diario de 76 casos por día en el periodo de tiempo comprendido entre el 12 y 15 de febrero según el pronóstico del modelo utilizado. En el departamento de Guatemala se cuenta con 752 camas para atender pacientes Covid-19 según INCYT esto representa el menos del 1% de la ocupación para atender al total de pacientes confirmados positivos (promedio diario – 120 según estadística del MSPAS) de Covid-19 en el 2020. Si no se toman las medidas preventivas en el periodo de una semana el ocupamiento de las camas disponibles en el municipio de Guatemala estaría saturado por los casos positivos confirmados (casos moderados y severos).

Comparando los resultados del modelo respecto a los casos infectados por día hay una variación con los datos reales del 37%; siendo más conservador el modelo demostrando un promedio mucho más bajo de lo que nos arroja el análisis de los datos en un periodo de tiempo desde que inicio hasta febrero de 2021.

Conclusiones

  • Las pandemias tienen una duración bastante prolongada.

  • Para poder evitar la propagación del virus la sociedad guatemalteca debe acatar todas las medidas de prevención hasta la vacunación.

  • Con la ayuda del Machine Learning podemos crear modelos que nos brinden información acerca de cómo se puede comportar un determinado fenómeno en el futuro.

  • La precisión de un modelo generado con Machine Learning va a depender del volumen de datos con el que es provisto, entre más datos mejor.

  • Para refinar la proyección con Machine Learning es conveniente conocer otros modelos utilizados en diferentes países y acoplarlos a datos que Guatemala provee.

  • Los modelos predictivos facilitan la toma de decisiones porque amplían nuestra visión del futuro.

Referencias