¿ESTAMOS APLANANDO LA CURVA?, NO PODEMOS SABERLO

Iker
9 min readApr 18, 2020

--

Este artículo fue escrito el 17 de Abril de 2020, por lo que los datos, información y análisis aquí presentes pueden encontrarse desactualizados; en caso que escriba otro artículo que incluya información más reciente, será referenciado en esta sección.

Infografía del Ministerio de Salud del 17 de abril de 2020

En su día más oscuro, exactamente el 8 de abril, Colombia acumuló un total de 274 nuevos casos de contagio y 13 fallecidos a causa del virus SARS-CoV-2, unos días después, el 11 de abril, el Ministro de Salud y Protección Social, [i] reportó que el país que había logrado aplanar la curva de contagios, sin embargo y ante toda la incertidumbre que vive el país, se suscitaba en el ambiente una pregunta: ¿Vamos ganando la batalla contra el virus?, ¿Podremos estar tranquilos frente a la cadena de contagios?. La respuesta es simple: no lo sabemos, pues con los datos que usamos y por cómo hacemos las cosas hoy en día no es posible.

[i] https://www.semana.com/nacion/articulo/hemos-logrado-aplanar-la-curva-ministro-de-salud/663055,

LO ESTAMOS HACIENDO MAL

La afirmación que indica que la curva se ha aplanado, no corresponde a la realidad, debido a que los reportes diarios del Instituto Nacional de Salud (INS) evidencian un error en la información entregada y replicada por los medios de comunicación.

“El comportamiento actual de la epidemia evidencia el aplanamiento de la curva de contagios en el país.”[i] — Fernando Ruiz Gómez — Ministro de Salud y Protección Social

Cada día el Instituto Nacional de Salud, publica su reporte diario, que contiene los datos maestros, en los cuales podemos encontrar un total de nueve columnas:

Primeros 13 registros del reporte del 14 de abril de 2020 del INS
Primeros 13 registros del reporte del 14 de abril de 2020 del INS

En este archivo se reporta uno a uno los casos identificados, y cada día se actualiza el estado de los registros a través de la columna “Atención”, lo cual permite realizar un seguimiento especifico de cada uno de los contagios identificados, saber que pacientes fallecen, se recuperan o son ingresados en hospitales, e incluso de donde proviene el contagio (Utilizando las columnas “Tipo” y “País de procedencia”), sin embargo, existe un error en la forma en la que son reportados cada uno de los casos.

“No estamos midiendo el número de contagios por día en el país, si no la capacidad de diagnóstico diario del INS”

Y es que, el título de la columna dos del reporte (Fecha de Diagnóstico); debe ser tomado literalmente, el dato nos reporta la fecha de diagnóstico, no la fecha de contagio del caso que estamos evaluando o mejor aún, la fecha en que iniciaron los síntomas, esto es un gran error, ya que no estamos midiendo el número de contagios por día en el país, si no la capacidad de diagnóstico diaria del INS; el dato que allí vemos, es realmente el de cuantas muestras positivas procesó el INS en ese día, no cuántas muestras positivas se presentaron en el país en un día determinado.

[i] https://twitter.com/MinSaludCol/status/1250219695044800514

¿CUÁL CURVA?

Se menciona una y otra vez, que el objetivo de todas las medidas tomadas en el país es aplanar la curva de contagios, pero constantemente se confunde la información entregada acerca de la curva que se busca aplanar, ya que generalmente se entregan y muestran datos y gráficos que representan la suma acumulada de los casos en el país.

Suma Acumulada de casos diarios

Sin embargo, aunque es un dato importante, aclaremos que esta no es la curva que se busca aplanar, la que realmente intentamos aplanar es la que se muestra cuando se indican la cantidad de casos diarios.

Casos Diarios Presentados en Colombia

El conteo de casos diarios es el dato que explica que la curva se está aplanando, el cual no solamente se encuentra reportado de forma errónea, si no que hoy no podemos conocerlo, esto hace que las afirmaciones de aplanamiento de curva no tengan un sustento claro, o al menos no con la información publicada por el INS.

APLANANDO LA CURVA

En los reportes diarios del INS, siempre se reportan los nuevos casos con la fecha en que se emite el reporte, es decir, el reporte del 8 de abril contenía 274 nuevos registros en comparación al del día 7 de abril y todos los casos reportados tienen como fecha de diagnóstico “8/4/2020” evidenciando un error en la presentación de información de las pruebas.

Reporte del INS del 8 de abril de 2020

Esto no significa que el 8 de abril se hubieran identificado 274 nuevos contagios en el país, sino que, del total de las muestras procesadas, las cuales fueron 3.130[i], el INS identificó 274 como positivas, esto resulta de especial relevancia, dado que no es posible que el INS haya tomado, recolectado y procesado las muestras en 24 horas, si no que esas muestras tendrían varios días de haber sido recibidas, esperando a ser procesadas por la Entidad, la cual cabe recordar, para ese momento se encontraba funcionando a su capacidad máxima[ii], generando retrasos de hasta 15 días en la entrega de resultados y siendo incapaz de procesar todas las muestras que se toman en un día a lo largo y ancho del país.

“Los casos positivos se diluyen a lo largo de varios días, ya que el INS los reporta en diferentes fechas y según su capacidad”

Palabras más, lo anterior significa que debido a como se reportan los casos (Por su fecha de diagnóstico y no por la fecha de la muestra o inicio de los síntomas), los casos positivos se diluyen a lo largo de varios días, ya que el INS los reporta en diferentes fechas y según su capacidad, llegando no solo a afectar la fidelidad del reporte, si no, también las estadísticas que se desprenden de la tasa diaria de contagio, entre ellas la tendencia de la curva, lo anterior teniendo en cuenta que las muestras llegan al INS a destiempo y desde diferentes regiones del país.

Imaginemos algo, si de forma hipotética tomáramos 5.000 muestras en todo el país durante tres días, de las cuales en promedio 400 diarias fueran positivas, y estas fueran enviadas al INS, a este le tomaría una semana entera procesar las muestras y no reportaría los casos con la fecha en que se tomaron estas, si no, en múltiples días, por lo que en los indicadores estaríamos aplanando la curva… solamente que estaríamos haciéndolo con un martillo.

Grafico que ilustra el ejemplo presentado de 400 muestras diarias positivas
Animación que ilustra el ejemplo presentado de 400 muestras diarias positivas

El promedio de las muestras procesadas de acuerdo a las estadísticas del propio INS, es de 2.184 muestras diarias[iii] entre el 6 y el 12 de abril, y seria también el periodo en que más muestras se han procesado, por lo cual no es una coincidencia que en esa semana se hayan reportado más casos como positivos en el país (1291); esto es porque no sabemos la fecha en la que se le tomó la muestra a la persona, si no cuando su diagnóstico fue positivo, por lo que esos 1.291 casos podrían corresponder fácilmente a la semana del 23 de marzo mezclados con resultados de semanas posteriores, cuyas muestras se encuentren geográficamente más cercanas al INS y por ende llegan a la etapa de procesamiento más rápidamente.

[i] https://www.pulzo.com/nacion/numero-pruebas-diarias-coronavirus-hechas-colombia-bastante-PP879161

[ii] https://caracol.com.co/radio/2020/04/06/nacional/1586171150_272262.html

[iii] https://www.ins.gov.co/Noticias/Paginas/Coronavirus.aspx

¿DÓNDE ESTÁN LOS DATOS?

Si bien es cierto que los datos de la fecha de toma de la muestra e inicio de los síntomas no son públicos, el INS en su portal ofrece la información[i], aunque los datos no son accesibles públicamente en su totalidad; vale la pena destacar que el Ministerio de Salud utiliza la fecha de inicio de síntomas [ii], como base para algunas de sus proyecciones y estadísticas, al ser está la forma correcta, e inclusive yendo más allá, el mismo Ministro de Salud mencionó en una entrevista con la revista Semana, que “la curva real era la basada en la fecha de inicio de síntomas y no de diagnóstico”; [iii] esto nos da a entender que los datos existen y se utilizan internamente para los modelos del ministerio, más el público en general y las estadísticas reportadas por el INS no se basan en los mismos datos.

Proyección de Casos informados vs Observados utilizando la fecha según inicio de síntomas — Fuente Ministerio de Salud https://bit.ly/34BhKsy

La toma de muestras y la realización de pruebas como lo menciona el Ministro en su entrevista, ha sido disminuida en las últimas semanas, y aunque, el país recibió una gran cantidad de kits de pruebas recientemente (más de 100 mil), la capacidad de procesamiento podría llegar a seguir siendo limitada; al tener que centralizar los resultados a través del INS, y muy a pesar que algunas universidades, EPS y otras entidades que se han unido puedan aumentar esta capacidad; podríamos terminar generando un cuello de botella entre las pruebas realizadas, su procesamiento y reporte.

[i] https://infogram.com/covid-19-or-instituto-nacional-de-salud-or-colombia-1hke60w3qlz345r

[ii] https://www.minsalud.gov.co/Paginas/En-Colombia-actualmente-tenemos-una-tasa-de-contagio-de-1.2-Minsalud.aspx

[iii] https://youtu.be/IP1FVoEY6Us

NO SABEMOS ANALIZAR NI GENERAR DATOS

Sumado a lo ya expresado anteriormente, se encuentra que la calidad de datos que utilizamos en Colombia para el análisis de esta pandemia deja mucho que desear:

· Es un proceso manual: el procesamiento y entrega de datos que realiza el INS en sus reportes diarios es completamente manual; esto se ve evidenciado en la falta de estandarización, errores ortográficos, utilización de formatos no estándar, datos erróneos y otros cuantos que a diario los que analizamos estos reportes, vamos identificando y que claramente no son errores cometidos por un programa o algoritmo de cómputo, situación que pronto se volverá insostenible debido a la gran cantidad de datos.

· Falta de previsión: los campos en los que se basan las estadísticas no contemplan las posibles situaciones futuras, si no, que a medida que estas se presentan las van desarrollando, generando reprocesos en los modelos y estadísticas que se puedan presentar en los datos; así como las fallas en las proyecciones realizadas.

· Estandarización: Si queremos afrontar una situación como la que estamos viviendo, es necesario la coordinación entre diferentes entidades, el Departamento Nacional de Estadística, DANE, cuenta con el listado oficial de todos los municipios del país, junto con sus coordenadas geográficas; estos datos no son los mismos que utiliza el INS, mucho menos para los países relacionados a los casos, la terminología en general es variable entre diferentes días, en los cuales puede ser que se escriban todas las ciudades sin tildes y en mayúscula y al siguiente algunas con tildes y en capitalización variable.

CONCLUYENDO

Si bien, partí bajo el principio de buena fe en las afirmaciones del ministro de salud, acerca de que la curva de contagios en Colombia se está aplanando, simplemente no se encuentra sustento de esa afirmación en los datos públicos (¡Y no soy el único![i]), ya que de los datos no es posible inferir en sus afirmaciones, y en conjunto con los niveles de pruebas que se realizan a diario en Colombia, podrían llevarnos a tomar decisiones equivocadas.

“En estadística, lo que desaparece detrás de los números es la muerte.” — Gunter Grass

Es urgente y sumamente necesario involucrar a otros sectores como el académico y los profesionales de la estadística, matemáticas, análisis de datos, entre otros, para que puedan aportar en la resolución de los inconveniente y errores que hoy en día se presentan en la información y en la que se basa la toma de decisiones; teniendo en cuenta que muchos de estos errores se pueden estar presentando, no por incompetencia, si no por la falta de recursos de parte del INS y las instituciones públicas en Colombia.

[i] https://www.datos.gov.co/Salud-y-Protecci-n-Social/Casos-positivos-de-COVID-19-en-Colombia/gt2j-8ykr/data

Actualización Tardía: el 17 de abril, coincidencialmente con la publicación de los datos de la Alcaldía de Bogotá, el INS decidió modificar su reporte substancialmente, alterando datos anteriores, fechas de los casos reportados, estados y municipios donde se presentaron los casos; e inclusive añadiendo y modificando columnas por razones desconocidas, pero que tienen como resultado representaciones sumamente diferentes de la situación en Colombia y terminan “aplanando” aún más la curva, una que se duplicaba en la cantidad de contagiados cada 10 días anteriormente y a partir de los nuevos datos, cada 16 días…

Casos Diarios reportados al 16 de abril de 2020 por el INS
Casos diarios reportados al 17 de abril de 2020 por el INS
Comentarios en el portal de Datos Abiertos donde se suben los reportes el INS

--

--

Iker
Iker

Written by Iker

CyberSecurity, Information Security, Tech and Data Enthusiast, Amateur Developer

No responses yet