Divagar sobre COVID-19

Buenas noches.

Esta tarde, presa del aburrimiento, me he dedicado a realizar una serie de cálculos y estimaciones al respecto del tema único: el coronavirus. Un tema para dominarlos a todos. Así que me he decidido a compartir mis divagaciones escribiendo este artículo. Mi intención era, fundamentalmente, añadir consideraciones de edad y de necesidad de cuidados intensivos a las cifras que todos conocemos.

Nota importante: nada de lo que aquí se lea debe tomarse como cierto, ya que este artículo no pretende ser una fuente fiable de ningún tipo. Sólo se trata de un conjunto de datos recopilados y organizados, de aquella manera, en una tarde de aburrimiento y cuarentena por un tipo cualquiera. Las imprecisiones existen (algunas deliberadas por simplicidad) y las erratas son perfectamente esperables.

Aviso a navegantes: es muy posible que haya cometido errores, groseros incluso. Animo a todo aquel a quien le interese a que me corrija sin miedo, a que dé su opinión y aporte lo que crea interesante. Sin embargo, no tengo intención de responder a los navegantes talibanes que no entiendan las circunstancias en las que este artículo ha sido escrito y pretendan pontificar de mala manera sobre las bondades de la exactitud matemática y de la inmaculada investigación.

Queda claro, imagino, cual es la intención de lo que escribo. De hecho, si os resulta interesante, os animo nuevamente a corregir cualquier errata, imprecisión o a proponer cualquier añadido o metodología alternativa.

(0) Fuentes y datos

Uno de los problemas a los que se enfrenta alguien que quiere estudiar las cifras del fenómeno COVID-19 es la falta de datos. Los medios repiten las mismas cifras incesantemente: número de fallecidos, contagiados, etc. Sin embargo, existen datos de interés que no es tan sencillo encontrar. Durante mis cábalas de la tarde, me he encontrado con algunas lagunas de información, como por ejemplo:

  • datos segregados por edades de aquellos infectados que son ingresados en el hospital, discriminando entre ingresos generales e ingresos en UCI
  • datos segregados por edades sobre población que padece patologías de riesgo

En ambos casos he realizado una estimación "a lo bruto", que detallaré llegado el momento. Por otra parte, especificaré a cada paso la fuente de los datos utilizados.

Algo importante a considerar es lo siguiente: ¿cuál es la proporción de ciudadanos que se contagiarán eventualmente de coronavirus? y ¿qué proporción de los infectados en España han sido - o serán - detectados?

(1) Pirámide poblacional española

El primer paso para cumplir mis objetivos era, por supuesto, conocer la distribución de la población española en función de su edad. Aquí tenéis la pirámide poblacional (fuente: INE)

Esto nos servirá para valorar las edades de riesgo.

(2) Cifra de mortalidad

La cifra de mortalidad no está clara. Depende del día en que se consulte, del país y de la fuente. Sin embargo, debemos tomar una cifras para trabajar. Para ello, he tomado las cifras que publicó el "Instituto Superiore di Sanità" italiano el 12 de marzo. La razón para ello es que este informe segrega claramente por edades (y por sexos, de hecho). También se pueden encontrar estos datos en referencia a China, pero he preferido hacer paralelismos con Italia.

(fuente: www.epicentro.iss.it/coronavirus/bollettino/Bollettino-sorveglianza-in)

Nos interesa la parte de casos totales. La columna "% Casi per classe di età" nos dice la proporción de casos confirmados que corresponden a cada edad. "N. Deceduti" es el número de fallecidos de la muestra y "% Letalità" la tasa de mortalidad por edad. Recuperaremos estas cifras más adelante.

Nótese que la cifra de mortalidad se basa en los casos detectados. En este punto, cabe insistir en una pregunta importante: ¿cuántos casos de contagio han sido - o serán - detectados? Esta es una variable que se considerará posteriormente. Sin embargo, debe quedar claro que el % de mortalidad que se empleará se entiende como relativo a los casos de contagio detectado, no a los casos de contagio total.

(3) Ingresos hospitalarios e ingresos en UCI

Según www.lavanguardia.com/vida/20200319/474256041397/coronavirus-espana-cas en España el 42% de los positivos termina ingresado, de los cuales el 5,7% requiere eventualmente cuidados intensivos. En esta fuente también disponemos de la evolución diaria de los ingresos en UCI. En el caso de Italia, se puede consultar la evolución de ingresados en UCI en www.ilfattoquotidiano.it/2020/03/07/coronavirus-diretta-in-italia-5-88.

Nota: inicialmente había supuesto que una hipótesis de simplicidad válida sería suponer que todos los fallecidos pasaban antes por la UCI (obviando el colapso del sistema sanitario). Sin embargo, resulta que los datos muestran que hay, en todo momento, más fallecidos que ingresados en la UCI, tanto en acumulado como en variación diaria. No soy médico y desconozco la razón de este hecho.

En base a los datos diarios de ingresados en UCI que nos ofrece La Vanguardia, he aquí mi primera aproximación "excelliana".

Se trata, simplemente, de dos líneas de tendencia, una lineal y otra polinómica, basadas en las cifras facilitadas por la fuente y extrapoladas 15 días a partir del 20 de marzo. Se incluye el R2 (coeficiente entre 0 y 1 que determina la calidad del modelo, siendo mejor cuanto más cerca de 1 esté)* y una marca con el número de camas de UCI en el país (4.627) y en la Comunidad de Madrid (641)**. El gráfico inferior tiene el eje Y en base logarítmica.

* Dada la naturaleza de los datos, este proceder es técnicamente incorrecto desde un punto de vista procedimental y matemático. Es una de las inexactitudes deliberadas por motivos de simplicidad de las que hablaba al principio. También se obvian elementos disruptores de la tendencia observada hasta ahora, tales como la cuarentena impuesta. Por todo ello, tómese esta predicción más como curiosidad que como dato.

** fuente: www.rtve.es/noticias/20200318/respiradores-camas-personal-uci-carrera-

Para que veais que cifras se mueven, aquí tenéis más datos sobre la situación en Italia los últimos 5 días (fuente: www.ilfattoquotidiano.it/2020/03/07/coronavirus-diretta-in-italia-5-88)

Nota: el % de ingresados en UCI es relativo a los casos activos en Italia (no a los totales acumulados, ni a la población total).

Hipótesis de trabajo

Para las consideraciones posteriores, necesitamos conocer cuál es el porcentaje de ingresos hospitalarios, y cuál el de ingresos en UCI. Como hemos visto, en España se dice que un 42% de los positivos son ingresados y que un 5,7% son ingresados en UCI. Nos basaremos en estos datos. Sin embargo, no conocemos la segregación por edades. No la he encontrado, así que lo he estimado a lo bruto.

Como veis, ha sido impuesto que la media de ingresos sea del 40% y la de UCI de un 6% (aproximación de los datos de la fuente, por simplicidad). ¿Por qué he distribuido así los porcentajes por edades?

  • Me parecía mejor que enchufar, por falta de datos, un 40% de ingresos y un 6% de UCI a todos los rangos de edad sin distinción. La realidad dicta que a mayor edad, mayor probabilidad de ingreso.
  • De los 40 a los 60 años se les ha adjudicado la media, por ser la población más numerosa tanto en casos como poblacionalmente.
  • Ya llevaba un buen rato con esto y me daba pereza perderme en búsquedas y procedimientos matemáticos varios. En realidad, cualquier aproximación habría mostrado errores de apreciación (abstenerse talibanes estadísticos)
  • En definitiva, me pareció una hipótesis chusquera y de andar por casa, pero suficientemente verosímil al imponer, como mínimo, la media establecida.

(4) El tabletón

¿Qué porcentaje de la población se infectará eventualmente?, ¿qué porcentaje de infectados serán detectados?

Hagan sus apuestas. Yo no tengo ni idea. Merkel dijo que el 70% de los alemanes se infectaría tarde o temprano, si no recuerdo mal. Son variables importantes, pero sólo cabe especular. Pondré varios casos.

Hipótesis

(i) El sistema sanitario no colapsa (que optimismo el mío)

(ii) la mortalidad y el porcentaje de ingreso hospitalario se entienden con respecto a los positivos detectados, no a los totales

(iii) Las tasas de mortalidad por edades, ingreso e UCI se basan en lo expuesto anteriormente

(iv) todo caso de fallecimiento es previamente detectado como positivo (en otras palabras, no es posible para el modelo que haya un fallecimiento no contabilizado como infección detectada). Esta hipótesis se basa, por simplicidad, en que la gravedad del enfermo, si muere, debe ser suficiente para que sea detectado por las autoridades.



El tabletón es la tabla que me he montado en este día de diversión. Está desordenada y es un poco impresentable, y los observadores atentos pueden, tal vez, observar errores (vuelvo a insistir, esto que escribo no pretende dar datos fiables). Mi tarde ha dado para esto. Aquí la tenéis para el caso de un 70% de infectados sobre el total del país (Tinf) y un 50% de infectados detectados (Tdet)

Con estas hipótesis, volvamos a la pirámide de población

Imagino que os hacéis una idea. Para completar, supongamos que los casos suficientemente graves para ser detectados son sólo un 10% de los existentes, pero eventualmente el 100% de la población se infectará.

(5) Grupos de riesgo

Según una fuente perdida entre las innumerables pestañas abiertas en mi navegador, que ahora mismo no encuentro (lo apunté en un papel), los mayores grupos de riesgo son los siguientes:

  • Enfermedad cardiovascular
  • Hipertensión
  • Diabetes
  • Enfermedad respiratoria
  • Cáncer

No he encontrado datos referentes a los enfermos actuales y vivos que padecen estas patologías en España. Sin embargo, sí he encontrado los fallecidos en 2018 por cada una de estas causas*. (fuente: INE)

* Hay muchas categorías, las he agrupado según las ofrece el INE y según me ha parecido, entendiendo que no soy médico y no conozco la diferencia del riesgo específico entre, por ejemplo, un infarto de miocardio y una ateroesclerosis (ni siquiera sé que es eso), aunque ambas salen clasificadas como enfermedades cardiovasculares e hipertensivas.

Hipótesis

Aunque es una hipótesis muy burra, dada la falta de datos no me parece del todo inaceptable: ¿pueden los datos referentes a fallecidos anuales por determinadas enfermedades de riesgo, extrapolarse alegremente a vivos de alto riesgo por las mismas enfermedades?

Quiero decir: si en 2018 murieron X personas (segregadas por edades) por enfermedades consideradas de riesgo por COVID-19, ¿puede considerarse que, estadísticamente y de aquella manera, en 2020, esa misma proporción (entendida como un límite inferior) de personas aún vivas, padecen de enfermedades de alto riesgo?

En puridad, no. Como digo, es una hipótesis burra (aunque de hecho, lo es por infravalorar la cantidad de personas en riesgo). Pero nuevamente, me ha parecido, a falta de más datos, lo suficientemente verosímil y entendible. Ahí van mis resultados al respecto, en otra tabla desordenada (fuente: INE):

(6) Comentarios finales

Con errores o no, esto que he hecho y compartido con vosotros es corregible y ampliable. Yo, por mi parte, es lo que he hecho hoy al terminar mi jornada de "teletrabajo", y ya está. Insisto en ello porque tengo cierto miedo a que alguien se tome demasiado en serio lo escrito, y no debería. Esto es producto del aburrimiento y de la voluntad de debatir y, tal vez, de ver si alguien con más amplios conocimientos ofrece nuevas indicaciones, mejoras e ideas nuevas para un estudio casero como este.