Acceder

El futuro de la pandemia según las matemáticas

Al inicio de una epidemia el aumento de casos es exponencial, una función que sorprende a la mayoría por su explosivo crecimiento, sin embargo esto solo es la fase inicial de un modelo de crecimiento denominado sigmoide.

 

El modelo de crecimiento sigmoide más conocido fue propuesto por Pierre François Verhulst entre 1838 y 1847 y por ello se le suele llamar función de Verhulst o función logística. Sin embargo para multitud de procesos de crecimiento biológico se suele utilizar el modelo propuesto en 1825 por Benjamin Gompertz para estudiar la relación entre la edad y el incremento de la mortalidad en humanos. Lo que él denominaba "el agotamiento promedio del poder de un hombre para evitar la muerte", o la "porción de su poder restante para oponerse a la destrucción". La función de Gompertz, rápidamente adoptada por la industria de los seguros para proyectar el riesgo de muerte, es ampliamente utilizada en biología como modelo de regresión para estudiar el crecimiento de las poblaciones de animales, bacterias, crecimiento de tumores y supervivencia de pacientes de cáncer, y por supuesto modelos de infección.

Fig 1. Función de Gompertz (azul) y función de Verhulst (logística, rojo) utilizando la capacidad de calculadora gráfica del buscador de Google introduciendo las fórmulas tal y como están escritas.

1. La función de Gompertz

La función de Gompertz es muy similar a la función logística, pero se diferencia de ella en que es asimétrica. El crecimiento es más rápido al principio de la curva que al final. Esta pequeña diferencia la hace más apropiada para describir el crecimiento biológico.

La función de Gompertz es la solución a la ecuación diferencial que describe los cambios en la población (P) con el paso del tiempo (t) en función de su capacidad de crecimiento intrínseca (c, constante) y la máxima población que el ecosistema puede soportar, lo que se define como capacidad de carga (K, carrying capacity). Podéis consultar mi artículo sobre "El problema de la población humana", donde este concepto se explica con gran detalle. La ecuación diferencial que describe el comportamiento de las poblaciones es:

dP/dt = c ln(K/P)P

Esta ecuación cuando se integra y resuelve nos da la función de Gompertz, que describe los cambios en la población en función del tiempo:

P(t) = K e^-ln(K/P0) e^-ct

Donde P0 es el tamaño de la población inicial. Esta ecuación la podéis ver escrita de varias formas equivalentes. En Excel se puede introducir como:

=K*EXP((-LN(K/P0))*EXP((-C)*XX))

Donde K es el número que refleja el máximo de casos que se van a alcanzar, la asíntota superior.
P0 es el número de casos iniciales.
C es el número que corresponde a la constante de crecimiento.
XX es el primer número de celda de donde debe tomar el dato de tiempo (número de días desde el inicio).

Una de las propiedades de la función de Gompertz es que su segunda derivada se vuelve cero cuando la población alcanza el valor de la capacidad de carga dividido por e, P = K/e, (e = 2,718). Esto quiere decir que antes de alcanzar la mitad del total de casos que va a haber, el número de nuevos casos alcanza su máximo y comienza a descender. Como he indicado el descenso en el número de casos es más lento que el ascenso (figura 2). Esta es una de las principales diferencias con la función de Verhulst (logística) que es simétrica.

Fig. 2. Características de la función de Gompertz para una capacidad de carga K de 200.000 y una constante de crecimiento c de 0,06, con una P0 de 2 en el día 1. El pico de nuevos casos se alcanza en el día 42 con 4.400 casos al día.

2. La función de Gompertz para la pandemia de coronavirus

El crecimiento de una enfermedad infecciosa se puede ajustar a la función de Gompertz. Para ello hacen falta dos datos, uno es la capacidad de carga, que corresponde al máximo número de casos de infección que se van a alcanzar, el numero de población que habrá sido infectada al final del episodio epidémico. Este dato puede estimarse o calcularse porque cuando el número de nuevos casos alcanza su máximo basta multiplicar el número total de infectados en ese punto por el número e: K = Pe. El segundo dato necesario es la constante de crecimiento, que es la que determina la velocidad de crecimiento en el eje de las ordenadas (Y), o lo que es lo mismo la inclinación de la curva. Este valor se puede hallar mediante ajuste a los datos.

Veamos un ejemplo. Tomemos los datos de muertes por coronavirus COVID19 en China, que son más homogéneos que los de casos por los cambios que hubo en los criterios de diagnóstico, de la página de Worldometer de China. El análisis de las nuevas muertes cada día muestra un perfil un tanto irregular, pero se puede decir que el máximo de nuevas muertes se alcanzó el 11 de febrero con 146 muertos. Aunque hay dos días que tuvieron más muertos (6 y 22 de febrero), el perfil muestra claramente que se trataron de desviaciones puntuales, no de la tendencia principal, con la curva comenzando el 22 de enero con 17 muertos. El valor de K se puede estimar a partir del total de muertos el 11 de febrero, 1.259 multiplicándolo por el número e (2,718) lo que da una K de 3.422. El valor de c se ajusta para que la curva de la función coincida con la de los datos.

Tomando un valor de K de 3450 y un valor de c de 0,088 la función de Gompertz en Excel toma la forma:
=3450*EXP((-LN(3450/17))*EXP((-0.088)*B3))
Donde la columna B tiene el número de días desde el comienzo con B3=1 correspondiendo al 23 de enero partiendo de un valor inicial P0=17 el día anterior.

La representación de la función comparada con los datos reales es:

Fig. 3. Muertes en China ajustadas a la función de Gompertz.

Es importante destacar que las medidas que se toman para frenar al coronavirus afectan a los valores de K y de c, y por lo tanto a la curva final de Gompertz a la que se ajusta la epidemia. En el caso de las muertes en China, las medidas tomadas redujeron el valor de K para las muertes al entorno de las 3.500, y redujeron el valor de c al disminuir la velocidad de propagación.

3. Las matemáticas de la epidemia en España

La gente se pregunta cuanto va a durar la necesidad de mantener las actuales medidas (o incluso medidas más estrictas), hasta que remita la epidemia. Es algo a lo que todavía no se puede responder. Estimar la K, el número de casos que va a haber, sin haber llegado al máximo de los nuevos casos está lleno de incertidumbre. No ayuda que desde el 11 de marzo haya cambiado el criterio para hacer los tests y ahora ya no se hagan a quienes presentan síntomas leves. Según lo observado en China, el pico de nuevas muertes tiene lugar unos 12-13 días después del pico de nuevos casos, y sería deseable no tener que esperar tanto.

Se puede hacer un ajuste de la función de Gompertz al número de casos de coronavirus en España, pero está sujeto a un error muy grande, porque hay un gran número de combinaciones de K y c que en estos momentos pueden dar un ajuste razonablemente bueno. Sin embargo sirve para hacernos una idea de las cifras que podemos manejar.

Por ejemplo, utilizando los datos de casos detectados en España hasta ayer 15 de marzo, podemos estimar K en 200.000 casos y c en 0,06 lo que produce un ajuste razonablemente bueno. Bajo este supuesto los casos seguirían aumentando hasta llegar a los 200.000, con una cifra de muertos de en torno a 4.000-5.000. El número de casos nuevos alcanzaría su máximo el 4 de abril, y el número de nuevos muertos en torno al 16-17 de abril. Para finales de junio habría menos de 100 nuevos casos diarios. Podemos estimar que en torno a 1-4 millones de personas habrían pasado la enfermedad, por lo que más del 90% seguiría siendo susceptible. Llegados a este punto supongo que el gobierno relajaría las medidas y pasaría a hacer un control mucho más agresivo sobre los focos y nuevos casos, porque es lo que yo haría.

Fig.4. Posible ajuste de los casos de coronavirus en España a una entre muchas funciones de Gompertz, que en este caso presupone una incidencia máxima K de 200.000 casos y una constante de crecimiento c de 0,06. Es altamente improbable que valores estimados tan pronto en la epidemia sean correctos, pero sirven para hacerse una idea de la progresión de la epidemia. Estos supuestos son los mismos que los de la figura 2.

Este escenario no constituye una predicción, ni tan siquiera una proyección. Los datos son insuficientes para tener la más mínima fiabilidad, pero cuando se aproxime el pico de nuevos casos, y sobre todo cuando lo confirme el pico de nuevas muertes tendremos una idea razonable de la evolución del coronavirus en España. Este artículo no trata de predecir el futuro, sino de mostrar como funciona una epidemia, algo que los responsables de nuestra seguridad no parecen haber entendido con la necesaria prontitud, y trata de dar una idea de los tiempos que se manejan. Por ello cuando el gobierno ha dicho hoy que será necesario prolongar el estado de alarma más allá de los 15 días establecidos por la ley es porque ya sabe que incluso aunque todo vaya bien y el pico de nuevos casos tuviera lugar a principios de abril, esto tiene cuerda al menos hasta junio.

41
¿Te ha gustado el artículo?

Si quieres saber más y estar al día de mis reflexiones, suscríbete a mi blog y sé el primero en recibir las nuevas publicaciones en tu correo electrónico.

  1. #40
    09/04/20 11:06
    He aplicado varias veces la formula de Ud. sobre los datos de España e Italia desde hace unos días. Le estoy haciendo seguimiento y veo que la realidad siempre va bastante por debajo de la estimación (gracias a Dios). ¿Cree que estoy haciendo algún cálculo incorrecto? Puede ver los detalles de la fórmula y los parámetros aplicados en:  https://www.mrmiguelrodriguez.com/deaths-gompertz-distribution-spain-vs-italy/ 
    Muchas gracias anticipadas.
  2. en respuesta a Knownuthing
    -
    #38
    03/04/20 21:18

    Hola nuevamente:
    Te estaré muy agradecida si eres tan amable de enviármelo.

  3. en respuesta a Coco Valero
    -
    Top 100
    #37
    03/04/20 20:02

    Hola Coco Valero,
    No sé por qué no te funciona la función de excel. Quizá se deba al uso de diferentes versiones donde haya diferencias en las funciones. Si quieres que te mande mi archivo excel responde al correo que te mando y te lo paso.
    Un saludo.

  4. #36
    29/03/20 19:24

    Hola desde México:
    Muchas gracias por tu publicación.
    Soy profesora de matemáticas en un bachillerato del norte del país y, ante la avalancha de información que nos agobia, me parece que es necesario ayudar a mis chicos a que entiendan mejor la situación si tienen una visión más crítica de todo lo que leen y escuchan. Por ello me interesa mucho el Modelo de Gompertz al que haces referencia. Más que el propio modelo, me interesa la gráfica porque, como comprenderás, para chicos de bachillerato este tipo de expresiones es muy complicada pero, un análisis cualitativo del gráfico me parece que sí es factible.
    En particular quiero que, a partir del contexto que estamos viviendo comprendan el concepto de PUNTO DE INFLEXIÓN que en este caso es tan deseado pues nos mostraría cuándo la velocidad de crecimiento de la curva comience a disminuir.
    El detalle es que ingresé la expresión que compartes en Excel y el gráfico es primero una recta prácticamente horizontal y posteriormente un gráfico lineal creciente.
    ¿Me podrías orientar a este respecto?
    De antemano muchas gracias y mis mejores deseos porque la situación que les está tocando vivir en España pronto mejore.
    También acá en México confiamos en que los números pronto comiencen a mejorar.

  5. en respuesta a Pelayoderrotoalkamao
    -
    Top 100
    #35
    21/03/20 16:13

    Gompertz es la forma más simple de ajustar un crecimiento sigmoide no simétrico que fue desarrollado en 1825. Cumple su función y es muy pedagógico para entender como crece una epidemia.

    Modelos más modernos como ese de Susceptibles/Infectados/Recuperados (SIR) son mejores para describir lo que sucede específicamente en una población humana con una enfermedad infecciosa.

    Pero mi recomendación si quieres jugar con esto es el modelo en Excel desarrollado por el CDC de EEUU para estudiar la próxima pandemia de Influenza y que vale perfectamente para el coronavirus, que se disemina de forma muy similar y tiene un efecto similar en los pacientes:
    FluSurge 2.0
    https://www.cdc.gov/flu/pandemic-resources/tools/flusurge.htm
    Viene con manual.
    Está diseñado para prever la carga sobre los hospitales en las distintas partes del mundo.

  6. #34
    21/03/20 13:41

    @Knownuthing ,

    Que opinas de los modelos de http://covid19.webs.upv.es/ ?
    Es mejor un SIRs que un Gompertz?

    = = = = = = = = = = = = = ==

    La verdad es que el SIRs parece tener una base muy sencillita, planteando las ecuaciones, derivandolas y ajustando parametros, y luego aplicando montecarlos para resolver ecuaciones implicitas o no lineales...
    La verdad es que la wikipedia tiene explicaciones bastante asequibles para quien se maneje con ecuaciones tanto para gompertz como para SIRs y otras
    (eso sí, solo lo encontré en inglés)
    https://en.wikipedia.org/wiki/Gompertz_function
    https://en.wikipedia.org/wiki/Compartmental_models_in_epidemiology

    Lo que es cierto es que con tanto material estadistico e información previa, y el tiempo que nos regalaron los chinos con su contencion fuerte y rápida, cada vez logro entender menos como nos han llevado por donde nos han llevado.

    Como ya hablamos en otro sitio, no se si se podrán pedir responsabilidades penales personales, pero sobre su corazón pesarán los muertos innecesarios por sus (no) decisiones, falta de coraje o lo que haya sido. Y no me extrañaria que al final salieran politicamente reforzados por ser nuestros salvadores, pero manda h*evos! Llevo viendolo mucho tiempo, empecé a seguir a Italia hace (solo!) un mes. Que inconsciencia.
    Y los médicos chinos de Wuchan que han ido a Italia a apoyar no se pueden creer que los italianos todavia no aborden el tema en serio...

    https://www.lavanguardia.com/internacional/20200321/474280896980/coronavirus-italia-expertos-chinos-medidas-confinamiento.html

  7. en respuesta a Naticris
    -
    #33
    21/03/20 13:40

    Curiosa generalizacion Naticris, yo creo que depende de la subespecie dentro del homus hispanicus que se considere; está la subespecie dominante en número, hispanicus vulgaris, que suda cuando se esfuerza y lo hace a menudo, el tercer estado que decían los sans coulottes, y luego está la subespecie hispanicus politicus que solo suda al tomar el sol porque la palabra esfuerzo no figura en su diccionario.

  8. en respuesta a Camilort
    -
    #32
    21/03/20 12:18

    Puede ser en otro pais aqui en España no necesariamente,se ponen a sudar tomando el sol y se creen que se estan esforzando.

  9. en respuesta a Camilort
    -
    Top 100
    #31
    19/03/20 11:26

    Sí, sin embargo asumen que las camas de UCI estaban ocupadas al 0% antes del COVID19, lo cual es una suposición poco realista. Mi suposición es que estarían ocupadas a un 80%.

    Por otra parte su mapa de riesgo, ya dejan claro que presenta el porcentaje de infectados por municipalidad que da su modelo. Para el municipio de Madrid es hoy del 0.16358%. Con una población de 3.223.334 habitantes eso da 5.272 casos. En la comunidad de Madrid hay hoy 5.637 casos para 6.661.949 de habitantes. El modelo por tanto indica que hay el doble de casos de los detectados lo cual es una infravaloración brutal.

    En Madrid hay como mínimo 50.000 personas infectadas, y probablemente sean el doble o más. Mi hermana conoce más de una docena de casos entre sus conocidos. Solo están testando a los que presentan síntomas serios, y sabemos por Corea del Sur que estos pueden representar un 10% del total.

  10. en respuesta a Camilort
    -
    #30
    19/03/20 09:52

    En relación a la evolución de casos críticos y la disponibilidad de UCIs este modelo hecho por científicos de Cataluña y Aragón resulta interesante: https://deim.urv.cat/~alephsys/COVID-19/spain/es/index.html#curvasUCI

  11. Top 100
    #29
    18/03/20 15:58

    Este artículo es importante.
    Substantial undocumented infection facilitates the rapid dissemination of novel coronavirus (SARS-CoV2)
    " El 86 por ciento de todas las infecciones estaban sin documentar antes de la prohibición de desplazamientos en Wuhan el 23 de enero
    Por persona, estas infecciones sin documentar eran la mitad de contagiosas (52 por ciento) que las infecciones documentadas, pero fueron la fuente de dos tercios de las infecciones documentadas.
    Los esfuerzos de control del gobierno y la conciencia de la población han reducido la tasa de propagación del virus en China; después de que se impusieron restricciones de desplazamiento y medidas de control, se extendió menos rápidamente."

    Lo que traducido al román paladín quiere decir que la gente que no presenta síntomas o presenta síntomas leves son la mayoría de los infectados, y aunque son la mitad de infecciosos son responsables de más de dos tercios de los contagios.

    O se controla a esa gente o es imposible controlar la epidemia, y en España ni siquiera se les está testando. La alternativa es controlar a todo el mundo, y eso tampoco se está haciendo.

  12. en respuesta a Karlo 1
    -
    Top 100
    #28
    18/03/20 15:35

    Lo sé Karlo, es muy triste la cantidad de gente que se va a morir que podía haber vivido unos cuantos años más con una calidad de vida bastante razonable. La única estrategia viable en este momento para la población mayor es tratar de no contagiarse, y para ello la ayuda de la familia y la gente joven es fundamental. Hay que tener muy presente que la principal vía de contagio parecen ser los miembros asintomáticos de la familia. Es fundamental mantener las precauciones incluso más con la familia.

    Según un estudio reciente, hasta el 79% de los contagios podrían ser debidos a los asintomáticos.

    Pone los pelos de punta lo que está haciendo el coronavirus en las residencias de mayores donde ha entrado.

    Se hace todo lo posible y después se cruzan los dedos. Y si se contagian no hay que desesperar, hay gente de 90 años que la ha superado.

  13. en respuesta a Knownuthing
    -
    #27
    18/03/20 14:12

    Tal como estan subiendo los casos y muertos me temo que la previsión de 3000 a 4000 muertos puede quedar corta en España en el corto plazo, lo cual me aterra porque tengo familiares directos con más de 80 años y que temo mucho por ellos. Digo esto porque aqui en Cataluña me empiezan a llegar notícias directas de saturación en los principales hospitales y de falta de material de protección.

  14. en respuesta a Camilort
    -
    Top 100
    #26
    18/03/20 12:24

    Estas enfermedades víricas son zoonosis. El virus se mantiene en su animal hospedador natural al cual está adaptado y no hace tanto daño y en el que es común. En ocasiones salta la barrera de especies y crea una epidemia en humanos. Si la epidemia es controlada, como en el ébola o SARS el virus desaparece de los humanos aunque sigue exixtiendo en su huesped natural.

    Lo que diferencia al COVID19 es que ha aparecido en forma altamente contagiosa entre humanos, cosa que ni el SARS, ni el ébola, ni el H5N1 tenían. El SARS era mucho menos contagioso y normalmente tras presentar síntomas, el ébola solo se transmite por fluídos, no por el aire, y el H5N1 practicamente no se transmitía entre humanos, aunque era letal de narices.

    El COVID19 ya no se puede contener, y está tan adaptado a nosotros que es muy probable que se quede como enfermedad humana corriente en el futuro previsible.

    El virus se seguirá extendiendo, muy deprisa en países que no toman ninguna medida de contención y más despacio en los países que las toman, donde incluso puede contraerse. Unicamente deja de estar en zonas donde se ha prevenido su llegada o zonas donde se erradica. Pero es una situación temporal.

    Erradicarlo a nivel mundial, como se hace con el ébola, es casi imposible a estas alturas. Habrá que ver qué arsenal consigue la medicina moderna contra él. De momento la carrera de la vacuna está disparada. Hay en juego miles de millones.

  15. en respuesta a Knownuthing
    -
    #25
    18/03/20 12:06

    Yo, que evidentemente lucho contra mis sesgos, conozco bien lo que se ha esparcido mayoritariamentesobre la crisis del 29. Pero si rascas y escarbas encuentras otras hipótesis que se ajustan más a los datos reales de los hechos que sucedieron.
    No he visto ni leído "Las uvas de la ira", pero a buen seguro que con la reclusión forzosa encontraré un rato para verla.
    Gracias por la recomendación, a fuer de lo que escribes seguro será interesante, y gracias por mantener este interesante blog que permite intercambiar tan libremente opiniones.

  16. en respuesta a Guerdol
    -
    Top 100
    #24
    18/03/20 11:55

    Tiendo a coincidir contigo Guerdol, aunque no he estudiado la Gran Depresión y mi opinión sobre ella no tiene mucho valor. En Europa fue peor de lo que debiera haber sido por las draconianas compensaciones que se le impusieron a Alemania tras la Primera Guerra Mundial, y en EEUU que debiera haber sido más liviana que en Europa fue peor porque se tomaron todas las medidas equivocadas. Recomiendo la película "Las uvas de la ira" para entender el daño que se hicieron a sí mismos en lo social. A Steinbeck le dieron el Nobel de literatura por el libro.

  17. en respuesta a Knownuthing
    -
    #23
    18/03/20 11:36

    Know, ya sé que has comentado que tus cálculos no son un pronóstico ni siquiera una proyección pero siguiendo el hilo con Pelayo, sabes si hay algún indicio de por qué estas cepas tan agresivas como SARS o Ebola de pronto dejan de ser una emergencia, aunque entiendo que siguen existiendo. Las medidas de contención en China han funcionado pero aún así. parece que hay algo más que "desactiva" el virus. No sé, me pierdo un poco. Si no, en buena lógica, el virus seguiría extendiéndose a una velocidad dependiente de las medidas de contención hasta alcanzar ese 70% del total de población en tanto en cuanto no haya una vacuna o un tratamiento.

  18. en respuesta a Knownuthing
    -
    #22
    17/03/20 19:17

    Sí, ya te he ido siguiendo.
    Si deviene en Gran Depresión, el escenario que puede provocar este gobierno suena a algo parecido a lo sucedido durante la Gran Depresión del 1929, dónde la crisis económica se debió principalmente a los bajos tipos de interés y a la expansión artificial del crédito o la inflación de la oferta monetaria, y en la que, pese a lo que sostenga el mainstream yo creo, fue precisamente el "New Deal" de Roosevelt el que provocó su persistencia en el tiempo, entre otras muchas medidas de expansión monetaria, la presión a las grandes empresas para que mantuviesen los salarios, por contra de la brevedad de anteriores crisis, cuya resolución y reajuste sin intervenciones fue muy rápida.

  19. en respuesta a Guerdol
    -
    Top 100
    #21
    17/03/20 18:42

    Si has seguido el blog habrás visto que yo ya estaba muy preocupado por el estado de la economía, el problema del petróleo y el problema de la deuda, antes del coronavirus. Con el coronavirus llega el decrecimiento, que podría inaugurarse con una triple crisis, económica, monetaria y de deuda, seguido de una Gran Gran Depresión. Creo que vienen unos años malos y después nos recuperaremos, pero solo en parte. Esto es un acontecimiento definitorio en la historia, y lo jodido es que era evitable. Se suponía que estabamos preparados para algo así, pero ha fallado todo.