sábado, 4 de abril de 2020

Historias para no dormir: una de estadísticas laborales



Las estadísticas son un arma política. Un arma arrojadiza. Se publica la Encuesta de Población Activa (EPA), y el Gobierno selecciona el resultado y la interpretación que le interesa, y se la arroja a la oposición. La oposición selecciona el resultado y la interpretación que le interesa y se la arroja al Gobierno. Para el Gobierno, los datos siempre son buenos o hay algo que recuperar. Para la oposición los datos siempre son malos, o hay algo especialmente malo en lo que meter el dedo. 

Unos y otros, enfermos de epatitis, sin h: sólo se acercan al empleo desde la óptica de la EPA, obviando cualquier otro instrumento de conocimiento del mercado de trabajo.

Gobierno y oposición, intercambian los papeles cuando alternan en el gobierno, como es lógico. Gobierno y oposición, hacen un teatrillo, como lo hacían Sagasta y Cánovas en tiempos de la Restauración. Recomendable la lectura de un libro de Paul Preston, Un pueblo traicionado, publicado por Debate, para saber cómo funcionaba el turno, el potencial corruptor de este sistema y las consecuencias que tuvo (y tiene) para el pueblo español.

Digo que hacen un teatrillo, porque hasta ahora que tenemos un gobierno de coalición, algo inédito y de que nos sabemos cómo evolucionará, Gobierno y oposición compartían dos axiomas económicos:

  • Frente al dilema de optar por controlar la inflación o generar empleo, siempre han optado por el control de la inflación. Optar, bueno, la Unión Europea nos quitó del todo esa opción. En 1958 un economista llamado W. Phillips publicó un trabajo que vinculaba el desempleo con la inflación, de manera que, simplificando, en contextos de bajo desempleo crecía el desempleo y viceversa. En 1969 dos pesos pesados del pensamiento económico Solow y Samuelson hicieron suyo el razonamiento, asentándose esta creencia. Aunque trabajos posteriores han cuestionado seriamente el trabajo de Phillips, y la curva que representa la relación entre empleo e inflación, las políticas macroeconómicas han tenido como objetivo el control inflacionario y no el pleno empleo. Deberes: ¿a quién beneficia esta opción?
  • Las grandes cifras de desempleo provocadas por la crisis del petróleo de 1973, hicieron que las políticas públicas de empleo tuvieran como objetivo la reducción del número de desempleados y no el mantenimiento de la calidad del empleo. Se podría haber optado por empleos de calidad y políticas sociales públicas, o por reducir la jornada laboral y repartir el trabajo. Pero no, se optó por generar empleo, fuera como fuera. Aunque hubiera que "falsear" la metodología de conteo de los desempleados. Deberes: ¿quién es un parado para la EPA?
.
Dicho esto, creo que ha quedado claro mi poca confianza en las políticas públicas de empleo y en la  metodología de medición del desempleo. Recomiendo encarecidamente un libro de un profesor de sociología de la UNED, Juan Ignacio Martínez Pastor, titulado Los datos sin tapujos. Cómo interpretar y difundir las estadísticas sociales. 

Una de las cosas que Martínez Pastor recomienda a la hora de leer estadísticas sociales es contextualizarlas, comparar con países de nuestro entorno y ver la evolución en el tiempo.

Ahora viene el susto, contextualizado históricamente. En el siguiente gráfico se refleja la evolución del desempleo, a largo plazo, en los Estados Unidos:



Los picos de desempleo, de los 80 y 90 del siglo XX y el pico causado por la crisis de 2008, palidecen al lado del puntito rojo: es el nivel de desempleo en Estados Unidos, ahora mismo y claramente vinculado al COVID-19. 

La cuestión es saber cómo será la bajada y quién pagará las consecuencias. 

P.S. En Twitter se puede ver este gráfico en versión gif animado: https://bit.ly/39IRygu 















La importancia de los datos... verídicos


Según dice Enric Juliana, periodista de La Vanguardia, nada sospechoso de izquierdismo, el comité asesor del Gobierno es serio. En otro artículo del mismo diario (https://bit.ly/3bR4e6p) encontramos un bosquejo de sus cv. Sí, va a resultar que un profesor de la Universidad de Harvard o investigadores del Instituto de Salud Carlos III son la gente adecuada para asesorar al Gobierno. Luego el Gobierno, basándose en las aportaciones de este Comité, toma decisiones.

El Comité necesita datos fiables. Veamos el porqué de esta necesidad. En primer lugar, hay que construir un modelo matemático que relacione las variables relevantes en esta situación: número de enfermos, número de recuperados, número de fallecidos... A modo de ejemplo, recojo el modelo elaborado por el Grupo de Investigación Modelling Uncertainty Quantification del Instituto Universitario  de Matemática Multidisciplinar de la Universidad Politécnica de València:



El lector corriente se preguntará que pone ahí. Voy a intentar explicarlo de manera sencilla, y sin entrar a todas y cada una de las ecuaciones.

S(t) es el número de personas sanas  pero susceptibles de contraer la enfermedad en un día t. Así, S(t+1) es el número de personas que pueden caer enfermas al día siguiente. Aclarar que las personas sanas se pueden dividir en las susceptibles (no han cogido la enfermedad), las que están en cuarentena Q(t) y las personas que se han recuperado R(t)  y R(t+1) en las ecuaciones. 

El número de personas que mañana podrían coger la enfermedad, S(t+1), dependerá del número de personas susceptibles hoy S(t), de los suceptibles que están en contacto con personas contagiosas y que tienen una probabilidad de infectarse por ello, menos el número de personas susceptibles que no hacen cuarentena Q(t) y que tienen una probabidad de contagiarse y más el número de personas que respetan la cuarentena. Es decir, si todo el mundo respetase la cuarentena, el número de personas sanas crecería día a día, conforme los enfermos se recuperasen (R(t) o fallecieran F(t)), dado que no habría nuevos contagios. Por eso es tan importante la cuarentena y las medidas de precaución, como lavarse las manos. 

Por que si la gente deja de estar en cuarentena o no adopta medidas de precaución, se infectan y durante unos días no muestran síntomas, es decir, la enfermedad está latente: L(t). Y del estado de latencia pasarán al de infección I(t). No todos los infectados corren el mismo riesgo, por eso hablamos de poblaciones de riesgo, pero un número de ellos necesitarán ingreso hospitalario H(t) y, por desgracia, un número de ellos precisará cuidados en la UCI, U(t). Afortunadamente, de estos dos estados, H(t) y U(t), se puede salir bien pasando a planta desde la UCI, y esas personas se reflejan en el modelo. Pero también, se puede pasar a F(t), el fallecimiento. 

Por eso es tan importante el confinamiento, para que la mayor parte de la población se mantenga en un el estado Q(t) y no pase al estado S(t), susceptible, es decir, que se puede contagiar. Porque el número de fallecidos F(t) se nutre de los susceptibles. 

Claro está que los matemáticos no resuelven estos sistemas de ecuaciones a mano, entre otras cosas, porque son cálculos largos y, en ocasiones, no existe la manera de resolverlos de manera exacta, si no que hay que recurrir a métodos numéricos con el apoyo del ordenador. Se usan para ello programas informáticos que generan simulaciones, como el programa Vensim. Lo que se hace es introducir unas "cajas" con los diferentes estados por los que puede pasar una persona (susceptible, latente, infectado...) y unas líneas que conectan unos estados con otros, si se puede pasar de un estado a otro directamente. Por ejemplo, se puede pasar de susceptible a latente directamente, pero no de suceptible a fallecimiento, sin pasar previamente por latente e infectado.


También hay que introducir esas letras, algunas de ellas griegas, que acompañan a los estados en las ecuaciones y en diagrama: δ, β, ϒ... que, entre otras cosa, pueden recoger probabilidades y tasas: de infectarse, de recuperarse, el promedio de días que tarda la enfermedad en manifestar síntomas...

El valor de estos coeficientes, de estas letras griegas, no se lo sacan los investigadores de la chistera. Estos valores los obtienen de trabajo diario de los médicos. Si se afirma que la enfermedad tarda entre cinco y quince días en manifestarse no es porque el doctor Simón haya tenido una revelación, sino porque se han recogido datos en los centros de salud y en los hospitales. 

Una vez introducido todo en el programa (estados por los que puede pasar una persona, relaciones entre estados y los coeficientes, se puede llevar a cabo una simulación. La simulación nos dará unos resultados: número de personas susceptibles, número de personas en estado latente, número de personas infectadas... Previsiones, no un número exacto.

Por ejemplo, el MUNQU proporciona el siguiente resultado para el número de infectados. Según ellos, hemos pasado el pico de la epidemia.



A partir de estos resultados, el Gobierno puede tomar decisiones de manera racional: alargar o no el confinamiento, parar el sistema productivo no esencial. 

Pero claro, todo se basa en la información estadística, en los datos recabados por las autoridades sanitarias. Y en nuestro país, sorpresa, el sistema sanitario está descentralizado, depende de las Comunidades Autónomas, que pueden decidir, por ejemplo, que los ancianos muertos en las residencias de mayores no contabilicen como fallecidos por culpa del COVID-19, o que no se contabilicen a las personas fallecidas en su domicilio si no se le ha hecho un test.

A nivel internacional, cada país contabiliza a su manera, de manera que en España ya hay más fallecidos que en China, o en Alemania no se muere casi nadie: https://bit.ly/2JFZiFA

Pero ocultar información sólo servirá para dificultar el trabajo de los investigadores, que son al final quienes nos salvarán de ésta y de las futuras epidemias.

Una nota de humildad matemática. Lo que construyen los matemáticos son modelos, es decir, una versión simplificada de la realidad. No tiene la misma probabilidad de infectarse una persona sana que una inmunodeprimida, ni de fallecer una persona sana y un asmático. Por lo que hay que mejorar constantemente los modelos. Además, hay factores que se pueden escapar a la hora de diseñar el modelo (¿influirá la contaminación ambiental?) y factores sociales a incorporar (disponibilidad de acceso agua potable, sistema sanitario universal, desigualdades de renta...).

Agradecimientos.

A mi amigo Jesús, que ha perdido a una referencia importante en su vida por culpa del coronavirus, y que fue el me envío el enlace al estudio de la UPV. Gracias por tu amistad, y por hacerme recordar lo importante que somos los matemáticos para mejorar la vida de las personas. 

A los matemáticos del MUNQU, por su rigor y por su esfuerzo por crear un modelo matemático que funcione. Durante unos días no dieron predicciones porque el primer modelo que crearon dejó de funcionar. Tuvieron la honestidad intelectual de decirlo y el coraje de seguir trabajando para generar un nuevo modelo. Para beber de la fuente original: https://covid19.webs.upv.es/index.html

Al doctor Fernando Simón, por no dormir y por demostrar que para desempeñar un cargo de relevancia no es necesario comprarse un traje, sino haber estudiado y saber de qué se habla. Sus jerseys, preciosos. Espero que se recupere pronto.