Asteriscos, incoherencias y opacidad: 15 problemas de Sanidad con la gesti¨®n de datos del coronavirus
La forma de difundir la informaci¨®n oficial dificulta seguir la pandemia
Este lunes el Ministerio de Sanidad cambi¨® los datos que ofrece sobre el coronavirus y ha provocado un desbarajuste en mal momento. Pero no es la primera vez. Al comienzo los problemas eran comprensibles porque la epidemia fue un golpe por sorpresa. Pero han pasado tres meses y la gesti¨®n de informaci¨®n sigue siendo deficiente. Este ¨²ltimo l¨ªo llega, adem¨¢s, en un momento sensible: la desescalada exige n¨²meros precisos y transparentes para seguir los posibles rebrotes. ?Pero c¨®mo hacer eso con datos borrosos? A continuaci¨®n recopilamos los principales problemas de la gesti¨®n de los datos por parte del ministerio.
1. Las cifras del d¨ªa son una foto incompleta. El centro de su comunicaci¨®n es una foto fija diaria en formato PDF, un documento de texto con los datos de infectados, hospitalizados o fallecidos. Pero seguir el ritmo del virus exige series temporales, para ver su evoluci¨®n, que no pueden reconstruirse a partir de las cifras est¨¢ticas del d¨ªa (el PDF) que se comentan en las ruedas de prensa. Al menos por dos motivos: porque las cifras de d¨ªas anteriores cambian continuamente (el dato de hoy mi¨¦rcoles se cambiar¨¢ quiz¨¢s ma?ana y nunca lo sabremos mirando solo los PDF), y porque la informaci¨®n recogida en esos PDF ha ido cambiando.
2. El ministerio no mantiene la serie en una semana clave. El ¨²nico lugar donde se ofrecen evoluciones de datos v¨¢lidas para el an¨¢lisis, descargables y en un formato reusable (un archivo CSV), es el Panel de Situaci¨®n que mantiene el Centro Nacional de Epidemiolog¨ªa y que enlaza el ministerio. Pero esta web es limitada. Solo ofrece la evoluci¨®n de algunos indicadores ¡ªcomo el total de infectados, fallecidos y hospitalizados¡ª y no siempre se actualiza. La semana pasada lo hizo intermitentemente y desde el d¨ªa 20 de mayo no lo ha hecho en absoluto. Desde entonces se han dejado de publicar, por ejemplo, los datos en bruto de cada indicador y las cifras del ritmo de contagios, que son fundamentales para detectar posibles rebrotes.
3. Malabarismos con las fechas. Una fuente de confusiones ha sido el concepto de ¡°nuevos casos¡±. Al principio el ministerio reflejaba en su informe diario el n¨²mero de casos ¡°notificados¡± por cada comunidad en un d¨ªa determinado, es decir, cu¨¢ntos casos le hab¨ªan comunicado ese d¨ªa con independencia de la fecha de s¨ªntomas o diagn¨®stico. Pero luego se hicieron excepciones. Cuando algunas comunidades empezaron a notificar casos antiguos dejaron de incluirse como nuevos. Un ejemplo son los datos de la Comunidad de Madrid entre el 10 y el 16 de mayo. La suma de los ¡°nuevos casos¡±del PDF diario es 335. Sin embargo, consultando la ¨²ltima serie actualizada, del archivo CSV, en esa semana constan 970 m¨¢s que en la anterior. Algo parecido ocurri¨® con los datos de Catalu?a: el 10 de mayo, ya en plena desescalada, el PDF informaba de 83 ¡°nuevos casos¡±, con una nota que indicaba otros 2.700 positivos sin fecha, pero notificados ese d¨ªa. La soluci¨®n en general ser¨ªa reportar ambos datos ¡ªnuevos casos por fecha de notificaci¨®n y de diagn¨®stico¡ª, pero sin mezclarlos en una serie h¨ªbrida de dif¨ªcil interpretaci¨®n.
4. Otros 600 fallecidos confirmados, ?pero cu¨¢ndo? El mismo problema se ha producido con cifras de muertes. El d¨ªa 22 de mayo Catalu?a notific¨® 600 muertos nuevos, pero en el PDF se dec¨ªa con un asterisco que no eran realmente nuevos, porque hab¨ªan fallecido un tiempo atr¨¢s sin determinar. La realidad es que s¨ª eran muertes reci¨¦n notificadas.
5. Los curados en cambio s¨ª se consideran nuevos. El criterio de ¡°nuevo¡± no ha sido consistente: al hablar de curados, el ministerio ha dado por buena la fecha de notificaci¨®n. Por ejemplo, el d¨ªa 29 de abril, Galicia incluy¨® unos 3.500 recuperados nuevos de golpe, que tampoco eran todos del d¨ªa anterior, como es obvio, pero que el PDF en ese caso s¨ª inclu¨ªa en la columna de nuevos.
6. Cambios incesantes en la comunicaci¨®n en las notas diarias. Cambian los textos, las explicaciones, las definiciones. Hay tablas que se incorporaron que luego desaparecieron. El 18 de abril se a?adi¨® una tabla con el total de positivos ¡ªpara incluir los detectados con pruebas de anticuerpos¡ª, que siete d¨ªas despu¨¦s ya no estaba. Las estad¨ªsticas de curados se reportaron durante semanas, para luego desaparecer el 5 de mayo. La serie, que nunca pareci¨® fiable, ya no existe tampoco en el CSV. Estos cambios a?aden opacidad a la comunicaci¨®n de los datos, dificultan su interpretaci¨®n y hacen m¨¢s complejos los an¨¢lisis.
7. Sin aclarar qu¨¦ es un caso confirmado. Al comienzo eran los positivos por PCR. Luego se empezaron a hacer test de anticuerpos y los positivos pasaron a ser la suma de los dos. Despu¨¦s se mantuvieron ambos datos, pero se separaron: eran los dos positivos pero solo las PCR ¡ªque permiten vincularse a una fecha de s¨ªntomas¡ª se llamaban casos confirmados. Durante un par de d¨ªas, la nota del ministerio incluy¨® los positivos por anticuerpos incluyendo a los asintom¨¢ticos, que luego desaparecieron. Desde hace unos d¨ªas los anticuerpos ya no se hacen apenas y no vienen en el informe, aunque siguen apareciendo en algunas gr¨¢ficos. Lo complejo que es seguir la l¨®gica del p¨¢rrafo que acaba de leer da buena cuenta del baile de estos datos.
8. Los asteriscos. Otra pr¨¢ctica habitual ha sido modificar el sentido de los datos de algunas columnas y notificarlo con notas al pie: el PDF del domingo ten¨ªa seis asteriscos, el CSV tiene nueve y el nuevo informe tiene cuatro. Los periodistas de Datadista han contabilizado 40 notas con matices y aclaraciones a los datos del ministerio. Eso puede hacerse en un PDF, que es una foto fija, pero esas excepciones son muy dif¨ªciles de integrar en una serie: ?El dato de un d¨ªa se debe interpretar diferente al anterior?
9. Incoherencia en los datos. Durante semanas los datos sobre hospitalizados y UCI representaron cosas diferentes en una misma columna. El informe diario del ministerio reportaba el n¨²mero de personas ingresadas en ese momento para Madrid, Catalu?a, Castilla La Mancha y Galicia, mientras que para el resto daba el n¨²mero total de personas ingresadas hasta esa fecha. La confusi¨®n dur¨® un mes, hasta que el 2 de abril apareci¨® un nuevo asterisco que se?alaba el desajuste. Pero la inconsistencia se mantuvo hasta finales de ese mes. La fuente del problema est¨¢ en la orden ministerial del 15 de marzo, que ped¨ªa a las comunidades esos datos (de hospitalizados y UCI) sin especificar si ten¨ªan que ser el acumulado o la foto fija del d¨ªa.
10. No se garantiza la continuidad. El cambio del sistema de informaci¨®n de esta semana ha roto las series ¡ªporque ya no tenemos los indicadores de la semana pasada, que dejaron de publicarse, pero los nuevos no han tenido todav¨ªa tiempo de avanzar¡ª. Pero eso es algo que podr¨ªa evitarse, simplemente manteniendo en paralelo ambos sistemas durante un tiempo de transici¨®n.
11. Gr¨¢ficos y datos que no se corresponden. Este problema ocurre en el Panel de Situaci¨®n y lo hemos detectado en Extremadura. Los datos del CSV descargables desde all¨ª dicen que el 18 de mayo se sumaron 90 casos nuevos¡ y sin embargo, en los gr¨¢ficos del panel solo parecen dos casos. ?Y los 88 restantes? Las cifras del gr¨¢fico y el CSV encajan los d¨ªas anteriores y siguientes, solo ese d¨ªa parece haberse sustra¨ªdo el pico. Quiz¨¢s eran positivos que se notificaron con retraso, pero es una pr¨¢ctica cuestionable representar unos datos en los gr¨¢ficos y publicar valores diferentes en su repositorio.
12. Falta de coordinaci¨®n. El ministerio exige informaci¨®n a las comunidades desde la orden ministerial del 15 de marzo. Algunos datos de los que se pidieron no sabemos si se han remitido desde entonces, porque nunca se han publicado: camas de agudos ocupadas por pacientes de covid-19, plazas de UCI, disponibilidad de material, etc¨¦tera. Entre los datos que s¨ª se han publicado, como el de muertes, hay varios ejemplos de descoordinaci¨®n entre el ministerio y las autonom¨ªas. Uno de los m¨¢s llamativos fue el conteo de muertes en Galicia. El 29 de abril, el ministerio report¨® siete nuevas muertes, a las que acompa?aba de una nota con otras 128 defunciones de fechas anteriores (el 23% de las muertes totales durante la crisis). Sin embargo, este salto no se observ¨® en las notas de prensa diarias que publicaba la Xunta de Galicia, cuya cifra de fallecidos hab¨ªa ido creciendo paulatinamente desde tres semanas antes.
13. Sin los datos (prometidos) de provincias. Al anunciar el plan para la desescalada el 28 de abril, Pedro S¨¢nchez asegur¨® que se hab¨ªa elaborado de acuerdo a criterios transparentes y que se apoyar¨ªa en una serie de indicadores que constituir¨ªan un panel integral que iba a ser p¨²blico. No solo se han usado indicadores elaborados con datos que solo maneja Sanidad, sino que el ministerio nunca ofrece informaci¨®n para provincias y ¨¢reas sanitarias, unidades clave en la desescalada. La informaci¨®n existente a este nivel la publica cada comunidad aut¨®noma sin un criterio unificado. El ¨²nico sitio donde puede consultarse estos datos de forma sistematizada y agregada es la p¨¢gina del proyecto colaborativo esCovid19Data, formado por 15 voluntarios que recogen a diario esta informaci¨®n.
14. Sin datos de test durante un mes. Espa?a pas¨® lo peor de la crisis sin informar del n¨²mero de test que se hac¨ªan. Las primeras cifras que se conocen fueron los ¡°entre 15.000 y 20.000 test diarios¡± que S¨¢nchez antes y Salvador Illa despu¨¦s difundieron, sin soporte documental, desde el 20 de marzo. Las primera cifra detallada lleg¨® el 13 de abril (930.000 pruebas), que desde entonces han sido semanales. Para el d¨ªa 27 de ese mes el ministerio presum¨ªa de ser el octavo pa¨ªs de la OCDE que m¨¢s test hac¨ªa. Sin embargo, el dato de Espa?a que agreg¨® la OCDE no era comparable con los datos del resto de pa¨ªses, porque al mill¨®n de pruebas PCR sumaba 300.000 test de anticuerpos, y la organizaci¨®n acab¨® por rectificar su listado.
15. Faltan datos para la desescalada. No tenemos cifras a nivel nacional sobre cuestiones importantes ahora. De los contagios que siguen produci¨¦ndose, por ejemplo, ignoramos cu¨¢ntos son en hogares, hospitales y centros residenciales. Pero quiz¨¢s la mayor inc¨®gnita sean los esfuerzos de rastreo de contactos: no sabemos con qu¨¦ intensidad se est¨¢ haciendo, con qu¨¦ personal y con qu¨¦ resultados. La orden ministerial del d¨ªa 11 de mayo ped¨ªa que las comunidades informasen de eso al ministerio, pero si los datos le est¨¢n llegando desde luego no son p¨²blicos.
Informaci¨®n sobre el coronavirus
- El riesgo de rebrote provincia a provincia
- Aqu¨ª puede seguir la ¨²ltima hora sobre la evoluci¨®n de la pandemia
- As¨ª evoluciona la curva del coronavirus en Espa?a y en cada autonom¨ªa
- Buscador: La desescalada por municipios
- Preguntas y respuestas sobre el coronavirus
- Gu¨ªa de actuaci¨®n ante la enfermedad
- Pinche aqu¨ª para suscribirse a la newsletter diaria sobre la pandemia
Tu suscripci¨®n se est¨¢ usando en otro dispositivo
?Quieres a?adir otro usuario a tu suscripci¨®n?
Si contin¨²as leyendo en este dispositivo, no se podr¨¢ leer en el otro.
FlechaTu suscripci¨®n se est¨¢ usando en otro dispositivo y solo puedes acceder a EL PA?S desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripci¨®n a la modalidad Premium, as¨ª podr¨¢s a?adir otro usuario. Cada uno acceder¨¢ con su propia cuenta de email, lo que os permitir¨¢ personalizar vuestra experiencia en EL PA?S.
?Tienes una suscripci¨®n de empresa? Accede aqu¨ª para contratar m¨¢s cuentas.
En el caso de no saber qui¨¦n est¨¢ usando tu cuenta, te recomendamos cambiar tu contrase?a aqu¨ª.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrar¨¢ en tu dispositivo y en el de la otra persona que est¨¢ usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aqu¨ª los t¨¦rminos y condiciones de la suscripci¨®n digital.