Skip to content

[R-es] Tasa variación diaria COVID-19

12 messages · palazon, eric, Carlos Ortega +5 more

#
Hola:

Tengo los datos diarios del número de casos de coronavirus por comunidades
autónomas y quiero calcular el número diario de nuevos casos y la tasa
diaria de variación del número de casos y no se como hacerlo en R.

*fecha*

*comunidad*

*poblacion*

*casos_totales*

04/03/2020

Andalucía

8414240

13

05/03/2020

Andalucía

8414240

12

06/03/2020

Andalucía

8414240

21

04/03/2020

Aragón

1319291

0

05/03/2020

Aragón

1319291

1

06/03/2020

Aragón

1319291

6

04/03/2020

Asturias

1022800

2

05/03/2020

Asturias

1022800

5

06/03/2020

Asturias

1022800

5

Gracias
#
Hola:

Usa la función diff

diff( seq( 0, 100, by = 10 ) )
[1] 10 10 10 10 10 10 10 10 10 10

Quizá te pueda interesar este enlace:
https://github.com/datadista/datasets/tree/master/COVID%2019

Incluye los script para manejar la información.

Seguimos



El 21/3/20 a las 18:42, Javier Gómez Gonzalez escribió:

  
    
#
Estimado Javier Gómez Gonzalez

Lo deseas realizar como ejercicio personal o lo necesitas para un trabajo
de salud pública, periodismo, información que necesitan rápido. Si hay
urgencia, desde este lado del océano mañana puedo dedicarles algo de tiempo
con sus datos, aquí la situación es tranquila, hasta donde se en mi ciudad
no hay casos, en la región hay dos confirmados, sospechas, pero ya estamos
todos en cuarentena en nuestras casas, y hoy nos asombrábamos junto con los
periodistas de la televisión cuándo mostraban de Francia, las medidas del
gobierno para permitir a sus ciudadanos son más leves en aquel país que en
Argentina. Lógicamente si es salud pública le dono mi tiempo y pocos
conocimientos.

Javier Rubén Marcuzzi

El sáb., 21 mar. 2020 a las 14:42, Javier Gómez Gonzalez (<
zaragatan en gmail.com>) escribió:

  
  
#
Hola Javier, yo lo hice de la siguiente forma:

library(data.table)
library(ggplot2)
library(anytime)

df <- fread("/home/neo/Desktop/rhelp/spain.csv")
df[, fec:=anytime(fec)]
setkey(df,com,fec)

     # newc: son los nuevos casos
df[, newc:=ct - shift(ct), by=.(com)]

     # tasa: es la tasa de cambio que calculé así (ct2 - ct1)/ct1

df[, tasa:=newc/ct, by=.(com)]


y obtuve lo siguiente:


                    fec       com     pob ct newc tasa
1: 2020-04-02 23:00:00 Andalucía 8414240 13 NA          NA
2: 2020-05-02 23:00:00 Andalucía 8414240 12   -1 -0.08333333
3: 2020-06-02 23:00:00 Andalucía 8414240 21    9 0.42857143
4: 2020-04-02 23:00:00    Aragón 1319291  0 NA          NA
5: 2020-05-02 23:00:00    Aragón 1319291  1    1 1.00000000
6: 2020-06-02 23:00:00    Aragón 1319291  6    5 0.83333333
7: 2020-04-02 23:00:00  Asturias 1022800  2 NA          NA
8: 2020-05-02 23:00:00  Asturias 1022800  5    3 0.60000000
9: 2020-06-02 23:00:00  Asturias 1022800  5    0 0.00000000

Espero que te sirva.

Saludos !!

Eric.
On 21-03-20 14:42, Javier Gómez Gonzalez wrote:

  
  
#
Eric

Gracias por compartir.

Javier Marcuzzi

El dom., 22 mar. 2020 a las 16:52, neo (<ericconchamunoz en gmail.com>)
escribió:

  
  
#
Eric

¿Que dataset utilizo? Por curiosidad probé su código, pero me salen
errores. Copio y pego todo como me sale en la consola.
https://raw.githubusercontent.com/datasets/covid-19/master/data/time-series-19-covid-combined.csv
read.csv("C:/Users/HP/Downloads/time-series-19-covid-combined.csv")
Error in `:=`(fec, anytime(fec)) :
  Check that is.data.table(DT) == TRUE. Otherwise, := and `:=`(...) are
defined for use in j, once only and in particular ways. See help(":=").
Error in setkeyv(x, cols, verbose = verbose, physical = physical) :
  x is not a data.table
Error in `[.data.frame`(df, , `:=`(newc, ct - shift(ct)), by = .(com)) :
  unused argument (by = .(com))
Error in `[.data.frame`(df, , `:=`(tasa, newc/ct), by = .(com)) :
  unused argument (by = .(com))

El dom., 22 mar. 2020 a las 16:52, neo (<ericconchamunoz en gmail.com>)
escribió:

  
  
#
Hola,

Te sale error porque has cargado el fichero con read.csv().
Si pruebas a cargarlo con "fread()" tus datos tendrán clase data.table.
El error que obtienes es porque el objeto df (igual que datos) no es un
data.table.

Saludos,
Carlos Ortega
www.qualityexcellence.es

El dom., 22 mar. 2020 a las 22:45, Javier Marcuzzi (<
javier.ruben.marcuzzi en gmail.com>) escribió:

  
    
#
Muchas gracias a todos por su ayuda.

Hace un rato antes de abrir el correo, he encontrado dos soluciones a mi
problema de como calcular el porcentaje de variación.
La primera es usando el paquete dplyr:
https://stackoverflow.com/questions/48196552/calculate-percentage-change-in-r-using-dplyr/48196871

La segunda usando la función PercChange del paquete DataCombine
https://rdrr.io/cran/DataCombine/man/PercChange.html


El dom., 22 mar. 2020 a las 23:51, Carlos Ortega (<cof en qualityexcellence.es>)
escribió:

  
  
1 day later
#
Hola a todos,

Aprovecho para comentaros que estuve preparando un repositorio en GitHub (
https://github.com/rubenfcasal/COVID-19) para facilitar el acceso a los
datos oficiales del COVID-19 por CCAA. Principalmente para los que pueden
estar interesados en analizarlos empleando R (web:
https://rubenfcasal.github.io/COVID-19), pero también puede ser de utilidad
simplemente para consultarlos (tablas:
https://rubenfcasal.github.io/COVID-19/COVID-19-tablas.html).

Gracias a vuestros mensajes pude descargarme un fichero pdf que me faltaba
y también me animé a ponerlo en github por si puede resultar de interés...

Un saludo, Rubén.

El lun., 23 mar. 2020 a las 3:13, Javier Gómez Gonzalez (<
zaragatan en gmail.com>) escribió:

  
    
#
Gracias Ruben, muy interesante. Algo así estuve buscando, por ciudades y a
nivel internacional, pero no lo encontré. Me bastaría con el número de
fallecimientos por día, de cuantas más ciudades del mundo mejor. Si alguno
supiera de algo así, le agradecería que me lo comunicase.
Un saludo,
Manuel

El mar., 24 mar. 2020 a las 21:04, Rubén Fernández Casal (<
rubenfcasal en gmail.com>) escribió:

  
  
#
Hola,
Aqui tenéis un dataset completo que actualizan todos los días con datos de
provincias de todo el mundo. hay además varios proyectos que se llevan en
marcha para explotar los datos.
https://www.kaggle.com/imdevskp/corona-virus-report

y aqui muchos más datos sobre todo de España y muchas aplicaciones hechas
ya sobre esos datos.
https://github.com/datadista/datasets/tree/master/COVID%2019


El mié., 25 mar. 2020 a las 9:55, Manuel Mendoza (<
mmendoza en fulbrightmail.org>) escribió:

  
  
#
Estimados

Otra fuente es https://github.com/CSSEGISandData/COVID-19 , en github hay
varios escritos con datos, códigos, reportes, para ser sincero, mire cuatro
o cinco, todos semejantes, contar muertos, vivos, algunos predicen, pero
estoy cansado de científicos que analizando datos decían por donde iría el
virus, y el virus no les hace caso, por suerte la televisión en Argentina
ya no los pasa más. Lo que sí ve como interesante en github es uno que
propone analizar radiografías pulmonares, y en lo particular como
profesional del arte de curar creo que sería bueno con redes buscar puntos
que no son tenidos en cuenta, para que los profesionales de la salud sepan
por ejemplo, en x, y hay esto que se pondera en 0,5 y no tenemos ni idea
que es, hay que buscarlo, investigarlo, etc.

Javier Rubén Marcuzzi

El mié., 25 mar. 2020 a las 8:46, Jorge Pradas (<jorpramo en gmail.com>)
escribió: