Articles of plyr

¿La forma más rápida de agregar filas para valores faltantes en data.frame?

Tengo una columna en mis conjuntos de datos donde los períodos de tiempo ( Time ) son enteros que van desde ab. A veces puede haber períodos de tiempo faltantes para cualquier grupo dado. Me gustaría completar esas filas con NA . A continuación se muestran los datos de ejemplo para 1 (de varios 1000) […]

Filas únicas, considerando dos columnas, en R, sin orden

A diferencia de las preguntas que he encontrado, quiero obtener el único de dos columnas sin orden. Tengo un df: df df [,1] [,2] [1,] “a” “b” [2,] “b” “d” [3,] “c” “e” [4,] “b” “a” En este caso, la fila 1 y la fila 4 son “duplicados” en el sentido de que ba es […]

Código Idiomatic R para particionar un vector por un índice y realizar una operación en esa partición

Estoy tratando de encontrar la forma idiomática en R para dividir un vector numérico por algún vector de índice, encontrar la sum de todos los números en esa partición y luego dividir cada entrada individual por esa sum de partición. En otras palabras, si comienzo con esto: df <- data.frame(x = c(1,2,3,4,5,6), index = c('a', […]

¿Por qué el resumen o la mutación no funcionan con group_by cuando cargo `plyr` después de` dplyr`?

Nota: El título de esta pregunta ha sido editado para convertirlo en la pregunta canónica para los problemas cuando plyr funciones plyr enmascaran sus contrapartes dplyr . El rest de la pregunta permanece sin cambios. Supongamos que tengo los siguientes datos: dfx <- data.frame( group = c(rep('A', 8), rep('B', 15), rep('C', 6)), sex = sample(c("M", […]

¿Cómo seleccionar las filas con valores máximos en cada grupo con dplyr?

Me gustaría seleccionar una fila con valor máximo en cada grupo con dplyr. Primero, genero algunos datos aleatorios para mostrar mi pregunta set.seed(1) df <- expand.grid(list(A = 1:5, B = 1:5, C = 1:5)) df$value <- runif(nrow(df)) En plyr, podría usar una función personalizada para seleccionar esta fila. library(plyr) ddply(df, .(A, B), function(x) x[which.max(x$value),]) En […]

¿Cómo crear una variable de retraso dentro de cada grupo?

Tengo una data.table: set.seed(1) data <- data.table(time = c(1:3, 1:4), groups = c(rep(c("b", "a"), c(3, 4))), value = rnorm(7)) data # groups time value # 1: b 1 -0.6264538 # 2: b 2 0.1836433 # 3: b 3 -0.8356286 # 4: a 1 1.5952808 # 5: a 2 0.3295078 # 6: a 3 -0.8204684 # […]

Convierta datos de formato largo a formato ancho con múltiples columnas de medida

Tengo problemas para encontrar la manera más elegante y flexible de cambiar los datos de formato largo a formato ancho cuando tengo más de una variable de medida que quiero llevar. Por ejemplo, aquí hay un dataframe simple en formato largo. ID es el sujeto, TIME es una variable de tiempo, y X e Y […]

Reformar el dataframe de tres columnas a la matriz (formato “largo” a “ancho”)

Tengo un data.frame que se ve así. xa 1 xb 2 xc 3 ya 3 yb 3 yc 2 Quiero esto en forma de matriz para poder alimentarlo a un mapa de calor para hacer una ttwig. El resultado debería ser algo así como: abc x 1 2 3 y 3 3 2 He intentado […]