No estoy seguro de qué función usar para hacer lo siguiente: library(data.table) dt = data.table(a = 1:4, b = 1:2) dt[, rep(a[1], 3), by = b] # b V1 #1: 1 1 #2: 1 1 #3: 1 1 #4: 2 2 #5: 2 2 #6: 2 2 Ambos summarise y mutate están contentos con esta […]
Esto es algo que pensé que debería hacer después de esta pregunta . Me gustaría confirmar si se trata de una falla / incoherencia antes de archivarla como tal en el rastreador R-forge. Considera esta data.table : require(data.table) DT <- data.table(x=c(1,0,NA), y=1:3) Ahora, para acceder a todas las filas del DT que no son 0, […]
Estoy migrando desde marcos de datos y matrices a tablas de datos, pero no he encontrado una solución para extraer las filas únicas de una tabla de datos. Supongo que hay algo que me falta sobre la notación [,J] , aunque todavía no he encontrado una respuesta en las preguntas frecuentes y las viñetas introductorias. […]
¿Cómo selecciono todas las filas que tienen un valor faltante en la clave principal en una tabla de datos? DT = data.table(x=rep(c(“a”,”b”,NA),each=3), y=c(1,3,6), v=1:9) setkey(DT,x) Seleccionar un valor en particular es fácil DT[“a”,] La selección de los valores faltantes parece requerir una búsqueda vectorial. No se puede usar la búsqueda binaria. ¿Estoy en lo correcto? […]
En data.table es posible tener columnas de tipo list y estoy intentando por primera vez beneficiarme de esta característica. Necesito almacenar para cada fila de mi tabla varios comentarios tomados de un servicio web de rApache. Cada comentario tendrá un nombre de usuario, fecha y elemento del cuerpo. En lugar de usar cadenas largas con […]
En los archivos de ayuda de dcast.data.table , hay una nota que indica que se ha implementado una nueva característica: “dcast.data.table permite que la columna value.var sea de tipo lista” Considero que esto significa que uno puede tener múltiples variables de valor dentro de una lista, es decir, en este formato: dcast.data.table(dt, x1~x2, value.var=list(‘var1′,’var2′,’var3’)) Pero […]
Tengo dos tablas, policies y claims policies policies policyNumber EFDT EXDT 1: 123 2012-01-01 2013-01-01 2: 123 2013-01-01 2014-01-01 3: 124 2013-01-01 2014-01-01 4: 125 2013-02-01 2014-02-01 claims claims claimNumber policyNumber lossDate claimAmount 1: 1 123 2012-02-01 10 2: 2 123 2012-08-15 20 3: 3 123 2013-01-01 20 4: 4 124 2013-10-31 15 La tabla […]
data.table ha introducido el operador: =. ¿Por qué no sobrecargar <-?
data.table es un fantástico paquete R y lo estoy usando en una biblioteca que estoy desarrollando. Hasta ahora todo va muy bien, excepto por una complicación. Parece ser mucho más difícil (en comparación con los marcos de datos convencionales) referirse a data.table columnas data.table utilizando nombres guardados en variables (como para marcos de datos sería, […]
Estoy atascado con un pequeño problema R con data.table . Su ayuda es muy apreciada. Cómo hago esto: getResult <- function(dt, expr, gby) { e <- substitute(expr) b <- substitute(gby) return(dt[,eval(e),by=b]) } v1 <- "Sepal.Length" v2 <- "Species" dt <- data.table(iris) rDT <- getResult(dt, sum(v1, na.rm=TRUE), v2) Me aparece el siguiente error: Error en sum […]