Articles of data.table

operaciones agrupadas que dan como resultado una longitud no igual a 1 o una longitud de grupo en dplyr

No estoy seguro de qué función usar para hacer lo siguiente: library(data.table) dt = data.table(a = 1:4, b = 1:2) dt[, rep(a[1], 3), by = b] # b V1 #1: 1 1 #2: 1 1 #3: 1 1 #4: 2 2 #5: 2 2 #6: 2 2 Ambos summarise y mutate están contentos con esta […]

DT Y DT Tratan NA en x inconsistentemente

Esto es algo que pensé que debería hacer después de esta pregunta . Me gustaría confirmar si se trata de una falla / incoherencia antes de archivarla como tal en el rastreador R-forge. Considera esta data.table : require(data.table) DT <- data.table(x=c(1,0,NA), y=1:3) Ahora, para acceder a todas las filas del DT que no son 0, […]

Extracción de filas únicas de una tabla de datos en R

Estoy migrando desde marcos de datos y matrices a tablas de datos, pero no he encontrado una solución para extraer las filas únicas de una tabla de datos. Supongo que hay algo que me falta sobre la notación [,J] , aunque todavía no he encontrado una respuesta en las preguntas frecuentes y las viñetas introductorias. […]

Seleccione NA en una tabla de datos en R

¿Cómo selecciono todas las filas que tienen un valor faltante en la clave principal en una tabla de datos? DT = data.table(x=rep(c(“a”,”b”,NA),each=3), y=c(1,3,6), v=1:9) setkey(DT,x) Seleccionar un valor en particular es fácil DT[“a”,] La selección de los valores faltantes parece requerir una búsqueda vectorial. No se puede usar la búsqueda binaria. ¿Estoy en lo correcto? […]

Usando listas dentro de columnas data.table

En data.table es posible tener columnas de tipo list y estoy intentando por primera vez beneficiarme de esta característica. Necesito almacenar para cada fila de mi tabla varios comentarios tomados de un servicio web de rApache. Cada comentario tendrá un nombre de usuario, fecha y elemento del cuerpo. En lugar de usar cadenas largas con […]

¿el valor.var en dcast puede ser una lista o tener múltiples variables de valor?

En los archivos de ayuda de dcast.data.table , hay una nota que indica que se ha implementado una nueva característica: “dcast.data.table permite que la columna value.var sea de tipo lista” Considero que esto significa que uno puede tener múltiples variables de valor dentro de una lista, es decir, en este formato: dcast.data.table(dt, x1~x2, value.var=list(‘var1′,’var2′,’var3’)) Pero […]

Combinación de tabla de datos basada en intervalos de fechas

Tengo dos tablas, policies y claims policies policies policyNumber EFDT EXDT 1: 123 2012-01-01 2013-01-01 2: 123 2013-01-01 2014-01-01 3: 124 2013-01-01 2014-01-01 4: 125 2013-02-01 2014-02-01 claims claims claimNumber policyNumber lossDate claimAmount 1: 1 123 2012-02-01 10 2: 2 123 2012-08-15 20 3: 3 123 2013-01-01 20 4: 4 124 2013-10-31 15 La tabla […]

¿Por qué ha definido data.table: = en lugar de sobrecargar <-?

data.table ha introducido el operador: =. ¿Por qué no sobrecargar <-?

Refiriéndose a columnas data.table por nombres guardados en variables

data.table es un fantástico paquete R y lo estoy usando en una biblioteca que estoy desarrollando. Hasta ahora todo va muy bien, excepto por una complicación. Parece ser mucho más difícil (en comparación con los marcos de datos convencionales) referirse a data.table columnas data.table utilizando nombres guardados en variables (como para marcos de datos sería, […]

En R data.table, ¿cómo paso los parámetros variables a una expresión?

Estoy atascado con un pequeño problema R con data.table . Su ayuda es muy apreciada. Cómo hago esto: getResult <- function(dt, expr, gby) { e <- substitute(expr) b <- substitute(gby) return(dt[,eval(e),by=b]) } v1 <- "Sepal.Length" v2 <- "Species" dt <- data.table(iris) rDT <- getResult(dt, sum(v1, na.rm=TRUE), v2) Me aparece el siguiente error: Error en sum […]