Articles of r

Encontrar subcadenas comunes entre dos variables de caracteres

Tengo dos variables de caracteres (nombres de objetos) y quiero extraer la subcadena común más grande. a <- c('blahABCfoo', 'blahDEFfoo') b <- c('XXABC-123', 'XXDEF-123') Quiero lo siguiente como resultado: [1] “ABC” “DEF” Estos vectores como entrada deberían dar el mismo resultado: a <- c('textABCxx', 'textDEFxx') b <- c('zzABCblah', 'zzDEFblah') Estos ejemplos son representativos. Las cadenas […]

Agregar índice a ejecuciones contiguas de valores iguales

¿Hay una forma más rápida de hacer un índice de contador que utilizando un bucle? Dentro de ejecuciones contiguas de valores iguales, el índice debe ser el mismo. Encuentro que el bucle es muy lento, especialmente cuando los datos son muy grandes. A modo de ilustración, aquí está la entrada y la salida deseada x […]

Incrementar en 1 por cada cambio en la columna

Digamos que tengo el siguiente dataframe set.seed(123) df 0.5)*1) var1 podría tener cualquier tipo / número de niveles, no específicamente 0 y 1s Me gustaría crear un var2 que se incremente en 1 cada vez que var1 cambie sin usar un for loop El resultado esperado en este caso es: data.frame(var1=(runif(10)>0.5)*1, var2=c(1, 2, 3, 4, […]

Divida una columna de datos concatenados delimitados por comas y recodifique la salida como factores

Estoy tratando de limpiar algunos datos que han sido ingresados ​​incorrectamente. La pregunta para la variable permite respuestas múltiples de cinco opciones, numeradas del 1 al 5. Los datos se han ingresado de la siguiente manera (esto es solo un ejemplo: hay muchas más variables y muchas más observaciones en los datos reales) marco): data […]

¿Cuál es el algoritmo detrás de la función `split` del núcleo R?

split es una función especialmente importante en R core. Muchas soluciones de Stack Overflow que ofrecen soluciones de base R basadas en la manipulación de datos se basan en él. Es la rutina de caballo de batalla de cualquier grupo por operaciones. También hay muchas preguntas cuya solución es solo una línea con split . […]

Evaluando el nombre de la columna y el valor objective dentro de la expresión `j` dentro de` data.table`

Considerar target <- "vs" value <- 1 library(data.table) dt <- as.data.table(head(mtcars)) Así que estoy tratando de pasar tanto el nombre de la columna como un valor como variables en la expresión j dentro del entorno data.table , algo que sería equivalente a dt[, vs == 1] # [1] FALSE FALSE TRUE TRUE FALSE TRUE Si […]

¿Por qué el uso de update en una lm dentro de un data.table agrupado pierde sus datos de modelo?

Ok, esta es una extraña. Sospecho que esto es un error dentro de data.table , pero sería útil si alguien puede explicar por qué sucede esto, ¿qué está haciendo exactamente la update ? Estoy usando la list(list()) truco dentro de data.table para almacenar modelos ajustados. Cuando crea una secuencia de objetos lm cada uno para […]

Error “.onLoad falló en loadNamespace () para ‘tcltk'”

Tengo una pregunta general sobre cómo cargar efectivamente cualquier clase de paquete externo en R. He encontrado que muchas fonts que detallan esta información son simplemente insuficientes, pero dejaré de mencionar esas respectivas URL. He cargado con éxito paquetes externos en R antes, pero tengo dificultades para cargar el paquete fgui . En mi caso […]

Cómo sumr una lista numérica de elementos

Me pregunto acerca de una manera elegante que permite sumr (o calcular una media) los valores numéricos de una lista. p.ej x <- list( a = matrix(c(1,2,3,4), nc=2), b = matrix(1, nc=2, nr=2)) y quieres obtener x[[1]]+x[[2]] o una media: (x[[1]]+x[[2]])/2

Las opciones de trozos de knitr para altura / ancho de figura no funcionan

Solía ​​usar knitr en R para producir informes del formato .Rnw . En mis informes, a menudo pongo un montón de ttwigs y manipulo su tamaño con el uso de fragmentos optios, por ejemplo: \begin{figure}[h!] \centering <>= plot(mtcars) @ \caption{} \end{figure} Fue hace unos meses. Luego me mudé a otro entorno, reinstalé R y estas […]