Articles of r

¿Cómo organizar grandes progtwigs R?

Cuando realizo un proyecto R de cualquier complejidad, mis guiones rápidamente se vuelven largos y confusos. ¿Cuáles son algunas prácticas que puedo adoptar para que mi código siempre sea un placer trabajar con él? Estoy pensando en cosas como Colocación de funciones en archivos fuente Cuándo dividir algo en otro archivo fuente Qué debería estar […]

¿Dónde almacena R paquetes?

La función install.packages() en R es la utilidad de descompresión automática que obtiene e instala paquetes en R. ¿Cómo averiguo qué directorio R ha elegido para almacenar paquetes? ¿Cómo puedo cambiar el directorio en el que R almacena y accede a los paquetes?

Reemplaza todos los 0 valores a NA

Tengo un dataframe con algunas columnas numéricas. Algunas filas tienen un valor 0 que debe considerarse nulo en el análisis estadístico. ¿Cuál es la forma más rápida de reemplazar todo el valor 0 por NULL en R?

¿Cuál es la forma más rápida de fusionar / unir data.frames en R?

Por ejemplo (aunque no estoy seguro si el ejemplo más representativo): N <- 1e6 d1 <- data.frame(x=sample(N,N), y1=rnorm(N)) d2 <- data.frame(x=sample(N,N), y2=rnorm(N)) Esto es lo que tengo hasta ahora: d <- merge(d1,d2) # 7.6 sec library(plyr) d <- join(d1,d2) # 2.9 sec library(data.table) dt1 <- data.table(d1, key="x") dt2 <- data.table(d2, key="x") d <- data.frame( dt1[dt2,list(x,y1,y2=dt2$y2)] […]

Progtwigr secuencia de comandos R usando cron

Estoy intentando progtwigr mi script R usando cron, pero no está funcionando. Parece que R no puede encontrar paquetes en cron. ¿Alguien puede ayudarme? Gracias. El siguiente es mi script bash # source my profile . /home/winie/.profile # script.R will load packages R CMD BATCH /home/script.R

¿Por qué y dónde se \ n introducen nuevos caracteres en c ()?

Esperando que alguien me ayude a comprender por qué los caracteres errantes \ n aparecen en un vector de cadenas que estoy creando en R. Tratando de importar y limpiar un archivo de datos muy amplio que está en formato de ancho fijo ( http://www.state.nj.us/education/schools/achievement/2012/njask6/ , ‘Archivo de texto para la ejecución de datos’). Seguí […]

La media de cada elemento de una lista de matrices

Tengo una lista con tres matrices: a<-matrix(runif(100)) b<-matrix(runif(100)) c<-matrix(runif(100)) mylist<-list(a,b,c) Me gustaría obtener la media de cada elemento en las tres matrices. Intenté: aaply(laply(mylist, as.matrix), c(1, 1), mean) pero esto devuelve los promedios de cada matriz en lugar de tomar la media de cada elemento como lo rowMeans() .

Encontrar subcadenas comunes entre dos variables de caracteres

Tengo dos variables de caracteres (nombres de objetos) y quiero extraer la subcadena común más grande. a <- c('blahABCfoo', 'blahDEFfoo') b <- c('XXABC-123', 'XXDEF-123') Quiero lo siguiente como resultado: [1] “ABC” “DEF” Estos vectores como entrada deberían dar el mismo resultado: a <- c('textABCxx', 'textDEFxx') b <- c('zzABCblah', 'zzDEFblah') Estos ejemplos son representativos. Las cadenas […]

Agregar índice a ejecuciones contiguas de valores iguales

¿Hay una forma más rápida de hacer un índice de contador que utilizando un bucle? Dentro de ejecuciones contiguas de valores iguales, el índice debe ser el mismo. Encuentro que el bucle es muy lento, especialmente cuando los datos son muy grandes. A modo de ilustración, aquí está la entrada y la salida deseada x […]

Incrementar en 1 por cada cambio en la columna

Digamos que tengo el siguiente dataframe set.seed(123) df 0.5)*1) var1 podría tener cualquier tipo / número de niveles, no específicamente 0 y 1s Me gustaría crear un var2 que se incremente en 1 cada vez que var1 cambie sin usar un for loop El resultado esperado en este caso es: data.frame(var1=(runif(10)>0.5)*1, var2=c(1, 2, 3, 4, […]