Articles of r

Lectura de varios archivos y cálculo de la media según la entrada del usuario

Estoy tratando de escribir una función en R que toma 3 entradas: Directorio contaminante carné de identidad Tengo un directorio en mi computadora lleno de archivos CSV, es decir, más de 300. Lo que esta función haría se muestra en el siguiente prototipo: pollutantmean <- function(directory, pollutant, id = 1:332) { ## 'directory' is a […]

ggplot2 0.9.0 elimina automáticamente los niveles de factor no utilizados de la leyenda de trazado?

Recientemente me actualicé a ggplot2 0.9.0 desde la versión 0.8.9, y ahora entiendo que mis leyendas de ttwig solo muestran los niveles de factor utilizados en la ttwig (omite los que no se usaron). Antes incluiría todos los niveles de factores en la leyenda. Estoy ejecutando Windows 7 y R 2.15.0 (2.14.2 antes de hoy). […]

Cómo dividir strsplit diferentes números de cadenas en cierta columna por función

Tengo un problema con el valor de columna dividida cuando el elemento de la columna tiene una cantidad diferente de cadenas. Puedo hacerlo en plyr por ejemplo: library(plyr) column <- c("jake", "jane jane","john john john") df <- data.frame(1:3, name = column) df$name <- as.character(df$name) df2 <- ldply(strsplit(df$name, " "), rbind) View(df2) Como resultado, tenemos un […]

Dummifique la columna de caracteres y encuentre valores únicos

Tengo un dataframe con la siguiente estructura test <- data.frame(col = c('a; ff; cc; rr;', 'rr; a; cc; e;')) Ahora quiero crear un dataframe a partir de este que contiene una columna con nombre para cada uno de los valores únicos en el dataframe de prueba. Un valor único es un valor que termina con […]

Variables ficticias de una variable de cadena

Me gustaría crear variables ficticias desde este conjunto de datos: DF DF AB 1 1 1,3,2 2 2 2,1,3,6 3 3 3,2,5,1,7 4 4 3,7,4,2,6,5 5 5 4,10,7,3,5,6 La salida deseada debería verse así: A 1 2 3 4 5 6 7 8 9 10 1 1 1 1 0 0 0 0 0 0 […]

ggplot2 mantiene los niveles no utilizados barplot

Quiero trazar los niveles no utilizados (es decir, los niveles donde el recuento es 0) en mi diagtwig de barras, sin embargo, los niveles no utilizados se descartan y no puedo entender cómo mantenerlos df <- data.frame(type=c("A", "A", "A", "B", "B"), group=rep("group1", 5)) df$type <- factor(df$type, levels=c("A","B", "C")) ggplot(df, aes(x=group, fill=type)) + geom_bar() En el […]

Secuencia de todos los enteros entre dos vectores en R

Tengo dos vectores: Start = c(1,10,20) Finish = c(9,19,30) Me gustaría que algo como esto funcione … Inicio: final Pero por supuesto que no . Me gustaría producir una lista como la siguiente: [1] 1,2,3,4,5,6,7,8,9 [2] 10 11 12 13 14 15 16 17 18 19 [3] 20 21 22 23 24 25 26 27 […]

Filas colapsantes donde algunas son todas NA, otras son disjuntas con algunas NA

Tengo un dataframe simple como tal: ID Col1 Col2 Col3 Col4 1 NA NA NA NA 1 5 10 NA NA 1 NA NA 15 20 2 NA NA NA NA 2 25 30 NA NA 2 NA NA 35 40 Y me gustaría volver a formatearlo como tal: ID Col1 Col2 Col3 Col4 1 […]

Obtener la ruta de un guión R

¿Hay alguna forma de encontrar programáticamente la ruta de un script R dentro del script? Lo estoy preguntando porque tengo varios scripts que usan RGtk2 y cargan una GUI desde un archivo .glade. En estos scripts, me veo obligado a poner una setwd(“path/to/the/script”) al principio, de lo contrario no se encontrará el archivo .glade (que […]

generar de manera eficiente una muestra aleatoria de tiempos y fechas entre dos fechas

He escrito una función (bastante ingenua) para seleccionar aleatoriamente una fecha / hora entre dos días especificados # set start and end dates to sample between day.start <- "2012/01/01" day.end <- "2012/12/31" # define a random date/time selection function rand.day.time <- function(day.start,day.end,size) { dayseq <- seq.Date(as.Date(day.start),as.Date(day.end),by="day") dayselect <- sample(dayseq,size,replace=TRUE) hourselect <- sample(1:24,size,replace=TRUE) minselect <- sample(0:59,size,replace=TRUE) […]