Articles of r

Gradiente de n colores que van desde el color 1 y el color 2

A menudo trabajo con ggplot2 que hace agradables los degradados ( ggplot2 clic aquí para ver un ejemplo ). Tengo una necesidad de trabajar en la base y creo que las scales se pueden usar allí para crear degradados de color también, pero estoy severamente alejado de cómo. El objective básico es generar una paleta […]

La prueba anova falla en los ajustes de lme creados con fórmula pegada

A menudo especifico el argumento de fórmula para modelar funciones de ajuste como lm o lme pegando juntas las partes que necesito, como en la respuesta de @DWin a esta pregunta: Comprender lm y environment . En la práctica esto se ve así: library(nlme) set.seed(5) ns <- 5; ni <- 5; N <- ns*ni d […]

Cómo indexar una secuencia vectorial dentro de una secuencia vectorial

Tengo una solución para un problema que implica bucle y funciona, pero siento que me falta algo que implica una implementación más eficiente. El problema: tengo una secuencia vectorial numérica, y quiero identificar la (s) posición (es) de inicio en otro vector del primer vector. Funciona así: # helper function for matchSequence # wraps a […]

¿Cómo puedo clasificar las observaciones en grupo más rápido?

Tengo un problema realmente simple, pero probablemente no estoy pensando en vector lo suficiente como para resolverlo de manera eficiente. Intenté dos enfoques diferentes y han estado funcionando en dos computadoras diferentes durante mucho tiempo. Ojalá pudiera decir que la competencia lo hizo más emocionante, pero … bleh. observaciones de rango en grupo Tengo datos […]

Agregue un dataframe basado en pares de columnas desordenadas

Tengo un conjunto de datos que se ve así: id1 id2 size 1 5400 5505 7 2 5033 5458 1 3 5452 2873 24 4 5452 5213 2 5 5452 4242 26 6 4823 4823 4 7 5505 5400 11 Donde id1 e id2 son nodos únicos en un gráfico, y el size es un […]

Lectura de varios archivos y cálculo de la media según la entrada del usuario

Estoy tratando de escribir una función en R que toma 3 entradas: Directorio contaminante carné de identidad Tengo un directorio en mi computadora lleno de archivos CSV, es decir, más de 300. Lo que esta función haría se muestra en el siguiente prototipo: pollutantmean <- function(directory, pollutant, id = 1:332) { ## 'directory' is a […]

ggplot2 0.9.0 elimina automáticamente los niveles de factor no utilizados de la leyenda de trazado?

Recientemente me actualicé a ggplot2 0.9.0 desde la versión 0.8.9, y ahora entiendo que mis leyendas de ttwig solo muestran los niveles de factor utilizados en la ttwig (omite los que no se usaron). Antes incluiría todos los niveles de factores en la leyenda. Estoy ejecutando Windows 7 y R 2.15.0 (2.14.2 antes de hoy). […]

Cómo dividir strsplit diferentes números de cadenas en cierta columna por función

Tengo un problema con el valor de columna dividida cuando el elemento de la columna tiene una cantidad diferente de cadenas. Puedo hacerlo en plyr por ejemplo: library(plyr) column <- c("jake", "jane jane","john john john") df <- data.frame(1:3, name = column) df$name <- as.character(df$name) df2 <- ldply(strsplit(df$name, " "), rbind) View(df2) Como resultado, tenemos un […]

Dummifique la columna de caracteres y encuentre valores únicos

Tengo un dataframe con la siguiente estructura test <- data.frame(col = c('a; ff; cc; rr;', 'rr; a; cc; e;')) Ahora quiero crear un dataframe a partir de este que contiene una columna con nombre para cada uno de los valores únicos en el dataframe de prueba. Un valor único es un valor que termina con […]

Variables ficticias de una variable de cadena

Me gustaría crear variables ficticias desde este conjunto de datos: DF DF AB 1 1 1,3,2 2 2 2,1,3,6 3 3 3,2,5,1,7 4 4 3,7,4,2,6,5 5 5 4,10,7,3,5,6 La salida deseada debería verse así: A 1 2 3 4 5 6 7 8 9 10 1 1 1 1 0 0 0 0 0 0 […]