Articles of dplyr

¿Cómo parametrizar llamadas de función en dplyr 0.7?

El lanzamiento de dplyr 0.7 incluye una importante revisión de la progtwigción con dplyr. Leí este documento detenidamente y estoy tratando de comprender cómo afectará mi uso de dplyr. Aquí hay una expresión común que uso cuando construyo informes y funciones de agregación con dplyr: my_report % group_by_(.dots=grouping_vars) %>% summarize(x_mean=mean(x), x_median=median(x), …) } Aquí, grouping_vars […]

Encuentre el número de filas usando dplyr / group_by

Estoy usando el conjunto de datos mtcars . Quiero encontrar la cantidad de registros para una combinación particular de datos. Algo muy similar a la cláusula count(*) group by en SQL. ddply() de plyr me funciona library(plyr) ddply(mtcars, .(cyl,gear),nrow) tiene salida cyl gear V1 1 4 3 1 2 4 4 8 3 4 5 […]

R Evaluación condicional al usar el operador de tubería%>%

Al usar el operador de tubería %>% con paquetes como dplyr , ggvis , dycharts , etc., ¿cómo hago un paso condicionalmente? Por ejemplo; step_1 %>% step_2 %>% if(condition) step_3 Estos enfoques no parecen funcionar: step_1 %>% step_2 if(condition) %>% step_3 step_1 %>% step_2 %>% if(condition) step_3 Hay un largo camino: if(condition) { step_1 %>% […]

dplyr mutate / replace en un subconjunto de filas

Estoy en el proceso de probar un flujo de trabajo basado en dplyr (en lugar de usar principalmente data.table, que estoy acostumbrado), y me he encontrado con un problema que no puedo encontrar una solución dplyr equivalente a . Normalmente me encuentro con el escenario en el que necesito actualizar / reemplazar condicionalmente varias columnas […]

R dplyr: cambiar el nombre de las variables utilizando funciones de cadena

(Pregunta algo relacionada: ingrese nuevos nombres de columna como cadena en la función de cambio de nombre de dplyr ) En el medio de una cadena dplyr ( %>% ), me gustaría reemplazar nombres de columnas múltiples con funciones de sus nombres antiguos (usando tolower o gsub , etc.) library(tidyr); library(dplyr) data(iris) # This is […]

Ajustar varios modelos de regresión con dplyr

Me gustaría ajustar un modelo para cada hora (la variable de factor) usando dplyr, estoy obteniendo un error y no estoy muy seguro de cuál es el problema. df.h <- data.frame( hour = factor(rep(1:24, each = 21)), price = runif(504, min = -10, max = 125), wind = runif(504, min = 0, max = 2500), […]

Crear una columna con valores agrupados basados ​​en otra columna

Estoy seguro de que esto se ha preguntado antes, pero no sé qué buscar, así que me disculpo por adelantado. Digamos que tengo el siguiente dataframe: grades <- data.frame(a = 1:40, b = sample(45:100, 40)) Utilizando deplyr, quiero crear una nueva variable que indique la calificación que recibió el alumno, de acuerdo con los siguientes […]

Realizando Dplyr mutar en un subconjunto de columnas

Tengo un data.frame como este (el conjunto de datos real tiene muchas más filas y columnas) set.seed(15) dd <- data.frame(id=letters[1:4], matrix(runif(5*4), nrow=4)) # id X1 X2 X3 X4 X5 # 1 a 0.6021140 0.3670719 0.6872308 0.5090904 0.4474437 # 2 b 0.1950439 0.9888592 0.8314290 0.7066286 0.9646670 # 3 c 0.9664587 0.8151934 0.1046694 0.8623137 0.1411871 # 4 […]

Filtro de dataframe por nombre de columna de caracteres (en dplyr)

Tengo un dataframe y quiero filtrarlo de una de dos maneras, ya sea por la columna “this” o la columna “that”. Me gustaría poder referirme al nombre de la columna como una variable. ¿Cómo (en dplyr , si eso hace una diferencia) me refiero a un nombre de columna por una variable? library(dplyr) df % […]

dplyr :: group_by_ con la entrada de cadena de caracteres de varios nombres de variables

Estoy escribiendo una función donde se le pide al usuario que defina una o más variables de agrupación en la llamada a la función. Los datos se agrupan luego usando dplyr y funciona como se espera si solo hay una variable de agrupación, pero no he descubierto cómo hacerlo con múltiples variables de agrupación. Ejemplo: […]