Articles of r

Dendrogtwig de hoja de color y etiqueta

Intento crear un dendrogtwig, mis muestras tienen 5 códigos de grupo (actúan como nombre de muestra / especie / etc. pero es repetitivo). Por lo tanto, tengo dos problemas que me ayudarán mucho: ¿Cómo puedo mostrar los códigos de grupo en la etiqueta de la hoja (en lugar del número de muestra)? Deseo asignar un […]

Concatenar cadenas por grupo con dplyr

tengo un dataframe que se parece a esto > data data foo bar 1 1 a 2 1 b 3 2 a 4 3 b 5 3 c 6 3 d Me gustaría crear una nueva columna bars_by_foo que sea la concatenación de los valores de bar por foo. Entonces, los nuevos datos deberían verse […]

Asignar múltiples objetos a .GlobalEnv desde dentro de una función

Una publicación aquí un día atrás me ha preguntado cómo asignar valores a múltiples objetos en el entorno global desde dentro de una función. Este es mi bash de usar lapply ( assign puede ser más seguro que <<- pero nunca lo he usado y no estoy familiarizado con él). #fake data set df <- […]

¿Cómo extraigo una sola columna de un data.frame como un data.frame?

Digamos que tengo un data.frame: df <- data.frame(A=c(10,20,30),B=c(11,22,33), C=c(111,222,333)) ABC 1 10 11 111 2 20 22 222 3 30 33 333 Si selecciono dos (o más) columnas obtengo un data.frame: x <- df[,1:2] AB 1 10 11 2 20 22 3 30 33 Esto es lo que quiero. Sin embargo, si selecciono solo una […]

cómo calcular la media / mediana por grupo en un dataframe en r

Tengo un dataframe que registra cuánto dinero gasta un cliente en detalle como el siguiente: custid, value 1, 1 1, 3 1, 2 1, 5 1, 4 1, 1 2, 1 2, 10 3, 1 3, 2 3, 5 ¿Cómo calcule los charicteristics usando mean, max, mediana, std, etc. como el siguiente? Use alguna función […]

Devolver funciones anónimas de lapply – ¿qué está pasando mal?

Al intentar crear una lista de funciones similares utilizando lapply , encuentro que todas las funciones en la lista son idénticas e iguales a lo que debería ser el elemento final. Considera lo siguiente: pow <- function(x,y) x^y pl <- lapply(1:3,function(y) function(x) pow(x,y)) pl [[1]] function (x) pow(x, y) [[2]] function (x) pow(x, y) [[3]] […]

Chi Square Analysis utilizando for loop en R

Estoy tratando de hacer un análisis de chi cuadrado para todas las combinaciones de variables en los datos y mi código es: Data <- esoph[ , 1:3] OldStatistic <- NA for(i in 1:(ncol(Data)-1)){ for(j in (i+1):ncol(Data)){ Statistic <- data.frame("Row"=colnames(Data)[i], "Column"=colnames(Data)[j], "Chi.Square"=round(chisq.test(Data[ ,i], Data[ ,j])$statistic, 3), "df"=chisq.test(Data[ ,i], Data[ ,j])$parameter, "p.value"=round(chisq.test(Data[ ,i], Data[ ,j])$p.value, 3), row.names=NULL) […]

problema de punto flotante en R?

Posible duplicado: ¿Por qué estos números no son iguales? La expresión siguiente, que evalúa a 0.1, se considera mayor que 0.1. > round(1740/600,0) – 1740/600 [1] 0.1 > (round(1740/600,0) – 1740/600) (round(1740/600,0) – 1740/600) <= 0.1000000000000000000000000000000000000001 [1] TRUE Pensando que el problema podría deberse al redondeo, intenté esto con el mismo resultado: > 3 – […]

duplicados en múltiples columnas

Tengo un dataframe como ese > df abcd 1 1 2 A 1001 2 2 4 B 1002 3 3 6 B 1002 4 4 8 C 1003 5 5 10 D 1004 6 6 12 D 1004 7 7 13 E 1005 8 8 14 E 1006 Quiero eliminar las filas donde hay valores […]

contar el número de filas en un dataframe en R basado en el grupo

Tengo un dataframe en R como este: ID MONTH-YEAR VALUE 110 JAN. 2012 1000 111 JAN. 2012 2000 . . . . 121 FEB. 2012 3000 131 FEB. 2012 4000 . . . . Por lo tanto, para cada mes de cada año hay n filas y pueden estar en cualquier orden (es decir, no […]