Alguien debería haber preguntado esto, pero no pude encontrar una respuesta. Digamos que tengo: x = data.frame(q=1,w=2,e=3, …and many many columns…) ¿Cuál es la forma más elegante de cambiar el nombre de un subconjunto arbitrario de columnas, cuya posición no conozco necesariamente, por otros nombres arbitrarios? por ejemplo, decir que quiero cambiar el nombre “q” […]
Quiero usar nombres de variables como cadenas en funciones de dplyr . Vea el ejemplo a continuación: df <- data.frame( color = c("blue", "black", "blue", "blue", "black"), value = 1:5) filter(df, color == "blue") Funciona perfectamente, pero me gustaría referirme a los color por cuerdas, algo como esto: var <- "color" filter(df, this_probably_should_be_a_function(var) == "blue"). […]
Me gustaría subconjuntar mi dataframe para mantener solo los grupos que tienen 3 o más observaciones en DIFERENTES días. Quiero deshacerme de los grupos que tienen menos de 3 observaciones, o las observaciones que tienen no son de 3 días diferentes. Aquí hay un conjunto de datos de muestra: Group Day 1 1 1 3 […]
Parece que hay una diferencia entre los niveles y las tags de un factor en R. Hasta ahora, siempre pensé que los niveles eran el nombre “real” de los niveles de los factores, y las tags eran los nombres utilizados para la salida (como tablas y gráficos) . Obviamente, este no es el caso, como […]
Traté de hacer esta búsqueda simple pero no pude encontrar nada en el símbolo de porcentaje ( % ) en R. ¿Qué significa %in% en el siguiente código? time(x) %in% time(y) donde y son matrices. ¿Cómo busco ayuda en %in% y funciones similares que siguen el patrón %stuff% , ya que no puedo encontrar el […]
Tengo un dataframe e intenté seleccionar solo las observaciones que me interesan con esto: data[data[“Var1”]>10] Desafortunadamente, este comando destruye la estructura de data.frame y devuelve un vector largo. Lo que quiero obtener es el dataframe acortado por las observaciones que no coinciden con mis criterios.
La documentación dice vapply es similar a sapply , pero tiene un tipo de valor de retorno previamente especificado, por lo que puede ser más seguro […] de usar. ¿Podrían explicar por qué es generalmente más seguro, tal vez dando ejemplos? PD: Conozco la respuesta y ya tiendo a evitar sapply . Solo desearía que […]
¿Podría sugerirme una forma de cargar paquetes en R automáticamente? Quiero decir, quiero iniciar una sesión en R sin necesidad de utilizar la library(‘package name’) varias veces. Supongamos que descargué todos los paquetes que deseo usar la próxima vez que inicie R.
¿Cuándo se debe usar un data.frame y cuándo es mejor usar una matrix ? Ambos mantienen los datos en un formato rectangular, por lo que a veces no está claro. ¿Hay alguna regla general para cuándo usar qué tipo de datos?
¿Hay un tipo natural para R? Digamos que tengo un vector de caracteres así: seq.names <- c('abc21', 'abc2', 'abc1', 'abc01', 'abc4', 'abc201', '1b', '1a') Me gustaría ordenarlo aphanumerically, así que recupero esto: c(‘1a’, ‘1b’, ‘abc1’, ‘abc01’, ‘abc2’, ‘abc4’, ‘abc21’, ‘abc201’) ¿Existe esto en alguna parte, o debería comenzar a codificar?