Articles of r faq

Cambiar el nombre de varias columnas por nombre

Alguien debería haber preguntado esto, pero no pude encontrar una respuesta. Digamos que tengo: x = data.frame(q=1,w=2,e=3, …and many many columns…) ¿Cuál es la forma más elegante de cambiar el nombre de un subconjunto arbitrario de columnas, cuya posición no conozco necesariamente, por otros nombres arbitrarios? por ejemplo, decir que quiero cambiar el nombre “q” […]

Use nombres de variables en funciones de dplyr

Quiero usar nombres de variables como cadenas en funciones de dplyr . Vea el ejemplo a continuación: df <- data.frame( color = c("blue", "black", "blue", "blue", "black"), value = 1:5) filter(df, color == "blue") Funciona perfectamente, pero me gustaría referirme a los color por cuerdas, algo como esto: var <- "color" filter(df, this_probably_should_be_a_function(var) == "blue"). […]

Eliminar grupos con menos de tres observaciones únicas

Me gustaría subconjuntar mi dataframe para mantener solo los grupos que tienen 3 o más observaciones en DIFERENTES días. Quiero deshacerme de los grupos que tienen menos de 3 observaciones, o las observaciones que tienen no son de 3 días diferentes. Aquí hay un conjunto de datos de muestra: Group Day 1 1 1 3 […]

Confusión entre niveles de factores y tags de factores

Parece que hay una diferencia entre los niveles y las tags de un factor en R. Hasta ahora, siempre pensé que los niveles eran el nombre “real” de los niveles de los factores, y las tags eran los nombres utilizados para la salida (como tablas y gráficos) . Obviamente, este no es el caso, como […]

¿Qué significan los operadores% op% en R? por ejemplo, “% en%”

Traté de hacer esta búsqueda simple pero no pude encontrar nada en el símbolo de porcentaje ( % ) en R. ¿Qué significa %in% en el siguiente código? time(x) %in% time(y) donde y son matrices. ¿Cómo busco ayuda en %in% y funciones similares que siguen el patrón %stuff% , ya que no puedo encontrar el […]

Cómo filtrar de manera eficiente un dataframe?

Tengo un dataframe e intenté seleccionar solo las observaciones que me interesan con esto: data[data[“Var1”]>10] Desafortunadamente, este comando destruye la estructura de data.frame y devuelve un vector largo. Lo que quiero obtener es el dataframe acortado por las observaciones que no coinciden con mis criterios.

¿Por qué `vapply` es más seguro que` sapply`?

La documentación dice vapply es similar a sapply , pero tiene un tipo de valor de retorno previamente especificado, por lo que puede ser más seguro […] de usar. ¿Podrían explicar por qué es generalmente más seguro, tal vez dando ejemplos? PD: Conozco la respuesta y ya tiendo a evitar sapply . Solo desearía que […]

Cómo cargar paquetes en R automáticamente?

¿Podría sugerirme una forma de cargar paquetes en R automáticamente? Quiero decir, quiero iniciar una sesión en R sin necesidad de utilizar la library(‘package name’) varias veces. Supongamos que descargué todos los paquetes que deseo usar la próxima vez que inicie R.

¿Debo usar un data.frame o una matrix?

¿Cuándo se debe usar un data.frame y cuándo es mejor usar una matrix ? Ambos mantienen los datos en un formato rectangular, por lo que a veces no está claro. ¿Hay alguna regla general para cuándo usar qué tipo de datos?

¿Cómo realizar la clasificación natural?

¿Hay un tipo natural para R? Digamos que tengo un vector de caracteres así: seq.names <- c('abc21', 'abc2', 'abc1', 'abc01', 'abc4', 'abc201', '1b', '1a') Me gustaría ordenarlo aphanumerically, así que recupero esto: c(‘1a’, ‘1b’, ‘abc1’, ‘abc01’, ‘abc2’, ‘abc4’, ‘abc21’, ‘abc201’) ¿Existe esto en alguna parte, o debería comenzar a codificar?