Articles of r

¿Por qué `vapply` es más seguro que` sapply`?

La documentación dice vapply es similar a sapply , pero tiene un tipo de valor de retorno previamente especificado, por lo que puede ser más seguro […] de usar. ¿Podrían explicar por qué es generalmente más seguro, tal vez dando ejemplos? PD: Conozco la respuesta y ya tiendo a evitar sapply . Solo desearía que […]

Captura del grupo Regex en R con múltiples grupos de captura

En R, ¿es posible extraer la captura de grupo de una coincidencia de expresión regular? Por lo que puedo decir, ninguno de grep , grepl , regexpr , gregexpr , sub o gsub devuelve las capturas de grupo. Necesito extraer pares clave-valor de cadenas que están codificadas así: \((.*?) :: (0\.[0-9]+)\) Siempre puedo hacer múltiples […]

Combina marcos de datos desiguales y reemplaza las filas que faltan con 0

Tengo dos data.frames, uno con solo caracteres y el otro con caracteres y valores. df1 = data.frame(x=c(‘a’, ‘b’, ‘c’, ‘d’, ‘e’)) df2 = data.frame(x=c(‘a’, ‘b’, ‘c’),y = c(0,1,0)) merge(df1, df2) xy 1 a 0 2 b 1 3 c 0 Quiero fusionar df1 y df2. Los caracteres a, b y c se fusionaron bien y […]

múltiples gráficos en un canvas usando ggplot2

Estoy intentando fusionar dos ggplot2 gráficas en una basada en esta tabla: Type RatingA RatingB 1 One 3 36 2 Two 5 53 3 One 5 57 4 One 7 74 5 Three 4 38 6 Three 8 83 Quiero hacer dos diagtwigs de dispersión con la media de las clasificaciones en el eje y […]

Los datos del subconjunto solo contienen columnas cuyos nombres coinciden con una condición

¿Hay alguna forma de subconjunto de datos en base a nombres de columna que comiencen con una cadena en particular? Tengo algunas columnas que son como ABC_1 ABC_2 ABC_3 y algunas como XYZ_1, XYZ_2,XYZ_3 digamos. ¿Cómo puedo subconjuntar mi df basado solo en columnas que contienen las partes de texto anteriores (digamos, ABC o XYZ […]

Usar nombres dynamics de columnas en `data.table`

Quiero calcular la media de cada una de varias columnas en una tabla de datos, agrupada por otra columna. Mi pregunta es similar a otras dos preguntas sobre SO ( uno y dos ) pero no pude aplicarlas a mi problema. Aquí hay un ejemplo: library(data.table) dtb <- fread(input = "condition,var1,var2,var3 one,100,1000,10000 one,101,1001,10001 one,102,1002,10002 two,103,1003,10003 […]

Eliminar caracteres que no sean ASCII de los archivos de datos

Tengo un montón de archivos csv que estoy leyendo en R e incluido en una carpeta de paquete / datos en formato .rdata . Lamentablemente, los caracteres que no son ASCII en los datos no pasan el control. El paquete de tools tiene dos funciones para buscar caracteres que no sean ASCII ( showNonASCII y […]

La forma más simple de hacer barras de barras agrupadas

Tengo el siguiente dataframe: Catergory Reason Species 1 Decline Genuine 24 2 Improved Genuine 16 3 Improved Misclassified 85 4 Decline Misclassified 41 5 Decline Taxonomic 2 6 Improved Taxonomic 7 7 Decline Unclear 41 8 Improved Unclear 117 Intento hacer un gráfico de barras agrupado, especie como altura y luego 2 colores para catergory. […]

Trazar series de tiempo con tags de fecha en el eje x

Sé que esta pregunta puede ser un cliché, pero estoy teniendo dificultades para hacerlo. Tengo el conjunto de datos en el siguiente formato: Visitas de fecha 01/11/2010 696537 2/11/2010 718748 3/11/2010 799355 11/4/2010 805800 05/11/2010 701262 6/11/2010 531579 7/11/2010 690068 8/11/2010 756947 9/11/2010 718757 10/11/2010 701768 11/11/2010 820113 11/12/2010 645259 Quiero crear un gráfico de […]

Especificación de colClasses en read.csv

Estoy tratando de especificar las opciones colClasses en la función read.csv en R. En mis datos, la primera columna “tiempo” es básicamente un vector de caracteres, mientras que el rest de las columnas son numéricas. data <- read.csv("test.csv", comment.char="" , colClasses=c(time="character", "numeric"), strip.white=FALSE) En el comando anterior, quisiera que R lea en la columna “tiempo” […]