Articles of r

¿Cómo dividir una cadena en subcadenas de una longitud determinada?

Tengo una cadena como: “aabbccccdd” Quiero dividir esta cadena en un vector de subcadenas de longitud 2: “aa” “bb” “cc” “cc” “dd”

ggplot2 múltiples subgrupos de un gráfico de barras

Intento producir un gráfico de barras que tenga múltiples agrupaciones de factores. Un ejemplo de Excel de lo que bash crear, subdividido por Variety and Irrigation treatment: Sé que podría producir múltiples gráficos usando facet_wrap() , pero me gustaría producir múltiples gráficos para este mismo tipo de datos para muchos años de datos similares. Un […]

Seleccionar múltiples columnas / filas impares o parejas para el dataframe

¿Hay alguna manera en R de seleccionar muchas filas / columnas no consecutivas, es decir, impares o pares? Estoy trazando las cargas para mi análisis de componentes principales. Tengo 84 filas de datos ordenados de esta manera: x_1 y_1 x_2 ….. x_42 y_42 Y en este momento estoy creando los cuadros de datos para las […]

¿Cómo cambiar la configuración regional de R?

Estoy usando R versión 2.15.3 (2013-03-01) en Ubuntu 12.10. El sistema está en alemán y lo mismo ocurre con R. Esto no funciona bien cuando se buscan mensajes de error. Ejecutando R en xterm de esta manera $ LANG=”C” R resuelve parcialmente el problema. Entonces R muestra todo en inglés. Pero al cargar RStudio de […]

¿Por qué se requiere allow.cartesian en momentos cuando se une a data.tables con claves duplicadas?

Estoy tratando de entender la lógica de la búsqueda J () cuando hay claves duplicadas en una tabla de datos en R. Aquí hay un pequeño experimento que he intentado: library(data.table) options(stringsAsFactors = FALSE) x <- data.table(keyVar = c("a", "b", "c", "c"), value = c( 1, 2, 3, 4)) setkey(x, keyVar) y1 <- data.frame(name = […]

La columna del dataframe no listada conserva información de otra columna

Tengo un dataframe que consta de dos columnas: un vector de caracteres col1 y una columna de list , col2 . myVector <- c("A","B","C","D") myList <- list() myList[[1]] <- c(1, 4, 6, 7) myList[[2]] <- c(2, 7, 3) myList[[3]] <- c(5, 5, 3, 9, 6) myList[[4]] <- c(7, 9) myDataFrame <- data.frame(row = c(1,2,3,4)) myDataFrame$col1 […]

Operador == inconsistente en columnas lógicas en data.table

Por favor vea el siguiente ejemplo reproducible: library(data.table) set.seed(123) DT <- data.table(A=rep(0.3,10000)) DT[, B := runif(.N) < A] DT[B == T, .N] # [1] 3005 DT[, summary(B)] # Mode FALSE TRUE NA's # logical 6995 3005 0 Todo se ve bien y el recuento de valores “VERDADEROS” es el mismo para los 2 métodos. Ahora […]

Reemplazar caracteres usando gsub, ¿cómo crear una función?

Estoy tratando de reemplazar personajes en un data.frame. Tengo una solución para esto > df df var1 1 aabbcdefg 2 aabbcdefg > df$var1 df$var1 df$var1 df$var1 df$var1 df$var1 df var1 1 hhiijklmg 2 hhiijklmg > pero me gustaría evitar el uso de varias llamadas a gsub, ¿sería mucho mejor crear una función para hacer esto […]

Cómo calcular de manera eficiente la distancia entre un par de coordenadas usando data.table: =

Quiero encontrar el método más eficiente (más rápido) para calcular las distancias entre pares de coordenadas de latitud y longitud. Se ha presentado una solución no tan eficiente (aquí) usando sapply y spDistsN1{sp} . Creo que esto podría hacerse mucho más rápido si se utiliza spDistsN1{sp} dentro de data.table con el operador := pero no […]

Divida los datos de la serie de tiempo en intervalos de tiempo (digamos una hora) y luego grafique el conteo

Solo tengo un archivo de datos con una columna de series de tiempo: ‘2012-02-01 17:42:44’ ‘2012-02-01 17:42:44’ ‘2012-02-01 17:42:44’ … Quiero dividir los datos de modo que tenga un recuento en la parte superior de la hora. Decir: ‘2012-02-01 17:00:00’ 20 ‘2012-02-01 18:00:00′ 30 Los ’20’ y ’30’ representan el número de entradas de series […]