Articles of r

Cómo subconjuntar datos en R sin perder filas de NA?

Tengo algunos datos que estoy viendo en R. Una columna en particular, titulada “Altura”, contiene algunas filas de NA. Estoy buscando subconjunto mi dataframe para que todas las alturas por encima de un cierto valor se excluyan de mi análisis. df2 <- subset ( df1 , Height < 40 ) Sin embargo, cada vez que […]

cómo agregar valores acumulativamente en un vector en R

Tengo un conjunto de datos que se parece a esto id name year job job2 1 Jane 1980 Worker 0 1 Jane 1981 Manager 1 1 Jane 1982 Manager 1 1 Jane 1983 Manager 1 1 Jane 1984 Manager 1 1 Jane 1985 Manager 1 1 Jane 1986 Boss 0 1 Jane 1987 Boss 0 […]

Remodelación del dataframe con duplicados

Tengo lo que debería ser un simple problema de remodelación, pero no puedo resolverlo. Parte de mis datos se ve así: foo <- structure(list(grade = c(3, 3, 4, 4, 5, 5, 6, 6, 7, 7, 8, 8, 3, 3, 4, 4, 5, 5, 6, 6), var.type = structure(c(3L, 2L, 3L, 2L, 3L, 2L, 3L, 2L, […]

fusionar una gran lista de objetos xts

Tengo una lista de objetos xts que son días mutuamente excluyentes. Me gustaría merge la lista en un gran objeto xts . Mi bash de hacer esto fue para ” merged_reg_1_min_prices <- do.call(cbind, reg_1_min_prices) Sin embargo, parece que se ha quedado sin memoria. reg_1_min_prices es de 6.000 días de devoluciones de 1 minuto en días […]

Especificar nombres de columna en un data.frame cambia los espacios a “.”

Digamos que tengo un data.frame, así: x <- c(1:10,1:10,1:10,1:10,1:10,1:10,1:10,1:10,1:10,1:10) df <- data.frame("Label 1"=x,"Label 2"=rnorm(100)) cabeza (df, 3) devoluciones: Label.1 Label.2 1 1 1.9825458 2 2 -0.4515584 3 3 0.6397516 ¿Cómo logro que R deje de reemplazar automágicamente el espacio con un punto en el nombre de la columna? es decir, “Etiqueta 1” en lugar de […]

Cómo crear una red bipartita en R con igraph o tnet

Tengo un edgelist para una red de dos modos, similar a esto: person Event Amy football_game Sam picnic Bob art_show Quiero realizar un análisis sobre esto en R, pero aparentemente todo lo que bash falla. Convertirlo a una red de un modo se topa con limitaciones de memoria, y no puedo entender cómo analizarlo como […]

Manejar valores perdidos continuos en datos de series de tiempo

Tengo una serie de tiempo de datos como se muestra a continuación. 2015-04-26 23:00:00 5704.27388916015661380 2015-04-27 00:00:00 4470.30868326822928793 2015-04-27 01:00:00 4552.57241617838553793 2015-04-27 02:00:00 4570.22250032825650123 2015-04-27 03:00:00 NA 2015-04-27 04:00:00 NA 2015-04-27 05:00:00 NA 2015-04-27 06:00:00 12697.37724086216439900 2015-04-27 07:00:00 5538.71119009653739340 2015-04-27 08:00:00 81.95060647328695325 2015-04-27 09:00:00 8550.65816895300667966 2015-04-27 10:00:00 2925.76573206583680076 ¿Cómo debo manejar los valores de NA […]

Cómo encontrar los índices de los 10 000 elementos principales en una matriz simétrica (12k X 12k) en R

Tengo una matriz simétrica no nula ‘matr’ que es 12000X12000. Necesito encontrar los índices de los 10000 elementos superiores en ‘matr’ en R. El código que he escrito toma mucho tiempo; me preguntaba si había algún indicio para hacerlo más rápido. listk <- numeric(0) for( i in 1:10000) { idx <- which(matr == max(matr), arr.ind=T) […]

¿Por qué este comportamiento al forzar una lista de caracteres a través de as.character ()?

En el proceso de (principalmente) responder a esta pregunta, me encontré con algo que siento que ya debería haber visto antes. Digamos que tienes una lista: l <- list(a = 1:3, b = letters[1:3], c = runif(3)) Intentar forzar l a varios tipos devuelve un error: > as.numeric(l) Error: (list) object cannot be coerced to […]

Interpolar los valores de NA

Tengo dos conjuntos de muestras que son independientes del tiempo. Me gustaría fusionarlos y calcular los valores perdidos para los momentos en los que no tengo valores de ambos. Ejemplo simplificado: A <- cbind(time=c(10, 20, 30, 40, 50, 60, 70, 80, 90, 100), Avalue=c(1, 2, 3, 2, 1, 2, 3, 2, 1, 2)) B <- […]