Articles of subconjunto

La subconjunto de marcos de datos R da como resultado misteriosas filas de NA

He estado encontrando lo que creo que es un error. No es gran cosa, pero tengo curiosidad si alguien más ha visto esto. Lamentablemente, mis datos son confidenciales, así que tengo que inventar un ejemplo y no será muy útil. Al subconjunto de mis datos, de vez en cuando obtengo misteriosas filas de NA que […]

Dividir / subconjuntar un dataframe por factores en una columna

Mis datos son así (por ejemplo): ID Rate State 1 24 AL 2 35 MN 3 46 FL 4 34 AL 5 78 MN 6 99 FL Datos: structure(list(ID = 1:6, Rate = c(24L, 35L, 46L, 34L, 78L, 99L), State = structure(c(1L, 3L, 2L, 1L, 3L, 2L), .Label = c(“AL”,”FL”, “MN”), class = “factor”)), .Names […]

¿Cómo puedo subconjuntar filas en un dataframe en R basado en un vector de valores?

Tengo dos conjuntos de datos que se supone que son del mismo tamaño pero no lo son. Necesito recortar los valores de A que no están en B y viceversa para eliminar el ruido de un gráfico que va a un informe. (¡No se preocupe, estos datos no se eliminan permanentemente!) He leído lo siguiente: […]

Eliminar grupos con menos de tres observaciones únicas

Me gustaría subconjuntar mi dataframe para mantener solo los grupos que tienen 3 o más observaciones en DIFERENTES días. Quiero deshacerme de los grupos que tienen menos de 3 observaciones, o las observaciones que tienen no son de 3 días diferentes. Aquí hay un conjunto de datos de muestra: Group Day 1 1 1 3 […]

¿Cómo generar iterativamente subconjuntos de elementos k a partir de un conjunto de tamaño n en java?

Estoy trabajando en un rompecabezas que implica analizar todos los subconjuntos k de tamaño y descubrir cuál es el óptimo. Escribí una solución que funciona cuando el número de subconjuntos es pequeño, pero se queda sin memoria para problemas más grandes. Ahora trato de traducir una función iterativa escrita en python a java para poder […]

Actualizar subconjunto de data.table basado en join

Tengo dos tablas de datos, DT1 y DT2: set.seed(1) DT1<-data.table(id1=rep(1:3,2),id2=sample(letters,6), v1=rnorm(6), key="id2") DT1 ## id1 id2 v1 ## 1: 2 e 0.7383247 ## 2: 1 g 1.5952808 ## 3: 2 j 0.3295078 ## 4: 3 n -0.8204684 ## 5: 3 s 0.5757814 ## 6: 1 u 0.4874291 DT2<-data.table(id2=c("n","u"), v1=0, key="id2") DT2 ## id2 v1 ## […]

R gotcha: lógico-y el operador para combinar condiciones es & no &&

¿Por qué el subset() funciona con un operador lógico y && combinando dos condiciones? > subset(tt, (customer_id==177 && visit_date==”2010-08-26″)) (or 0-length row.names) pero cada uno trabaja individualmente: > subset(tt, customer_id==177) > subset(tt, visit_date==”2010-08-26″) (¿Desea evitar el uso de grandes variables temporales? Mi conjunto de datos es enorme)

Subconjunto y ggplot2

Tengo un problema para trazar un subconjunto de un dataframe con ggplot2. Mi df es como: ID Value1 Value2 P1 100 12 P1 120 13 … P2 300 11 P2 400 16 … P3 130 15 P3 140 12 … ¿Cómo puedo ahora trazar Value1 vs Value2 solo para IDs P1 y P3? Por ejemplo, […]

Cómo reemplazar NA con media por subconjunto en R (imputar con plyr?)

Tengo un dataframe con la longitud y el ancho de varios artrópodos de las entrañas de las salamandras. Debido a que algunas agallas tenían miles de ciertos artículos de presa, solo medí un subconjunto de cada tipo de presa. Ahora quiero reemplazar cada individuo no medido con el largo y ancho promedio para esa presa. […]

Los datos del subconjunto solo contienen columnas cuyos nombres coinciden con una condición

¿Hay alguna forma de subconjunto de datos en base a nombres de columna que comiencen con una cadena en particular? Tengo algunas columnas que son como ABC_1 ABC_2 ABC_3 y algunas como XYZ_1, XYZ_2,XYZ_3 digamos. ¿Cómo puedo subconjuntar mi df basado solo en columnas que contienen las partes de texto anteriores (digamos, ABC o XYZ […]