Articles of dataframe

Cambiar el nombre de varias columnas por nombre

Alguien debería haber preguntado esto, pero no pude encontrar una respuesta. Digamos que tengo: x = data.frame(q=1,w=2,e=3, …and many many columns…) ¿Cuál es la forma más elegante de cambiar el nombre de un subconjunto arbitrario de columnas, cuya posición no conozco necesariamente, por otros nombres arbitrarios? por ejemplo, decir que quiero cambiar el nombre “q” […]

Reste una columna en un dataframe de muchas columnas en R

Tengo un dataframe. Me gustaría restar la 2da columna de todas las demás columnas. Puedo hacerlo en un bucle, pero me gustaría hacerlo en una sola llamada. Aquí está mi código de bucle de trabajo: df <- data.frame(x = 100:101, y = 2:3,z=3:4,a = -1:0,b=4:5) for( i in 3:length(df) ) { df[i] <- df[i] – […]

Dividir un data.frame por una variable

Tengo datos de varios temas almacenados en un solo archivo CSV. Después de importar el archivo CSV, me gustaría dividir los datos de cada participante en su propio data.frame. Más literalmente, me gustaría tomar los datos de ejemplo a continuación, y crear tres nuevos data.frames; uno para cada uno de los valores ‘subject_initials’. ¿Cómo hago […]

R: divide la lista no balanceada en la columna data.frame

Supongamos que tiene un dataframe con la siguiente estructura: df <- data.frame(a=c(1,2,3,4), b=c("job1;job2", "job1a", "job4;job5;job6", "job9;job10;job11")) donde la columna b es una lista delimitada por punto y coma (desequilibrada por fila). El data.frame ideal sería: id,job,jobNum 1,job1,1 1,job2,2 … 3,job6,3 4,job9,1 4,job10,2 4,job11,3 Tengo una solución parcial que toma casi 2 horas (170K filas): # […]

Spark SQL y MySQL- SaveMode.Overwrite no insertando datos modificados

Tengo una tabla de test en MySQL con id y nombre como a continuación: +—-+——-+ | id | name | +—-+——-+ | 1 | Name1 | +—-+——-+ | 2 | Name2 | +—-+——-+ | 3 | Name3 | +—-+——-+ Estoy usando Spark DataFrame para leer estos datos (usando JDBC) y modificar los datos como este […]

Cómo inicializar el dataframe vacío (lote de columnas al mismo tiempo) en R

Encontré cómo inicializar un dataframe vacío con 3 o 4 dimensiones. Es como df <- data.frame(Date=as.Date(character()), File=character(), User=numeric(), stringsAsFactors=FALSE) Sin embargo, ¿cuál es la forma más efectiva de inicializar un data.frame vacío con muchos nombres de columna? me gusta mynames <- paste("hello", c(1:10000)) La manera incorrecta que probé es: df <- data.frame(mynames=numeric()) Muchas gracias de […]

¿Cómo agregar una columna de factores al dataframe basado en una statement condicional de otra columna?

Tengo un dataframe para el cual necesito agregar una columna de factores basada en una statement condicional. Aquí están los datos . Código: morstats.agri.f <- moroccostats[c("year","agVA_g","agVA_ppp_g")] morstats.agri.f Pregunta: Entonces, quiero agregar una columna “período marco” al dataframe que tiene dos entradas: “pre-1991” y “post-1991” en base a la condición para la columna “año”. el dataframe […]

Recombining una lista de Data.frames en un solo dataframe

Lo siento si esta pregunta ya ha sido respondida. Además, esta es mi primera vez en stackoverflow. Tengo una pregunta para principiantes R sobre listas, marcos de datos y merge() y / o rbind() . Empecé con un Panel que se parece a esto COUNTRY YEAR VAR A 1 A 2 B 1 B 2 […]

Calcular medios de fila en un subconjunto de columnas

Dado un dataframe de muestra: C1<-c(3,2,4,4,5) C2<-c(3,7,3,4,5) C3<-c(5,4,3,6,3) DF<-data.frame(ID=c("A","B","C","D","E"),C1=C1,C2=C2,C3=C3) DF ID C1 C2 C3 1 A 3 3 5 2 B 2 7 4 3 C 4 3 3 4 D 4 4 6 5 E 5 5 3 ¿Cuál es la mejor manera de crear un segundo dataframe que contendría la columna ID y […]

Repita data.frame N veces

Tengo el siguiente dataframe data.frame(a = c(1,2,3),b = c(1,2,3)) ab 1 1 1 2 2 2 3 3 3 y quiero convertirlo en ab 1 1 1 2 2 2 3 3 3 4 1 1 5 2 2 6 3 3 7 1 1 8 2 2 9 3 3 o repítelo N veces. […]