Articles of r

Actualizar subconjunto de data.table basado en join

Tengo dos tablas de datos, DT1 y DT2: set.seed(1) DT1<-data.table(id1=rep(1:3,2),id2=sample(letters,6), v1=rnorm(6), key="id2") DT1 ## id1 id2 v1 ## 1: 2 e 0.7383247 ## 2: 1 g 1.5952808 ## 3: 2 j 0.3295078 ## 4: 3 n -0.8204684 ## 5: 3 s 0.5757814 ## 6: 1 u 0.4874291 DT2<-data.table(id2=c("n","u"), v1=0, key="id2") DT2 ## id2 v1 ## […]

Completa los valores faltantes por grupo en data.table

Si uno desea completar los valores perdidos de una variable en función de la observación anterior / posterior que no sea NA dentro de un grupo, el comando data.table es setkey(DT,id,date) DT[, value_filled_in := DT[!is.na(value), list(id, date, value)][DT[, list(id, date)], value, roll = TRUE]] que es bastante complejo. Es una pena, ya que el roll […]

Cómo escapar una barra invertida en R?

Estoy trabajando en R y tengo problemas para escapar de la barra invertida. Estoy usando la biblioteca stringr . install.packages(“stringr”, repos=’http://cran.us.r-project.org’) library(“stringr”) Me gustaría hacer str = str_replace_all(str, “\”, “”) Así que probé str = str_replace_all(str, “\\”, “”) pero no funcionará. ¿Que debería hacer?

R gotcha: lógico-y el operador para combinar condiciones es & no &&

¿Por qué el subset() funciona con un operador lógico y && combinando dos condiciones? > subset(tt, (customer_id==177 && visit_date==”2010-08-26″)) (or 0-length row.names) pero cada uno trabaja individualmente: > subset(tt, customer_id==177) > subset(tt, visit_date==”2010-08-26″) (¿Desea evitar el uso de grandes variables temporales? Mi conjunto de datos es enorme)

Filtro de dataframe por nombre de columna de caracteres (en dplyr)

Tengo un dataframe y quiero filtrarlo de una de dos maneras, ya sea por la columna “this” o la columna “that”. Me gustaría poder referirme al nombre de la columna como una variable. ¿Cómo (en dplyr , si eso hace una diferencia) me refiero a un nombre de columna por una variable? library(dplyr) df % […]

Muestra filas aleatorias dentro de cada grupo en un data.table

¿Cómo usará data.table para tomar eficientemente una muestra de filas dentro de cada grupo en un dataframe? DT = data.table(a = sample(1:2), b = sample(1:1000,20)) DT ab 1: 2 562 2: 1 183 3: 2 180 4: 1 874 5: 2 533 6: 1 21 7: 2 57 8: 1 20 9: 2 39 10: […]

Cómo mostrar la frecuencia en la parte superior de cada factor en una barra de barras en R

Posible duplicado: agregar texto a la barra horizontal en el eje R, y a diferentes escalas? Anotar valores por encima de las barras (ggplot facetado) Usando el siguiente código, espero mostrar un número sobre cada columna que corresponda al valor y de esa columna. En otras palabras, estoy tratando de obtener “QnWeight_initial” para mostrar 593 […]

Usar grep en R para buscar cadenas como palabras completas (pero no como cadenas como parte de las palabras)

Estoy buscando la expresión regular correcta. El seguimiento t1 = c(“IGF2, IGF2AS, INS, TH”, “TH”, “THZH”, “ZGTH”) grep(“TH”,t1, value=T) devuelve todos los elementos de t1 , pero solo el primero y el segundo son correctos. Solo quiero entradas con la palabra / frase TH devuelta?

Elimine toda la puntuación, excepto los apóstrofes en R

Me gustaría utilizar el gsub de R para eliminar toda la puntuación de un texto, excepto los apóstrofos. Soy bastante nuevo en Regex, pero estoy aprendiendo. Ejemplo: x <- "I like %$@to*&, chew;: gum, but don't like|}{[] bubble@#^)( gum!?" gsub("[[:punct:]]", "", as.character(x)) Salida actual (sin apóstrofes en no) [1] “I like to chew gum but […]

En `knitr` ¿cómo puedo probar si el resultado será PDF o Word?

Me gustaría incluir contenido específico según el formato que se está creando. En este ejemplo específico, mis tablas se ven terribles en la salida de MS word , pero son geniales en HTML . Me gustaría agregar algunas pruebas para dejar fuera de la tabla dependiendo de la salida. Aquí hay un pseudocódigo: output.format <- […]