Articles of r

Aplicar una función a un subconjunto de columnas data.table, por column-indices en lugar de name

Intento aplicar una función a un grupo de columnas en una gran tabla de datos sin referirme a cada una individualmente. a <- data.table( a=as.character(rnorm(5)), b=as.character(rnorm(5)), c=as.character(rnorm(5)), d=as.character(rnorm(5)) ) b <- c('a','b','c','d') con el MWE anterior, esto: a[,b=as.numeric(b),with=F] funciona, pero esto: a[,b[2:3]:=data.table(as.numeric(b[2:3])),with=F] no funciona ¿Cuál es la forma correcta de aplicar la función as.numeric a […]

porcentaje en y lab en un diagtwig de barras ggplot facetado?

haciendo facetas en ggplot A menudo me gustaría usar el porcentaje en lugar de conteos. p.ej test1 <- sample(letters[1:2], 100, replace=T) test2 <- sample(letters[3:8], 100, replace=T) test <- data.frame(cbind(test1,test2)) ggplot(test, aes(test2))+geom_bar()+facet_grid(~test1) Esto es muy fácil, pero si N es diferente en la faceta A en comparación con la faceta B, sería mejor, creo, comparar porcentajes, […]

Equivalente de la curva () para ggplot

¿Hay un método equivalente para trazar funciones usando ggplot al comando curve() empleado en gráficos base? Supongo que la alternativa sería crear un vector de valores de la función y trazar una línea conectada, pero esperaba algo un poco más simple. ¡Gracias!

knitr / rmarkdown / Latex: ¿Cómo referenciar figuras y tablas?

Estoy intentando hacer referencias cruzadas de figuras y tablas en un PDF producido con knitr / rmarkdown. Hay algunas preguntas sobre SO y tex.stackexchange ( aquí y aquí , por ejemplo), que sugieren que la manera de hacerlo en línea es agregar \ref{fig:my_fig} , donde my_fig es la etiqueta del fragmento. Sin embargo, cuando lo […]

¿Hay alguna forma de manipular los saltos de escala y las tags de ggplot?

ggplot generalmente hace un buen trabajo al crear ggplot y tags sensibles en escalas. Sin embargo, me parece que en la ttwig con muchas facetas y tal vez una instrucción formatter= , las tags tienden a ser demasiado “densas” y sobreimprimir, por ejemplo en esta imagen: df <- data.frame( fac=rep(LETTERS[1:10], 100), x=rnorm(1000) ) ggplot(df, aes(x=x)) […]

Agote el tiempo de un comando R a través de algo como try ()

Estoy ejecutando una gran cantidad de iteraciones en paralelo. Ciertos iterados tardan mucho (digamos 100x) más que otros. Quiero cronometrarlos, pero prefiero no tener que profundizar en el código C detrás de la función (llámalo fun.c) haciendo el trabajo pesado. Espero que haya algo similar a try () pero con una opción time.out. Entonces podría […]

Cómo escribir a json con niños de R

Quiero convertir un R data.frame en un objeto JSON para usarlo para preparar visualizaciones de datos con d3.js. Encontré muchas preguntas que preguntaban cómo hacer que JSON entrara en R, pero muy pocas sobre cómo escribir datos de R a JSON. Un problema particular es que el archivo JSON debe estar nested utilizando factores, es […]

¿Cómo uso las cookies con RCurl?

Intento escribir un paquete R que acceda a algunos datos a través de una API REST. La API, sin embargo, no usa la autenticación http, sino que confía en las cookies para conservar las credenciales con la sesión. Esencialmente, me gustaría reemplazar las dos líneas siguientes de un script bash con dos funciones R: una […]

Sugerencias para acelerar los Bosques Aleatorios

Estoy trabajando con el paquete randomForest y, aunque funciona bien, puede llevar mucho tiempo. ¿Alguien tiene alguna sugerencia para acelerar las cosas? Estoy usando una caja de Windows 7 con un chip AMD de doble núcleo. Sé que R no es multiprocesador / procesador, pero sentía curiosidad por si alguno de los paquetes paralelos ( […]

¿Cómo puedo nombrar la columna “nombres de fila” en r

Estoy trabajando con un dataframe en donde mis nombres de fila son significativos. Por lo tanto, me gustaría dar un nombre a la columna de nombres de filas. ¿Cómo hago esto?