Articles of r

Lectura de 40 GB de archivo csv en R usando bigmemory

El título es bastante explicativo aquí, pero lo elaboraré de la siguiente manera. Algunas de mis técnicas actuales para atacar este problema se basan en las soluciones presentadas en esta pregunta. Sin embargo, me enfrento a varios desafíos y limitaciones, por lo que me preguntaba si alguien podría intentar atacar este problema. Estoy tratando de […]

Cambio de colores de línea con ggplot ()

No uso tanto ggplot2, pero hoy pensé en probar algunos gráficos. Pero no puedo entender cómo controlar manualmente los colores en geom_line() Estoy seguro de que estoy pasando por alto algo simple, pero aquí está mi código de prueba: x <- c(1:20, 1:20) variable <- c(rep("y1", 20), rep("y2", 20) ) value <- c(rnorm(20), rnorm(20,.5) ) […]

Generar contenedores desde un dataframe

Usando python, he creado el siguiente dataframe que contiene valores de similitud: cosinFcolor cosinEdge cosinTexture histoFcolor histoEdge histoTexture jaccard 1 0.770 0.489 0.388 0.57500000 0.5845137 0.3920000 0.00000000 2 0.067 0.496 0.912 0.13865546 0.6147309 0.6984127 0.00000000 3 0.514 0.426 0.692 0.36440678 0.4787535 0.5198413 0.05882353 4 0.102 0.430 0.739 0.11297071 0.5288008 0.5436508 0.00000000 5 0.560 0.735 0.554 […]

Previsión de datos de series de tiempo

Investigué un poco y estoy atascado en encontrar la solución. Tengo una serie de datos de tiempo, un dataframe muy básico, llamémoslo x : Date Used 11/1/2011 587 11/2/2011 578 11/3/2011 600 11/4/2011 599 11/5/2011 678 11/6/2011 555 11/7/2011 650 11/8/2011 700 11/9/2011 600 11/10/2011 550 11/11/2011 600 11/12/2011 610 11/13/2011 590 11/14/2011 595 11/15/2011 […]

filtrar por casos completos en data.frame utilizando dplyr (eliminación de mayúsculas y minúsculas)

¿Es posible filtrar un data.frame para casos completos usando dplyr? complete.cases con una lista de todas las variables funciona, por supuesto. Pero eso es a) detallado cuando hay muchas variables yb) imposible cuando los nombres de las variables no se conocen (por ejemplo, en una función que procesa cualquier data.frame). library(dplyr) df = data.frame( x1 […]

Crear un sistema de petición / respuesta para ingresar datos en R

Creé un código R para que lo usen personas que no saben nada de R (aunque yo también soy bastante verde). He estado haciendo que la gente pegue los datos iniciales en la consola R (con resultados mixtos) y esperaba configurar una forma más amigable para las personas de ingresar datos. Idealmente, alguien podría sentarse […]

Diagtwig de dispersión con barras de error

¿Cómo puedo generar el siguiente gráfico en R? Los puntos que se muestran en la gráfica son los promedios, y sus rangos corresponden a valores mínimos y máximos. Tengo datos en dos archivos (a continuación se muestra un ejemplo). xy 1 0.8773 1 0.8722 1 0.8816 1 0.8834 1 0.8759 1 0.8890 1 0.8727 2 […]

Cómo reemplazar NA con media por subconjunto en R (imputar con plyr?)

Tengo un dataframe con la longitud y el ancho de varios artrópodos de las entrañas de las salamandras. Debido a que algunas agallas tenían miles de ciertos artículos de presa, solo medí un subconjunto de cada tipo de presa. Ahora quiero reemplazar cada individuo no medido con el largo y ancho promedio para esa presa. […]

¿Por qué `vapply` es más seguro que` sapply`?

La documentación dice vapply es similar a sapply , pero tiene un tipo de valor de retorno previamente especificado, por lo que puede ser más seguro […] de usar. ¿Podrían explicar por qué es generalmente más seguro, tal vez dando ejemplos? PD: Conozco la respuesta y ya tiendo a evitar sapply . Solo desearía que […]

Captura del grupo Regex en R con múltiples grupos de captura

En R, ¿es posible extraer la captura de grupo de una coincidencia de expresión regular? Por lo que puedo decir, ninguno de grep , grepl , regexpr , gregexpr , sub o gsub devuelve las capturas de grupo. Necesito extraer pares clave-valor de cadenas que están codificadas así: \((.*?) :: (0\.[0-9]+)\) Siempre puedo hacer múltiples […]