Articles of r

cómo leer datos en formato utf-8 en R?

Mi sistema: win7 + R-3.0.2. > Sys.getlocale() [1] “LC_COLLATE=Chinese (Simplified)_People’s Republic of China.936;LC_CTYPE=Chinese (Simplified)_People’s Republic of China.936;LC_MONETARY=Chinese (Simplified)_People’s republic of China.936;LC_NUMERIC=C;LC_TIME=Chinese (Simplified)_People’s Republic of China.936” Hay dos archivos con el mismo contenido guardado en el bloc de notas de microsoft: uno se guarda como formato ansi, el otro se guarda como formato utf8. Los datos […]

R: rvest: raspando una página dinámica de comercio electrónico

Estoy usando rvest en R para hacer un poco de raspado. Sé algo de HTML y CSS. Quiero obtener los precios de cada producto de un URI: http://www.linio.com.co/tecnologia/celulares-telefonia-gps/ Los nuevos elementos se cargan a medida que avanzas en la página (a medida que avanzas en el desplazamiento). Lo que he hecho hasta ahora Linio_Celulares % […]

R – Encontrar el punto vecino más cercano y el número de vecinos dentro de un radio dado, coordenadas de latitud larga

Estoy tratando de averiguar qué tan aislados están ciertos puntos dentro de mi conjunto de datos. Estoy usando dos métodos para determinar el aislamiento, la distancia del vecino más cercano y el número de sitios vecinos dentro de un radio dado. Todas mis coordenadas están en latitud y longitud Así es como se ven mis […]

controlando el orden de puntos en ggplot2 en R?

Supongamos que estoy trazando un diagtwig de dispersión densa en ggplot2 en R, donde cada punto puede etiquetarse con un color diferente: df <- data.frame(x=rnorm(500)) df$y = rnorm(500)*0.1 + df$x df$label <- c("a") df$label[50] <- "point" df$size <- 2 ggplot(df) + geom_point(aes(x=x, y=y, color=label, size=size)) Cuando hago esto, el punto de dispersión etiquetado como “punto” […]

Importar datos en R con un número desconocido de columnas?

Intento leer un archivo de texto con diferentes longitudes de fila: 1 1 2 1 2 3 1 2 3 4 1 2 3 4 5 1 2 3 4 5 6 1 2 3 4 5 6 7 1 2 3 4 5 6 7 8 Para superar este problema, estoy usando el argumento […]

Genera una lista de números primos hasta cierto número

Intento generar una lista de primos por debajo de mil millones. Estoy intentando esto, pero este tipo de estructura es bastante mierda. ¿Alguna sugerencia? a <- 1:1000000000 d <- 0 b <- for (i in a) {for (j in 1:i) {if (i %% j !=0) {d <- c(d,i)}}}

Subconjunto y ggplot2

Tengo un problema para trazar un subconjunto de un dataframe con ggplot2. Mi df es como: ID Value1 Value2 P1 100 12 P1 120 13 … P2 300 11 P2 400 16 … P3 130 15 P3 140 12 … ¿Cómo puedo ahora trazar Value1 vs Value2 solo para IDs P1 y P3? Por ejemplo, […]

Creando variables ficticias en R data.table

Estoy trabajando con un conjunto de datos extremadamente grande en R y he estado operando con marcos de datos y he decidido cambiar a data.tables para acelerar las operaciones. Tengo problemas para entender las operaciones J, en particular estoy intentando generar variables ficticias, pero no puedo descifrar cómo codificar las operaciones condicionales en data.tables []. […]

¿Cómo subconjunto un dataframe por un factor y repetir un diagtwig para cada subconjunto?

Soy nuevo en R. Perdóname si esto si esta pregunta tiene una respuesta obvia pero no he podido encontrar una solución. Tengo experiencia con SAS y puedo estar pensando en este problema de la manera incorrecta. Tengo un conjunto de datos con medidas repetidas de cientos de sujetos y cada sujeto tiene múltiples medidas en […]

¿Cuál es el argumento de ancho en position_dodge?

La documentación no explica qué es exactamente este argumento de width Cuyo ancho especifica? ¿Cuál es la “unidad”? ¿Cuál es el valor predeterminado? El valor predeterminado es width = NULL , pero el width = NULL prueba y error muestra que width = 0.9 parece producir el efecto predeterminado (ver postscript). Sin embargo, no pude […]