Articles of r

Cambie las celdas en blanco a “NA”

Aquí está el enlace de mis datos. Mi objective es asignar “NA” a todas las celdas en blanco, independientemente de los valores categóricos o numéricos. Estoy usando na.strings = “” . Pero no asigna NA a todas las celdas en blanco. ## reading the data dat <- read.csv("data2.csv") head(dat) mon hr acc alc sex spd […]

Contar valores únicos

Digamos que tengo: v = rep(c(1,2, 2, 2), 25) Ahora, quiero contar la cantidad de veces que aparece cada valor único. unique(v) devuelve cuáles son los valores únicos, pero no cuántos son. > unique(v) [1] 1 2 Quiero algo que me dé length(v[v==1]) [1] 25 length(v[v==2]) [1] 75 pero como un one-liner más general 🙂 […]

Seleccionar filas donde una columna tiene una cadena como ‘hsa ..’ (coincidencia de cadena parcial)

Tengo un archivo de texto de 371MB que contiene datos de micro ARN. Básicamente, me gustaría seleccionar solo aquellas filas que tienen información sobre microRNA humano. He leído en el archivo usando read.table. Por lo general, lograría lo que quisiera con sqldf, si tuviera una syntax similar (seleccione * de donde miRNA como ‘hsa’). Desafortunadamente, […]

Creciendo un data.frame de una manera eficiente con la memoria

De acuerdo con Crear un dataframe R fila por fila , no es ideal data.frame a un data.frame utilizando rbind , ya que crea una copia del cuadro de datos completo cada vez. ¿Cómo acumulo datos en R resultan en un data.frame sin incurrir en esta penalización? El formato intermedio no necesita ser un data.frame […]

¿Cómo formatear un número como porcentaje en R?

Una de las cosas que solía dejarme perplejo como un recién llegado a R era cómo formatear un número como un porcentaje para la impresión. Por ejemplo, muestre 0.12345 como 12.345% . Tengo una serie de soluciones para esto, pero ninguno de estos parece ser “nuevo por amigos”. Por ejemplo: set.seed(1) m <- runif(5) paste(round(100*m, […]

Obtiene un objeto específico del archivo Rdata

Tengo un archivo Rdata que contiene varios objetos: New.Rdata |_ Object 1 (eg data.frame) |_ Object 2 (eg matrix) |_… |_ Object n Por supuesto, puedo cargar el dataframe con load(‘New.Rdata’) , sin embargo, ¿hay alguna manera inteligente de cargar solo un objeto específico de este archivo y descartar los otros?

Agregar una columna a un data.frame

Tengo el data.frame a continuación. Quiero agregar una columna que clasifique mis datos de acuerdo con la columna 1 ( h_no ) de esa manera que la primera serie de h_no 1,2,3,4 sea de clase 1, la segunda serie de h_no (de 1 a 7) sea de clase 2 etc. como se indica en la […]

Trazar Intervalos de Confianza

Dejar F muestra 10 valores ajustados, por ejemplo F = runif(10,1,2) L muestra el límite inferior de estos 10 valores ajustados, digamos L = runif(10,0,1) U muestra el límite superior de estos 10 valores ajustados, decir U = runif(10,2,3) ¿Cómo puedo mostrar estos 10 valores ajustados y sus intervalos de confianza en la misma ttwig […]

Etiquetar puntos en geom_point

Los datos con los que estoy jugando provienen de la fuente de Internet que figura a continuación nba <- read.csv("http://datasets.flowingdata.com/ppg2008.csv", sep=",") Lo que quiero hacer es crear un gráfico de puntos 2D que compare dos métricas de esta tabla, con cada jugador representando un punto en el gráfico. Tengo el siguiente código: nbaplot <- ggplot(nba, […]

Guardando grilla grid.arrange () para archivar

ggplot2 trazar múltiples diagtwigs usando ggplot2 , organizándolos usando grid.arrange() . Desde que logré encontrar a alguien que describa el problema exacto que tengo, he citado la descripción del problema desde el enlace : Cuando uso ggsave() después de grid.arrange() , es decir grid.arrange(sgcir1,sgcir2,sgcir3,ncol=2,nrow=2) ggsave(“sgcirNIR.jpg”) No guardo el gráfico de cuadrícula sino el último ggplot […]