Articles of r

Fusionando dos marcos de datos usando coincidencia de cadenas difusa / aproximada en R

DESCRIPCIÓN Tengo dos conjuntos de datos con información que necesito fusionar. Los únicos campos comunes que tengo son cadenas que no coinciden perfectamente y un campo numérico que puede ser sustancialmente diferente La única forma de explicar el problema es mostrarle los datos. Aquí está a.csv y b.csv . Estoy intentando fusionar B con A. […]

R que resume columnas múltiples con data.table

Estoy tratando de usar data.table para acelerar el procesamiento de un gran data.frame (300k x 60) hecho de varios data.frames fusionados más pequeños. Soy nuevo en data.table. El código hasta ahora es el siguiente library(data.table) a = data.table(index=1:5,a=rnorm(5,10),b=rnorm(5,10),z=rnorm(5,10)) b = data.table(index=6:10,a=rnorm(5,10),b=rnorm(5,10),c=rnorm(5,10),d=rnorm(5,10)) dt = merge(a,b,by=intersect(names(a),names(b)),all=T) dt$category = sample(letters[1:3],10,replace=T) y me preguntaba si había una manera más […]

Looping a través de todos los archivos en el directorio en R, aplicando múltiples comandos

Necesito aplicar un conjunto de comandos en R a todos los archivos .txt individuales (alrededor de 300) en un directorio. No estoy muy familiarizado con R, por lo que toda la ayuda que he analizado en línea sobre el bucle es confusa, o no puedo encontrar la forma de aplicar un bucle cuando necesita aplicar […]

¿Cómo calcular el número de ocurrencias de un personaje dado en cada fila de una columna de cadenas?

Tengo un data.frame en el que ciertas variables contienen una cadena de texto. Deseo contar el número de ocurrencias de un personaje dado en cada cadena individual. Ejemplo: q.data<-data.frame(number=1:3, string=c("greatgreat", "magic", "not")) Deseo crear una nueva columna para q.data con el número de ocurrencia de “a” en cadena (es decir, c (2,1,0)). El único enfoque […]

cómo encontrar los N valores superiores por grupo o dentro de la categoría (groupwise) en un R data.frame

mis disculpas si esto es un duplicado esto parece una pregunta que SO habría respondido hace mucho tiempo, pero investigué bastante y no pude encontrar nada que respondiera específicamente a esto. hay muchas preguntas relacionadas que podrían usarse para responder esto, pero pensé que debería responderse formalmente. esto es en respuesta a esta pregunta formulada […]

Reordenar barras en geom_bar ggplot2

Estoy tratando de hacer un diagtwig de barras donde la ttwig se ordena desde el miRNA con el value más alto hasta el miRNA con el más bajo. ¿Por qué mi código no funciona? > head(corr.m) miRNA variable value 1 mmu-miR-532-3p pos 7 2 mmu-miR-1983 pos 75 3 mmu-miR-301a-3p pos 70 4 mmu-miR-96-5p pos 5 […]

¿Hay alguna manera de usar dos declaraciones ‘…’ en una función en R?

Quiero escribir una función que llame tanto a plot() como a legend() y sería ideal si el usuario pudiera especificar una cantidad de argumentos adicionales que luego pasen a plot() o legend() . Sé que puedo lograr esto para una de las dos funciones usando … : foo.plot <- function(x,y,…) { plot(x,y,…) legend("bottomleft", "bar", pch=1) […]

Controlando el color de línea y el tipo de línea en la leyenda ggplot

Fondo En Alemania, hay 16 estados federales, diez de los cuales pertenecían a Alemania Occidental, seis de los cuales pertenecían a Alemania Oriental. En algunos aspectos, por ejemplo, las tasas de mortalidad de ciertos cánceres, existen diferencias persistentes entre los diez estados occidentales anteriores y los seis antiguos estados orientales. También hay diferencias entre los […]

Configuración manual de colores grupales para ggplot2

Tengo un conjunto de datos del cual tengo que hacer varias docenas de ttwigs. Los datos constan de 30 grupos y varias medidas dentro de cada grupo. La mayoría de las plots no usarán todos los grupos a la vez. Mi objective es tener una sola paleta de colores para el conjunto de grupos, de […]

Usar bucles con knitr para producir múltiples informes en PDF … necesito un poco de ayuda para superar la joroba

Antes que nada, debo admitir que soy muy nuevo en knitr y en el concepto de análisis reproducible, pero puedo ver su potencial para mejorar mi flujo de trabajo actual (que incluye mucho copiar y pegar en documentos de Word). A menudo tengo que producir múltiples informes por grupo (Hospital en este ejemplo) y dentro […]