Cómo filtrar de manera eficiente un dataframe?

Tengo un dataframe e intenté seleccionar solo las observaciones que me interesan con esto:

data[data["Var1"]>10] 

Desafortunadamente, este comando destruye la estructura de data.frame y devuelve un vector largo.

Lo que quiero obtener es el dataframe acortado por las observaciones que no coinciden con mis criterios.

Te falta una coma en tu statement.

Prueba esto:

 data[data[, "Var1"]>10, ] 

O:

 data[data$Var1>10, ] 

O:

 subset(data, Var1>10) 

Como ejemplo, pruébelo en el conjunto de datos mtcars , mtcars

 data(mtcars) mtcars[mtcars[, "mpg"]>25, ] mpg cyl disp hp drat wt qsec vs am gear carb Fiat 128 32.4 4 78.7 66 4.08 2.200 19.47 1 1 4 1 Honda Civic 30.4 4 75.7 52 4.93 1.615 18.52 1 1 4 2 Toyota Corolla 33.9 4 71.1 65 4.22 1.835 19.90 1 1 4 1 Fiat X1-9 27.3 4 79.0 66 4.08 1.935 18.90 1 1 4 1 Porsche 914-2 26.0 4 120.3 91 4.43 2.140 16.70 0 1 5 2 Lotus Europa 30.4 4 95.1 113 3.77 1.513 16.90 1 1 5 2 mtcars[mtcars$mpg>25, ] mpg cyl disp hp drat wt qsec vs am gear carb Fiat 128 32.4 4 78.7 66 4.08 2.200 19.47 1 1 4 1 Honda Civic 30.4 4 75.7 52 4.93 1.615 18.52 1 1 4 2 Toyota Corolla 33.9 4 71.1 65 4.22 1.835 19.90 1 1 4 1 Fiat X1-9 27.3 4 79.0 66 4.08 1.935 18.90 1 1 4 1 Porsche 914-2 26.0 4 120.3 91 4.43 2.140 16.70 0 1 5 2 Lotus Europa 30.4 4 95.1 113 3.77 1.513 16.90 1 1 5 2 subset(mtcars, mpg>25) mpg cyl disp hp drat wt qsec vs am gear carb Fiat 128 32.4 4 78.7 66 4.08 2.200 19.47 1 1 4 1 Honda Civic 30.4 4 75.7 52 4.93 1.615 18.52 1 1 4 2 Toyota Corolla 33.9 4 71.1 65 4.22 1.835 19.90 1 1 4 1 Fiat X1-9 27.3 4 79.0 66 4.08 1.935 18.90 1 1 4 1 Porsche 914-2 26.0 4 120.3 91 4.43 2.140 16.70 0 1 5 2 Lotus Europa 30.4 4 95.1 113 3.77 1.513 16.90 1 1 5 2 

Otro método que utiliza el paquete dplyr:

 library(dplyr) df < - mtcars %>% filter(mpg > 25) 

Sin el operador de cadena (%>%):

 library(dplyr) df < - filter(mtcars, mpg > 25)