Cómo escribir trycatch en R

Deseo escribir el código de trycatch para tratar el error de descarga desde la web.

 url <- c( "http://stat.ethz.ch/R-manual/R-devel/library/base/html/connections.html", "http://en.wikipedia.org/wiki/Xz") y <- mapply(readLines, con=url) 

Estas dos declaraciones se ejecutan con éxito. A continuación, creo una dirección web que no existe:

 url <- c("xxxxx", "http://en.wikipedia.org/wiki/Xz") 

url[1] no existe. ¿Cómo se escribe un ciclo de trycatch (función) para que:

  1. Cuando la URL es incorrecta, el resultado será: “la URL web es incorrecta, no se puede obtener”.
  2. Cuando la URL es incorrecta, el código no se detiene, pero continúa la descarga hasta el final de la lista de URL.

Bien, entonces: bienvenidos al mundo R 😉

Aqui tienes

Configurando el código

 urls < - c( "http://stat.ethz.ch/R-manual/R-devel/library/base/html/connections.html", "http://en.wikipedia.org/wiki/Xz", "xxxxx" ) readUrl <- function(url) { out <- tryCatch( { # Just to highlight: if you want to use more than one # R expression in the "try" part then you'll have to # use curly brackets. # 'tryCatch()' will return the last evaluated expression # in case the "try" part was completed successfully message("This is the 'try' part") readLines(con=url, warn=FALSE) # The return value of `readLines()` is the actual value # that will be returned in case there is no condition # (eg warning or error). # You don't need to state the return value via `return()` as code # in the "try" part is not wrapped insided a function (unlike that # for the condition handlers for warnings and error below) }, error=function(cond) { message(paste("URL does not seem to exist:", url)) message("Here's the original error message:") message(cond) # Choose a return value in case of error return(NA) }, warning=function(cond) { message(paste("URL caused a warning:", url)) message("Here's the original warning message:") message(cond) # Choose a return value in case of warning return(NULL) }, finally={ # NOTE: # Here goes everything that should be executed at the end, # regardless of success or error. # If you want more than one expression to be executed, then you # need to wrap them in curly brackets ({...}); otherwise you could # just have written 'finally=' message(paste("Processed URL:", url)) message("Some other message at the end") } ) return(out) } 

Aplicando el código

 > y < - lapply(urls, readUrl) Processed URL: http://stat.ethz.ch/R-manual/R-devel/library/base/html/connections.html Some other message at the end Processed URL: http://en.wikipedia.org/wiki/Xz Some other message at the end URL does not seem to exist: xxxxx Here's the original error message: cannot open the connection Processed URL: xxxxx Some other message at the end Warning message: In file(con, "r") : cannot open file 'xxxxx': No such file or directory 

Investigando la salida

 > head(y[[1]]) [1] "< !DOCTYPE html PUBLIC \"-//W3C//DTD HTML 4.01 Transitional//EN\">" [2] "R: Functions to Manipulate Connections" [3] "" [4] "" [5] "" [6] "" > length(y) [1] 3 > y[[3]] [1] NA 

Observaciones adicionales

trata de atraparlo

tryCatch devuelve el valor asociado a la ejecución de expr menos que haya un error o una advertencia. En este caso, los valores de devolución específicos (ver return(NA) arriba) pueden especificarse suministrando una función de controlador respectiva (ver los argumentos de error y warning en ?tryCatch ). Estas pueden ser funciones que ya existen, pero también puedes definirlas dentro de tryCatch() (como hice anteriormente).

Las implicaciones de elegir valores de retorno específicos de las funciones del manejador

Como hemos especificado que NA debe devolverse en caso de error, el tercer elemento en y es NA . Si hubiéramos elegido NULL para ser el valor de retorno, la longitud de y habría sido 2 lugar de 3 ya que lapply() simplemente "ignorará" los valores de retorno que son NULL . También tenga en cuenta que si no especifica un valor de retorno explícito a través de return() , las funciones del manejador devolverán NULL (es decir, en caso de un error o una condición de advertencia).

Mensaje de advertencia "no deseado"

Como warn=FALSE no parece tener ningún efecto, una forma alternativa de suprimir la advertencia (que en este caso no es realmente de interés) es usar

 suppressWarnings(readLines(con=url)) 

en lugar de

 readLines(con=url, warn=FALSE) 

Expresiones múltiples

Tenga en cuenta que también puede colocar múltiples expresiones en la "parte real de expresiones" (argumento expr de tryCatch() ) si las tryCatch() entre llaves (como lo ilustré en la parte finally ).

R usa funciones para implementar el bloque try-catch:

La syntax se parece así a esto:

 result = tryCatch({ expr }, warning = function(warning_condition) { warning-handler-code }, error = function(error_condition) { error-handler-code }, finally={ cleanup-code }) 

En tryCatch () hay dos ‘condiciones’ que se pueden manejar: ‘advertencias’ y ‘errores’. Lo importante para entender al escribir cada bloque de código es el estado de ejecución y el scope. @fuente

Aquí va un ejemplo directo :

 # Do something, or tell me why it failed my_update_function < - function(x){ tryCatch( # This is what I want to do: y = x * 2 return(y) , # ... but if an error occurs, tell me what happened: error=function(error_message) { message("My message is here!") message("And below is the error message from R:") message(error_message) return(NA) } ) } 

Si también desea capturar una "advertencia", simplemente agregue warning= similar a error= part.

Como acabo de perder dos días de mi vida tratando de encontrar TryCatch para una función irr, pensé que debería compartir mi sabiduría (y lo que falta). FYI – irr es una función real de FinCal en este caso donde se obtuvieron errores en algunos casos en un gran conjunto de datos.

  1. Configure tryCatch como parte de una función. Por ejemplo:

     irr2 < - function (x) { out <- tryCatch(irr(x), error = function(e) NULL) return(out) } 
  2. Para que el error (o advertencia) funcione, realmente necesita crear una función. Originalmente para la parte de error simplemente escribí error = return(NULL) y TODOS los valores regresaron nulos.

  3. Recuerde crear un subproducto (como mi "salida") y para return(out) .