Peki o zaman: R dünyasına hoş geldiniz ;-)
Hadi bakalım
Kodun ayarlanması
urls <- c(
"http://stat.ethz.ch/R-manual/R-devel/library/base/html/connections.html",
"http://en.wikipedia.org/wiki/Xz",
"xxxxx"
)
readUrl <- function(url) {
out <- tryCatch(
{
# Just to highlight: if you want to use more than one
# R expression in the "try" part then you'll have to
# use curly brackets.
# 'tryCatch()' will return the last evaluated expression
# in case the "try" part was completed successfully
message("This is the 'try' part")
readLines(con=url, warn=FALSE)
# The return value of `readLines()` is the actual value
# that will be returned in case there is no condition
# (e.g. warning or error).
# You don't need to state the return value via `return()` as code
# in the "try" part is not wrapped insided a function (unlike that
# for the condition handlers for warnings and error below)
},
error=function(cond) {
message(paste("URL does not seem to exist:", url))
message("Here's the original error message:")
message(cond)
# Choose a return value in case of error
return(NA)
},
warning=function(cond) {
message(paste("URL caused a warning:", url))
message("Here's the original warning message:")
message(cond)
# Choose a return value in case of warning
return(NULL)
},
finally={
# NOTE:
# Here goes everything that should be executed at the end,
# regardless of success or error.
# If you want more than one expression to be executed, then you
# need to wrap them in curly brackets ({...}); otherwise you could
# just have written 'finally=<expression>'
message(paste("Processed URL:", url))
message("Some other message at the end")
}
)
return(out)
}
Kodu uygulama
> y <- lapply(urls, readUrl)
Processed URL: http://stat.ethz.ch/R-manual/R-devel/library/base/html/connections.html
Some other message at the end
Processed URL: http://en.wikipedia.org/wiki/Xz
Some other message at the end
URL does not seem to exist: xxxxx
Here's the original error message:
cannot open the connection
Processed URL: xxxxx
Some other message at the end
Warning message:
In file(con, "r") : cannot open file 'xxxxx': No such file or directory
Çıktıyı inceleme
> head(y[[1]])
[1] "<!DOCTYPE html PUBLIC \"-//W3C//DTD HTML 4.01 Transitional//EN\">"
[2] "<html><head><title>R: Functions to Manipulate Connections</title>"
[3] "<meta http-equiv=\"Content-Type\" content=\"text/html; charset=utf-8\">"
[4] "<link rel=\"stylesheet\" type=\"text/css\" href=\"R.css\">"
[5] "</head><body>"
[6] ""
> length(y)
[1] 3
> y[[3]]
[1] NA
Ek açıklamalar
tryCatch
tryCatch
expr
bir hata veya uyarı olmadığı sürece yürütmeyle ilişkili değeri döndürür . Bu durumda, belirli bir dönüş değerleri (bkz return(NA)
yukarıda) karşılık gelen bir işleyici işlevi (bağımsız değişkenler bkz sağlayarak belirlenebilir error
ve warning
içinde ?tryCatch
). Bunlar zaten var olan işlevler olabilir, ancak bunları tryCatch()
(yukarıda yaptığım gibi) içinde de tanımlayabilirsiniz .
İşleyici işlevlerinin belirli dönüş değerlerini seçmenin sonuçları
Biz o belirttiğiniz gibi NA
hata durumunda iade edilmelidir, üçüncü unsur y
olduğunu NA
. Biz seçmiş olsaydın NULL
dönüş değeri, uzunluğunu olmak y
sadece olurdu 2
yerine 3
olarak lapply()
sade dönüş değerleri "yok saymak" olacaktır NULL
. Ayrıca , üzerinden açık bir dönüş değeri belirtmezseniz return()
, işleyici işlevlerinin geri döneceğini unutmayın NULL
(örn. Bir hata veya uyarı durumunda).
"İstenmeyen" uyarı mesajı
As warn=FALSE
kullanımına herhangi bir etkisi, (bu durumda gerçekten ilgi değil) uyarıyı bastırmak için alternatif bir yolu var gibi görünmüyor
suppressWarnings(readLines(con=url))
onun yerine
readLines(con=url, warn=FALSE)
Birden çok ifade
Ayrıca (argüman "fiili ifadeler parçası" birden ifadeleri koyabilmesi Not expr
ait tryCatch()
(Ben gösterildiği gibi süslü parantez koymayı varsa) finally
kısmı).
paste
Fonksiyonlarınızdaki ilk dizenin bir boşlukla bittiği göz önüne alındığında , neden boşluk vesep=""
?