Havayolu uçuşlarıyla ilgili bazı verilerim var (adı verilen bir veri çerçevesinde flights
) ve uçuş süresinin önemli ölçüde gecikmeli varış olasılığı (10 veya daha fazla dakika) üzerinde bir etkisi olup olmadığını görmek istiyorum. Uçuş regülatörü olarak uçuş süresi ve her uçuşun yanıt olarak önemli ölçüde geciktirilip geciktirilmeyeceği (bir demet Bernoullis) yanıtı olarak lojistik regresyon kullanacağımı düşündüm. Aşağıdaki kodu kullandım ...
flights$BigDelay <- flights$ArrDelay >= 10
delay.model <- glm(BigDelay ~ ArrDelay, data=flights, family=binomial(link="logit"))
summary(delay.model)
... ama aşağıdaki çıktıyı aldım.
> flights$BigDelay <- flights$ArrDelay >= 10
> delay.model <- glm(BigDelay ~ ArrDelay, data=flights, family=binomial(link="logit"))
Warning messages:
1: In glm.fit(x = X, y = Y, weights = weights, start = start, etastart = etastart, :
algorithm did not converge
2: In glm.fit(x = X, y = Y, weights = weights, start = start, etastart = etastart, :
fitted probabilities numerically 0 or 1 occurred
> summary(delay.model)
Call:
glm(formula = BigDelay ~ ArrDelay, family = binomial(link = "logit"),
data = flights)
Deviance Residuals:
Min 1Q Median 3Q Max
-3.843e-04 -2.107e-08 -2.107e-08 2.107e-08 3.814e-04
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -312.14 170.26 -1.833 0.0668 .
ArrDelay 32.86 17.92 1.833 0.0668 .
---
Signif. codes: 0 â***â 0.001 â**â 0.01 â*â 0.05 â.â 0.1 â â 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 2.8375e+06 on 2291292 degrees of freedom
Residual deviance: 9.1675e-03 on 2291291 degrees of freedom
AIC: 4.0092
Number of Fisher Scoring iterations: 25
Algoritmanın birleşmediği ne anlama geliyor? Çünkü olması düşünülen BigDelay
değerleri TRUE
ve FALSE
yerine 0
ve 1
, ama her şeyi dönüştürülür sonra aynı hata var. Herhangi bir fikir?