Bu benim ilk yazı StackExchange, ama bir süredir kaynak olarak kullanıyorum, uygun formatı kullanmak ve uygun düzenlemeleri yapmak için elimden geleni yapacağım. Ayrıca, bu çok parçalı bir soru. Soruyu birkaç farklı gönderiye mi yoksa sadece bir tanesine mi bölmem gerektiğinden emin değildim. Soruların hepsi aynı metindeki bir bölümden geldiğinden, tek bir soru olarak yayınlamanın daha alakalı olacağını düşündüm.
Yüksek Lisans Tezi için büyük memeli türlerinin habitat kullanımını araştırıyorum. Bu projenin amacı, orman yöneticilerine (büyük olasılıkla istatistikçi olmayan) bu türle ilgili olarak yönettikleri arazilerdeki yaşam alanlarının kalitesini değerlendirmek için pratik bir çerçeve sunmaktır. Bu hayvan nispeten zor, bir habitat uzmanıdır ve genellikle uzak bölgelerde bulunur. Özellikle mevsimsel olarak türlerin dağılımı ile ilgili nispeten az sayıda çalışma yapılmıştır. Birkaç hayvana bir yıl boyunca GPS yakaları takılmıştır. Her bir hayvanın GPS yaka verilerinden yüz konum (50 yaz ve 50 kış) rastgele seçilmiştir. Ek olarak, "mevcut" veya "yalancı yokluk" konumları olarak hizmet etmek üzere her bir hayvanın ev aralığında 50 puan rastgele oluşturuldu.
Her bir konum için, arazide çeşitli habitat değişkenleri (ağaç çapları, yatay örtü, kaba odunsu enkaz, vb.) Örneklenmiştir ve birçoğu CBS (yükseklik, yola uzaklık, sağlamlık, vb.) İle uzaktan örneklenmiştir. 7 seviyeli 1 kategorik değişken hariç değişkenler çoğunlukla süreklidir.
Amacım, kaynak birimlerinin göreceli kullanım olasılığını modellemek için kaynak seçim fonksiyonları (RSF) oluşturmak için regresyon modellemeyi kullanmaktır. Hayvanların popülasyonu (tasarım tip I) ve her bir hayvan için (tasarım tip III) mevsimsel (kış ve yaz) bir RSF oluşturmak istiyorum.
İstatistiksel analiz yapmak için R kullanıyorum.
Kullandığım birincil metin …
- "Hosmer, DW, Lemeshow, S. ve Sturdivant, RX 2013. Uygulamalı Lojistik Regresyon. Wiley, Chicester".
Hosmer ve ark. STATA kullanın, R ile ilgili olarak aşağıdaki 2 metni de kullanıyorum .
- "Crawley, MJ 2005. İstatistikler: RJ Wiley, Chichester, Batı Sussex, İngiltere kullanarak bir giriş."
- "Plant, RE 2012. R. CRC Press, Ekoloji ve Tarımda Mekansal Veri Analizi, Londra, GBR."
Şu anda Hosmer ve ark. "Ortak Değişkenlerin Amaçlı Seçimi" ve süreçle ilgili birkaç sorunuz var. Sorularıma yardımcı olmak için aşağıdaki metindeki ilk birkaç adımı özetledim.
- Adım 1: Her bağımsız değişkenin tek değişkenli analizi (Tek değişkenli lojistik regresyon kullandım). Tek değişkenli testi p değeri 0,25'in altında olan herhangi bir değişken ilk çok değişkenli modele dahil edilmelidir.
- Adım 2: Adım 1'e dahil edilmek üzere tanımlanan tüm ortak değişkenleri içeren ve Wald istatistiklerinin p değerini kullanarak her bir değişkenin önemini değerlendirmek için çok değişkenli bir model takın. Geleneksel önem düzeylerine katkıda bulunmayan değişkenler ortadan kaldırılmalı ve yeni bir model uygun olmalıdır. Daha yeni, daha küçük model, kısmi olabilirlik oranı testi kullanılarak eski, daha büyük modelle karşılaştırılmalıdır.
- Adım 3: Daha küçük modeldeki tahmini katsayıların değerlerini büyük modeldeki ilgili değerlerle karşılaştırın. Katsayısı büyüklükte belirgin bir şekilde değişmiş olan herhangi bir değişken, modelde kalan değişkenlerin etkisinin gerekli bir ayarlamasının sağlanması açısından önemli olduğu için modele geri eklenmelidir. Tüm önemli değişkenlerin modele dahil edildiği ve hariç tutulanların klinik ve / veya istatistiksel olarak önemsiz olduğu görünene kadar 2. ve 3. adımlar arasında dolaşın. Hosmer ve diğ. "kullanmak delta-beta-hat-yüzde katsayılarının büyüklük değişimin bir ölçüsü olarak". Delta-beta-şapka yüzdesi olarak>% 20 olarak önemli bir değişiklik önermektedirler . Hosmer ve diğ. tanımlar , delta-beta-hat-yüzde olarak . Buradaθ1küçük modelinden katsayısıdır veβ1daha büyük bir modelden katsayısıdır.
- Adım 4: Adım 1'de seçilmeyen her bir değişkeni, adım 3'ün sonunda elde edilen modele birer birer ekleyin ve bunun önemini Wald istatistiki p değeri veya kategorik ise kısmi olabilirlik oranı testi ile kontrol edin. 2'den fazla seviyesi olan değişken. Bu adım, kendi başına, sonuçla önemli ölçüde ilişkili olmayan, ancak diğer değişkenlerin varlığında önemli bir katkıda bulunan değişkenleri tanımlamak için hayati öneme sahiptir. 4. Adımın sonundaki modele ön ana etki modeli olarak atıfta bulunuyoruz .
- Adım 5-7: Bu noktaya ilerlemedim, bu yüzden bu adımları şimdilik dışarıda bırakacağım veya farklı bir soru için kaydedeceğim.
Sorularım:
- 2. adımda, geleneksel anlamlılık düzeyi, p <değeri <0,05 gibi daha büyük bir şey olarak uygun olan nedir?
- 2. adımda, kısmi olabilirlik testi için kullandığım R kodunun doğru olduğundan emin olmak ve sonuçları doğru şekilde yorumladığımdan emin olmak istiyorum. İşte yaptığım şey…
anova(smallmodel,largemodel,test='Chisq')
Eğer p değeri önemli ise (<0.05) Değişkeni modele geri eklerim, eğer önemsizse silmeye devam eder miyim? - 3. adımda, delta-beta-şapka yüzdesi ve modele hariç tutulan bir değişkenin eklenmesinin uygun olduğu bir sorum var . Örneğin, model bir değişken dahil değildir ve bu değişikliği >% 20 farklı bir değişken için. Ancak, içinde>% 20 değişiklik ile değişken ö β % o Adımlar 2 önümüzdeki birkaç döngülerinde modeli dışında tutulacaktır ve 3. Nasıl her iki değişken ise bir durumu tespit edebilir sanki önemsiz ve bakışlar gibi görünüyor modele dahil edilmeli veya modelden çıkarılmalı mı? İlk önce en az önemli değişkenleri silerek bir anda 1 değişkeni hariç tutarak ilerlediğim için, bir değişkeni sıra dışı bırakmaktan çekiniyorum.
Son olarak, Eminim hesaplamak için kullanıyorum kod yapmak istiyorum doğrudur. Aşağıdaki kodu kullanıyorum. Bunu benim için yapacak bir paket veya bunu yapmanın daha basit bir yolu varsa, önerilere açığım.
100*((smallmodel$coef[2]-largemodel$coef[2])/largemodel$coef[2])