Sayma verileri için karekök dönüşümü neden önerilir?


57

Sayılarınız varken karekök almanız önerilir. (CV bazı örnekler için HarveyMotulsky cevabı @ bakınız burada ya whuber cevabı @ burada Poisson olarak dağıtılan bir yanıt değişkeni bulunan genelleştirilmiş doğrusal modelin yerleştirilmesi sırasında.) Öte yandan, günlük olduğunu kurallı bağlantı . Bu, yanıt verilerinizin bir günlük dönüşümünü almak gibi bir şeydir (daha doğrusu yanıt dağılımını düzenleyen parametre olan günlük dönüşümü almasına rağmen ). Böylece, bu ikisi arasında biraz gerginlik var. λ

  • Bu (görünen) tutarsızlığı nasıl uzlaştırıyorsunuz?
  • Karekök neden logaritmadan daha iyi olsun?

Yanıtlar:


45

38X+X+1

görüntü tanımını buraya girin

23

görüntü tanımını buraya girin

Eğer özellikle normale yakınlık istiyorsanız (Poisson parametresi gerçekten küçük olmadığı sürece) ve heteroscedastisite ayarını umursamıyor / ayarlayamıyorsanız , deneyin.23

y=log(y+c)0c0.40.5μ120.43

İnsanların neden bir dönüşümü diğerinden (ya da hiçbirinden) seçtiğine gelince, bu gerçekten başarmak için yaptıkları şeydir.

[1]: Henrik Bengtsson'un "Genelleştirilmiş Doğrusal Modeller ve Dönüştürülmüş Artıklar" başlıklı sunumunda yer alan arsalar buraya bakın (bkz. P4'deki ilk slayt). Biraz y-jitter ekledim ve satırları atladım.


1
(0,+)(,+)λ

2
Xy

1
+1 Karekök yalnızca sayım verileriyle başa çıkmak için bir başlangıç ​​noktasıdır. Logaritma da iyi bir seçimdir. Veriler, hangisinin yararlı ve özlü bir açıklama elde etmede daha başarılı olduğunu söyleyecektir. Gung, atıfta bulunduğunuz cevapta , karekökün iyi bir seçim olduğu gösterimi, sağdaki şekilde ortaya çıkan dış olmayan kalıntıların simetrik dağılımında yatmaktadır. Simülasyonun parametrelerini değiştirdiğinizde, simetrinin korunduğunu göreceksiniz.
whuber

1
@Glen Ben günlükleri her zaman iyi bir seçim olduğunu söylemedim . Ama bazen onlar köklerden daha üstündürler. Sıfır sayıları göründüğünde evet, "başlatıldı" logaritmasına ihtiyacınız var . Buradaki diğer dişler , başlangıç ​​değeri elde etmenin yollarını tartıştılar . Verilerde sıfır sayım olmadığında, kayıtlarda hiçbir sorun yaşanmaz.
whuber

2
@ Tomes Neden Freeman-Tukey veya gelincex+3/8xx+ccx+3/8
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.