Verileri karekök ile dönüştürmek için ne düşünebileceğimin bir nedeni var mı? Her zaman gözlemlediğim şey, R ^ 2'nin artmasıdır. Ancak bunun nedeni büyük olasılıkla verileri ortalamaktır! Herhangi bir düşünce takdir!
Verileri karekök ile dönüştürmek için ne düşünebileceğimin bir nedeni var mı? Her zaman gözlemlediğim şey, R ^ 2'nin artmasıdır. Ancak bunun nedeni büyük olasılıkla verileri ortalamaktır! Herhangi bir düşünce takdir!
Yanıtlar:
Genel olarak, parametrik regresyon / GLM, değişkeni ile her X değişkeni arasındaki ilişkinin doğrusal olduğunu, modeli taktıktan sonra artıkların normal bir dağılımı izlediğini ve artıkların boyutunun yaklaşık olarak aynı kaldığını varsayar. monte ettiğiniz hat (lar) boyunca. Verileriniz bu varsayımlara uymadığında, dönüşümler yardımcı olabilir.
Bu eğer kolay olmalı ile orantılıdır X 2 daha sonra kare köklenme Y varsayımları ve daha uygun olduğunu daha varyans açıklayan bir modelini oluşturmak üzere, bu ilişkiyi linearises sahiptir (daha yüksek R, 2 ). Kare köklenme Y , X değerleriniz arttıkça artıklarınızın boyutunun giderek artması sorununa sahip olduğunuzda da yardımcı olur.artış (yani, bağlı çizginin etrafındaki veri noktalarının dağılımı, siz ilerledikçe daha belirgin hale gelir). Bir kare kök fonksiyonunun şeklini düşünün: ilk başta dik olarak artar, ancak doyurulur. Böylece bir kare kök dönüşümü uygulamak daha küçük sayıları şişirir, ancak daha büyük olanları dengeler. Böylece, düşük değerlerindeki küçük kalıntıları monte edilen çizgiden uzağa itmek ve yüksek X değerlerindeki büyük kalıntıları çizgiye doğru ezmek olarak düşünebilirsiniz . (Bu zihinsel stenografi doğru matematik değil!)
Dmitrij ve ocram'ın dediği gibi, bu belirli durumlarda yardımcı olacak olası bir dönüşümdür ve Box-Cox formülü gibi araçlar en faydalı olanı seçmenize yardımcı olabilir. Bir modele taktığınızda her zaman kalan değerlere uygun değerlere (ve normal bir olasılık grafiğine veya artıkların histogramına) karşı bir arsaya bakma alışkanlığı edinmenizi tavsiye ederim. Sonunda bunlardan ne tür bir dönüşümün yardımcı olacağını görebileceksiniz.
Karekök dönüşümü sadece Box-Cox güç dönüşümünün özel bir durumudur (Pengfi Li tarafından güzel bir genel bakış, yararlı okuma olabilir ve burada bulunur ), ve bazı merkezlemeyi atlar.
Box-Cox dönüşümlerinin amacı, Doğrusal Model tutma için olağan varsayımları sağlamaktır. Yani, .
Bununla birlikte, bu a priori sabit değer optimal olmayabilir (ve muhtemelen) olmayabilir. R'de car
kütüphaneden powerTransform
, doğrusal regresyona veya birlikte çalıştığınız herhangi bir veriye katılan değişkenlerin her biri için Box-Cox dönüşümleri için en uygun değeri tahmin etmeye yardımcı olan bir işlevi düşünebilirsiniz ( example(powerTransform)
daha fazla ayrıntı için bkz .).
Değişken bir Poisson dağılımını izlediğinde, kare kök dönüşümünün sonuçları Gaussian'a çok daha yakın olacaktır.
Bray-Curtis ile hesaplanan mesafe matrisi, bazı veriler için genellikle metrik değildir ve negatif özdeğerlere yol açar. Bu sorunun üstesinden gelmek için çözümlerden biri (logaritmik, Karekök veya çift Karekök) dönüştürmektir.