İki değişken arasındaki ilişkiyi modellemek için hangi yöntemi kullanacağımdan emin değilim ( ve ) aşağıdaki gibi tarif edilen deneyde:
- 3 değişken vardır: , ve .
- Değeri deneyi çalıştırırken ayarlanır. Ancak, ve her zaman eşit değildir.
- Pearson korelasyon katsayısı ve yaklaşık 0.9'dur.
- Pearson korelasyon katsayısı ve çok daha az: yaklaşık 0.5.
- maksimum olası değere sahip () aşılamaz.
- Her veri noktası ayarlandıktan sonra elde edilir ve okuyor ve .
Rağmen Pearson korelasyon katsayısı arasındaki ve harika değil, benziyor ile artış eğilimindedir .
Basit doğrusal regresyonlar yaptıktan sonra ve (ve ikincisini ile aynı grafikte görüntülenecek şekilde örneğin), her iki eğim de pozitif, ancak eğimi daha büyük .
Söylemek mantıklı mı veya ? ( ikinci durumda daha erken ulaşılır.)
Hesaba katıldığında bağlı , olası maksimum değeri hakkında ne söylenebilir? ulaşılabilir mi?
Anladığım kadarıyla, formun doğrusal bir regresyonunu yapmak mantıklı ne zaman bağımsız değişken ve bağımlı değişkendir. Ancak, bu bağlamda, bunu dikkate almanın mantıklı olup olmadığından emin değilim bağımsız ve bağımlıdır.
Toplam en küçük kare regresyonu daha uygun olur mu? Hangi değerleri belirlemek için başka yöntemler var mı ulaşılabilir (ve hangi olasılıkla)?
(Eğer bu önemliyse, ve daha yüksek değerlere ulaşmak için daha fazla girişimde bulunulduğu için normal bir dağılımı takip etmiyor .)