Üst sınırı olan bir değişken göz önüne alındığında hangi regresyon türü kullanılır?


9

İki değişken arasındaki ilişkiyi modellemek için hangi yöntemi kullanacağımdan emin değilim (x ve y) aşağıdaki gibi tarif edilen deneyde:

  • 3 değişken vardır: xbirbenm, x ve y.
  • Değeri xbirbenmdeneyi çalıştırırken ayarlanır. Ancak,x ve xbirbenm her zaman eşit değildir.
  • Pearson korelasyon katsayısı xbirbenm ve x yaklaşık 0.9'dur.
  • Pearson korelasyon katsayısı x ve y çok daha az: yaklaşık 0.5.
  • y maksimum olası değere sahip (ymbirx) aşılamaz.
  • Her veri noktası ayarlandıktan sonra elde edilir xbirbenm ve okuyor x ve y.

Rağmen Pearson korelasyon katsayısı arasındaki x ve y harika değil, benziyor y ile artış eğilimindedir x.

Basit doğrusal regresyonlar yaptıktan sonra y=f(x) ve x=g(y) (ve ikincisini g-1ile aynı grafikte görüntülenecek şekilde f örneğin), her iki eğim de pozitif, ancak eğimi g-1 daha büyük f.

Söylemek mantıklı mı xmbirx=f-1(ymbirx) veya xmbirx=g(ymbirx)? (xmbirx ikinci durumda daha erken ulaşılır.)

Hesaba katıldığında y bağlı ymax, olası maksimum değeri hakkında ne söylenebilir? x ulaşılabilir mi?

Anladığım kadarıyla, formun doğrusal bir regresyonunu yapmak mantıklı y=f(x) ne zaman x bağımsız değişken ve ybağımlı değişkendir. Ancak, bu bağlamda, bunu dikkate almanın mantıklı olup olmadığından emin değilimx bağımsız ve y bağımlıdır.

Toplam en küçük kare regresyonu daha uygun olur mu? Hangi değerleri belirlemek için başka yöntemler var mıxmax ulaşılabilir (ve hangi olasılıkla)?

(Eğer bu önemliyse, x ve y daha yüksek değerlere ulaşmak için daha fazla girişimde bulunulduğu için normal bir dağılımı takip etmiyor x.)


Bu ilişki ile ne yapacaksın, eğer bulabilirsen? Hipotezleri test edecek misiniz, yoksa sadece nasıl göründüğüyle ilgileniyor musunuz? Çok fazla veri noktası varsa, doğrusal olmayan modelleri düşünmelisiniz.
mpiktas

@mpiktas, nihayetinde, hangi x_max'ın düzenli olarak ulaşmaya çalışabileceğimi makul bir hedef olduğunu bilmek istiyorum (sadece bir kez değil), y_max'a ulaşmanın veya bu denemenin üstüne çıkmanın deneyi geçersiz kıldığını (etkili bir şekilde x = x_min bu girişim için).
Bruno

Toplam en küçük kareler (veya değişkenlerdeki hatalar) regresyonu, x ile karşılaştırıldığında oldukça büyük hale gelir y. İle% 90 korelasyonxaim olduğunu gösterir xbağımsız bir değişken olarak güvenli bir şekilde tedavi edebileceğiniz kadar küçük olabilir. Bu, artıkların RMSE'sini karşılaştırarak regresyon sonrası kontrol edebileceğiniz bir şeydir.xaim vs. x artıklarının RMSE'lerine y vs. xaim. olup olmadığınıymaxbir sorun bağlıdır; Eğer dağılım grafiğinde bir üst kesim görürsenizxaimönemli bir husustur.
whuber

Yanıtlar:


4

King'in puanlarını ikinci yapmak istiyorum. Gerilemekten şüphelenmek çok sezgisely üstüne x ('doğrudan regresyon') ve regresyon x üstüne y('ters regresyon') aynı olmalıdır. Bununla birlikte , bu ne matematiksel olarak ne de regresyonun analiz ettiğiniz durumla nasıl ilişkili olduğu açısından doğru değildir. Eğer komplo yaparsany bir grafiğin dikey ekseninde ve xyatay eksende neler olduğunu görebilirsiniz. Doğrudan regresyon, veri noktaları ve çizgi arasındaki dikey mesafeleri en aza indiren çizgiyi bulurken, ters regresyon yatay mesafeleri en aza indirir. Birini en aza indiren çizgi yalnızca diğerini en aza indirirrxy=1.0. Neyi açıklamak istediğinize ve açıklamak için ne kullanmak istediğinize karar vermeniz gerekir. Bu sorunun cevabı size hangi değişkeniny ve xve modelinizi belirtir. Ayrıca, (@King'in ardından tekrar), söylemeye çalışmama katılmıyorumxmax=f1(ymax), aynı nedenlerle.

Sınırlı bir değişkenin konusuna gelince, tipik olarak 'gerçek' miktarın daha yüksek olabileceği düşünülebilir, ancak bunu ölçemezsiniz. Örneğin, penceremden dışarıdaki bir termometre 120'ye kadar çıkıyor, ancak bazı yerlerde 140 dışında olabilir ve ölçümünüzde sadece 120 tane olurdu. Böylece, değişkenin bir üst sınırı olacaktır, ama gerçekten düşünmek istediğiniz şey yoktur. Durum buysa, sadece bu gibi durumlar için tobit modelleri mevcuttur.

Başka bir yaklaşım, ihtiyaçlarınız için mükemmel bir şekilde yeterli olabilecek, lös gibi daha sağlam bir şey kullanmak olacaktır.


Gecikme için özür dilerim, cevabınızı fark etmemiştim. Tobit modelini okumam gerekecek.
Bruno

Sorun değil. Regresyonun doğası (ters regresyona karşı) hakkında daha fazla bilgi için buraya bakın . Çeşitli yazılımlar kullanarak tobit regresyonu uygulayarak yardım almak için burayı deneyin .
gung - Monica'yı eski durumuna getirin

3

İlk olarak, söylemenin mantıklı olduğunu düşünmüyorum xmax=f1(ymax) burada, bu bire bir işlev olduğunu ima etmek gibi xmax diğer gözlemlenmemiş değişkenler tarafından açıklanmıştır.

İkincisi, gerçekten bağımsız veya bağımlı bir değişken olarak ele alınacak bağlama bağlıdır. Deneyimlerime göre, teori bir yolu güçlü bir şekilde önermediği sürece; her iki durumda da tamam. 7 Ekim'deki yorumlarınızdan gibi görünüyorx bağımlı iken y bağımsızdır.

Mümkünse, kalıntılara bakın ve ondan bir şey sıkıp sıkamayacağınızı görün. Unutmuş olduğunuz başka bir değişken olabilir; veya değişkenlerinizi dönüştürmenize yardımcı olabilir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.