Doğrusal olmayan regresyon için güven şekli ve tahmin aralıkları


13

Doğrusal olmayan bir regresyon etrafındaki güven ve tahmin bantlarının regresyon çizgisi etrafında simetrik olması mı gerekiyor? Yani doğrusal regresyon bantlarında olduğu gibi saat camı şeklini almazlar. Neden?

Söz konusu model:
İşte şekil:

F(x)=(AD1+(xC)B)+D

http://i57.tinypic.com/2q099ok.jpg

ve işte denklem:

resim açıklamasını buraya girin


Sorunuz net değil, çünkü 1. cümlede "simetrik olmaları gerekip gerekmediğini" sormaktan, 2. cümlede olmadıklarını ima etmeye ve (muhtemelen) neden cümle içinde olmadıklarını sormaya geçiyorsunuz. 3 bu daha tutarlı / net mi?
gung - Monica'yı eski

Tamam, şu şekilde sorayım - regresyon doğrusal olmadığında neden güven ve tahmin bantları regresyon çizgisi etrafında simetriktir, ancak doğrusal olduğunda bir saat camı şeklini alır?
Serge

00

Haklısın. Grup negatif bölgeye geçiyor. Ancak, grupların değerleriyle değil, bant sınırlarına karşılık gelen EC50 değerleriyle ilgileniyorum. Bantları bu şekilde inşa etmenin bir alternatifi var mı?
Serge

Evet, ama istediğim gibi karmaşık olabilirler. Genelleştirilmiş en küçük kareler ve zaman serisi yöntemleri seri korelasyon ile başa çıkabilir. Bağımlı değişkenin doğrusal olmayan dönüşümleri, ilave olmayan hatayı işlemek için bir araçtır. Daha sofistike bir araç, genelleştirilmiş doğrusal bir modeldir. Seçenekler kısmen bağımlı değişkenin doğasına bağlıdır. BTW, "EC50 değerleri" ile ne demek istediğinizden emin olmasam da (doz-yanıt ilişkilerini modelliyormuşsunuz gibi görünüyor), gösterilen bantlardan hesaplanan herhangi bir şey şüpheli olacaktır.
whuber

Yanıtlar:


8

Güven ve tahmin bantlarının tipik olarak uçlara yaklaşması ve sıradan regresyonda her zaman yaptıkları gibi genişlemesi beklenmelidir; genellikle parametre belirsizliği, uçların yakınında ortadakinden daha geniş aralıklara yol açar

Bunu, belirli bir modelden verileri simüle ederek veya parametre vektörünün örnekleme dağılımından simüle ederek yeterince kolayca simülasyonla görebilirsiniz.

Doğrusal olmayan regresyon için yapılan olağan (yaklaşık olarak doğru) hesaplamalar, yerel bir doğrusal yaklaşım (bu Harvey'nin cevabında verilir) almayı içerir, ancak bunlar olmadan bile neler olduğu hakkında bir fikir edinebiliriz.

Ancak, gerçek hesaplamaları yapmak önemsizdir ve programlar bu etkiyi görmezden gelen hesaplamada bir kısayol alabilir. Bazı veriler ve bazı modeller için etkinin nispeten küçük ve görülmesi zor olması da mümkündür. Gerçekten, tahmin aralıklarında, özellikle büyük varyansla, ancak çok fazla veriyle, eğriyi sıradan lineer regresyonda görmek zor olabilir - neredeyse düz görünebilirler ve düzlükten sapmayı ayırt etmek nispeten kolaydır.

Ortalama için bir güven aralığı ile görmenin ne kadar zor olabileceğine bir örnek (tahmin aralıklarını görmek çok daha zor olabilir, çünkü göreceli varyasyonları çok daha azdır). İşte bazı veriler ve popülasyon ortalaması için bir güven aralığı ile doğrusal olmayan en küçük kareler uyuyor (bu örnekte, gerçek modeli bildiğimden örnekleme dağılımından üretildi, ancak asimptotik yaklaşım veya önyükleme ile çok benzer bir şey yapılabilir):

resim açıklamasını buraya girin

Mor sınırlar neredeyse mavi tahminlere paralel görünüyor ... ama değil. İşte bu ortalama tahminlerin örnekleme dağılımının standart hatası:

resim açıklamasını buraya girin

ki bu açıkça sabit değil.


Düzenle:

Gönderdiğiniz bu "sp" ifadeleri doğrudan doğrusal regresyon için tahmin aralığından gelir !


Ayrıca, merkezden uzaklaştıkça parametre belirsizliğindeki artışın, bandın doğrusal olmayan regresyon durumunda bile uçlarda genişlemesine neden olması gerektiğini mi söylüyorsunuz, ancak bu o kadar açık değil mi? Yoksa doğrusal olmayan regresyon durumunda bu genişlemenin gerçekleşmemesinin teorik bir nedeni var mı? Gruplarım kesinlikle çok simetrik görünüyor.
Serge

1
Bu genişleme olağan olmalı, ancak her doğrusal olmayan modelde aynı şekilde olmayacak ve her modelde o kadar açık olmayacaktır ve bu kadar kolay olmadığı için belirli bir program tarafından bu şekilde hesaplanamayabilir . Baktığınız grupların nasıl hesaplandığını bilmiyorum - zihin okuyucusu değilim ve adını bile belirtmediğiniz bir programın kodunu göremiyorum.
Glen_b-Monica

@ user1505202, bu tam olarak cevaplanması zor bir soru olmaya devam ediyor. Modelinizin ne olduğunu söyleyebilir misiniz (fonksiyonel formu)? Size şaşkınlık yaratan figürün bir görüntüsünü ekleyebilir misiniz?
gung - Monica'yı eski

1
Teşekkürler. Sayılarım var ve bunlar esasen sabit - regresyon çizgisi ve her bir tahmin limiti arasındaki fark, ortada 18.21074 ile uçlarda 18.24877 arasında değişiyor. Yani, hafif bir genişleme, ama çok hafif. Bu arada, @gung, tahmin aralığını hesaplayan denklemi aldım. Bu:Y-hat +/- sp(Y-hat)
Serge

1
Bu, büyük örneklerle bir tahmin aralığıyla görebileceğiniz çeşitlilikle ilgilidir. Sp nedir?
Glen_b-Monica'yı

5

Doğrusal olmayan regresyona uyan eğrilerin hesaplanması matematiğinin ve tahmin bantlarının matematiği bu Çapraz Doğrulanmış sayfada açıklanmaktadır . Bantların her zaman / genellikle simetrik olmadığını gösterir.

Ve işte daha fazla kelime ve daha az matematik içeren bir açıklama:

İlk olarak, belirli bir X değerindeki parametrelerin gradyanı olan ve parametrelerin en iyi uyan değerlerini kullanan G | x'i tanımlayalım. Sonuç, parametre başına bir öğe içeren bir vektördür. Her parametre için, dY / dP olarak tanımlanır; burada Y, X'in belirli değeri ve tüm en uygun parametre değerleri verildiğinde eğrinin Y değeri ve P parametrelerden biridir.)

G '| x, transpoze edilen gradyan vektörüdür, dolayısıyla bir değer sırası yerine bir sütundur. Cov kovaryans matrisidir (son iterasyondan Hessen'i tersine çevirir). Parametre sayısına eşit satır ve sütun sayısının bulunduğu kare bir matristir. Matristeki her öğe iki parametre arasındaki kovaryanstır. Her bir değerin -1 ile 1 arasında olduğu normalleştirilmiş kovaryans matrisini belirtmek için Cov kullanırız .

Şimdi hesapla

c = G '| x * Cov * G | x.

Sonuç, herhangi bir X değeri için tek bir sayıdır.

Güven ve tahmin bantları en uygun eğri üzerinde merkezlenir ve eğrinin üstüne ve altına eşit miktarda uzanır.

Güven bantları eğrinin üzerinde ve altında uzanır:

= sqrt (c) * sqrt (SS / DF) * KritikT (Güven%, DF)

Tahmin bantları, eğrinin üzerinde ve altında, aşağıdakilere eşit bir mesafe daha uzatır:

= sqrt (c + 1) * sqrt (SS / DF) * KritikT (Güven%, DF)

Her iki denklemde de, c'nin (yukarıda tanımlanan) değeri X'in değerine bağlıdır, bu nedenle güven ve tahmin bantları eğriden sabit bir mesafe değildir. SS değeri uyum için karelerin toplamıdır ve DF serbestlik derecesi sayısıdır (veri noktası sayısı eksi parametre sayısı). CriticalT, istediğiniz güven düzeyine (geleneksel olarak% 95) ve serbestlik derecesine bağlı olarak t dağılımından bir sabittir. % 95 sınırlar ve oldukça büyük bir df için bu değer 1,96'ya yakındır. DF küçükse, bu değer daha yüksektir.


Teşekkürler Harvey. Benim işlevi için parametrelerin gradyanını almak üzerinde çalışıyorum. Şans eseri çalışılmış bir örneği biliyor musunuz, çünkü kovaryans matrisinin nasıl elde edildiği konusunda net değilim.
Serge

GraphPad Prism demosunu kullanıyorsanız, verileri istediğiniz herhangi bir modele sığdırabilir ve kovaryans matrisini (Tanı sekmesinde seçilen isteğe bağlı bir sonuç) ve güven veya tahmin bantlarını (hem sayılar hem de grafik olarak görebilirsiniz); Teşhis sekmesi). Bu işe yaramış bir örnek olarak iyi değil, ama en azından kovaryans matrisini karşılaştırabilir ve sorunun daha önce mi yoksa sonra mı olduğunu görebilirsiniz ...
Harvey Motulsky

Yine de iki şey. 1. Prizma bana Cov matrisini verdi. Ancak, tüm veri kümesi için yalnızca bir sayıdır. Her X değeri için bir değer almam gerekiyor mu? 2. Grafikte tahmin bandını alıyorum ama çıktının değerleri içermesini istiyorum. Prizma bunu yapmıyor gibi görünüyor. Prizma için çok yeniyim ve bu yüzden her yere bakmamış olabilirim, ama denedim!
Serge

1. Kovaryans matrisi, parametrelerin iç içe geçme derecesini gösterir. Dolayısıyla, doğrusal olmayan regresyona uymasını istediğiniz her parametre çifti için bir değer vardır. 2. Prism'den, güven veya tahmin bantları için artı / eksi değerlerle eğrinin XY koordinatlarının bir tablosunu yapmasını istemek için Aralık sekmesine bakın. 3. Prism ile teknik destek için, support@graphpad.com adresine e-posta gönderin. Teknik destek için değil, istatistiksel sorular için bu forumu kullanın.
Harvey Motulsky
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.