Doğrusal regresyon için minimum nokta sayısı


16

Doğrusal bir gerilemeyle zaman içinde bir eğilim aramak için "makul" asgari sayıda gözlem ne olurdu? ikinci dereceden bir model takmaya ne dersiniz?

Bileşik sağlıkta eşitsizlik indeksleri (SII, RII) ile çalışıyorum ve anketin sadece 4 dalgası var, bu yüzden 4 puan (1997,2001,2004,2008).

İstatistikçi değilim ama sezgisel bir izlenim var 4 puan yeterli değil. Yanıtınız ve / veya referanslarınız var mı?

Çok teşekkürler,

Françoise


4
Genel kural her bağımsız değişken için 10 puandır.
Peter Flom - Monica'yı eski durumuna döndürün

1
Endeksleriniz nasıl ölçülür? Değişkenlik tahminleri içeriyorlarsa, iki tane yeterli olabilir (bir t testi veya analogunu kullanarak). Burada uygulanan temel istatistiksel ilke, rasgele varyasyon gözlemlediğiniz şeyin beklenmedik bir açıklaması olduğunda, o zaman herhangi bir belirgin eğilimi rasgele olmayan nedenlere atfetme hakkınız olmasıdır. Eğilim güçlü olduğunda, böyle bir sonuca varmak için çok az veri değerine ihtiyaç duyulabilir, buna rağmen tüm genel "temel kurallar".
whuber

Yanıtlar:


12

Ortak değişken başına 10'lu Peters kuralı makul bir kuraldır. Düz bir çizgi, yanıt değerlerindeki gürültü miktarına bakılmaksızın herhangi iki noktaya mükemmel şekilde sığabilir ve kuadratik, sadece 3 noktaya mükemmel şekilde sığabilir. Bu yüzden hemen hemen her durumda 4 noktanın yetersiz olduğunu söylemek doğru olacaktır. Bununla birlikte, çoğu kural gibi her durumu kapsamaz. Modeldeki gürültü teriminin büyük bir varyansa sahip olduğu durumlar, hata varyansının küçük olduğu benzer bir durumdan daha fazla örnek gerektirecektir.

Gerekli sayıda numune noktası nesnelere bağlıdır. Keşfedici bir analiz yapıyorsanız, sadece bir modelin (bir eş değişkente doğrusal diyelim) diğerinden daha iyi görünüp görünmediğini (eş değişkenin kuadratik bir işlevi söyleyin) 10 puandan daha az olup olmadığını görmek için yeterli olabilir. Ancak, ortak değişkenler için korelasyon ve regresyon katsayıları hakkında çok doğru tahminler yapmak istiyorsanız, ortak değişken başına 10'dan fazla ihtiyacınız olabilir. Tahmin kriterinin doğruluğu, doğru parametre tahminlerinden daha fazla örnek gerektirebilir. Tahminlerin ve tahminin varyansının, modellerin hata teriminin varyansını içerdiğini unutmayın.


İyi puanlar Michael; Basit tutmaya çalışıyordum. :-). Orijinal sorunun konusu göz önüne alındığında, 10 puandan daha azı yeterli olsaydı çok şaşırırdım. Sağlıktaki eşitsizlik ölçümlerinin büyük olasılıkla çok fazla hatası olduğu görülmektedir ve zamanla ilişkilerin oldukça doğrusal olması muhtemel değildir. Bu konuda herhangi bir yazı biliyor musun? Çok ilginç bir konu.
Peter Flom - Monica'yı eski durumuna döndürün

@PeterFlom Yapmıyorum. Bahsettiğin gibi bir kural kullanıp kullanmadığını görmek için van Belle'a kitabının istatistiksel kurallarına bakacağım. Kitabının güzel yanı, her kuralın ardındaki mantığı açıklaması. Her bir değişken için en az 10 tane almanın bir kuralın oldukça iyi olduğunu ve daha az kullanmanın bazı keşif vakaları dışında nadiren güvenli olacağını kabul ediyorum. Çalıştığım sağlık bilimlerinde gürültü terimi her zaman büyük gibi görünebilir, ancak belki de sıkı kontrol edilen fizik veya mühendislik deneyleri çok hassas ölçümlere ve dolayısıyla küçük rastgele hatalara sahip olabilir.
Michael R. Chernick

Sadece uzak ihtimal olsa bile 10'dan daha az noktaya ihtiyaç duyan küçük gürültü olasılığını göstermeye çalışıyordum.
Michael R. Chernick

Evet katılıyorum. Ve fizikte ya da çok yüksek bir beklendiği ve teorinin güçlü ve hatanın küçük olduğu herhangi bir alanda iyi olabilir . R2
Peter Flom - Monica'yı eski durumuna döndürün

+1, iyi bilgi, ancak tahmin ediciniz tarafsızsa, doymuş bir modele sahip olabileceğinizi ve yine de parametrelerin bir tahminini yapabileceğinizi belirtmeniz gerekir. Değişkenlik hakkında bir tahminde bulunmayacak veya çıkarımda bulunamayacaksınız. Bununla birlikte, kestirmenin çok fazla etkisinin olduğu ve verilerin elde edilmesi yeterince zor olan bazı durumlarda, bazen doymuş modeller kullanılır. Yani, örneğin, bu durumda, kuadratik w / 3 puanlı fonksiyonun bir tahminini alabilirsiniz. Bunun iyi bir şey olduğu anlamına gelmez, ama bu gerçek alt sınır ve bunun nedeni.
gung - Monica'yı eski durumuna döndürün
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.