İstatistiksel olarak anlamlı bir tepe noktası kontrol etme


14

Bir veri setim var, ve . Aşağıdaki hipotezini test etmek olacaktır: bir tepe vardır ; yani arttıkça, önce artar ve sonra azalır.x y x yyxyxy

İlk fikrim bir SLR'ye ve takmaktı. Daha önce katsayı bulmak Yani, eğer öncesi önemli ölçüde olumlu ve katsayı olup önemli ölçüde negatif sonra hipotezi için destek. Bununla birlikte, bu sadece bir tür ilişkiyi (kuadratik) kontrol eder ve zirvenin varlığını yakalamak zorunda olmayabilir.x 2 x x 2xx2xx2

Sonra bulma düşünce , (arasında kriteri değerleri) bu tür bir bölge , bu arasında ve , iki bölgeleri kadar çok nokta gibi en azından içeren , ve bu ve . Hipotez doğruysa, bu tür birçok bölgeyi beklemeliyiz . Dolayısıyla, sayısı yeterince büyükse, hipotez için destek olmalıdır.x b a c x b ¯bxbacxb ¯ y b > ¯ y c bbyb¯>ya¯yb¯>yc¯bb

Hipotezime uygun bir test bulmak için doğru yolda olduğumu düşünüyor musunuz? Yoksa tekerleği mi icat ediyorum ve bu problem için belirlenmiş bir yöntem var mı? Girdilerinizi çok takdir edeceğim.

GÜNCELLEME. Bağımlı değişkenim sayım (negatif olmayan tam sayı).y


, ile sorunsuz bir şekilde değişiyor mu ? Eğer öyleyse, daha pürüzsüz (GAM deyin) içeren bir model takmayı deneyebilir ve daha sonra takılan pürüzsüz olanın ilk türevlerini ve güven aralıklarını hesaplayabilirsiniz. Türev önemli ölçüde artıyorsa azalan anlamlı ise bir cevabınız vardır. xyx
Monica'yı eski durumuna getirin. G. Simpson

Yanıtlar:


6

Düzeltme fikrini de düşünüyordum. Ancak, gürültülü verilerde tepe noktaları arayan yanıt yüzeyi metodolojisi adı verilen bir alan vardır (öncelikle verilere yerel kuadratik uyumları içerir) ve başlığında "Yumru avı" ile hatırladığım ünlü bir makale vardı. Yanıt yüzeyi metodolojisi hakkındaki kitaplara bazı bağlantılar. Ray Myer'in kitapları özellikle iyi yazılmış. Yumru av kağıdını bulmaya çalışacağım.

Tepki Yüzeyi Metodolojisi: Tasarlanmış Deneyler Kullanılarak Süreç ve Ürün Optimizasyonu

Tepki Yüzeyi Metodolojisi ve İlgili Konular

Tepki yüzeyi metodolojisi

Ampirik Model Oluşturma ve Müdahale Yüzeyleri

Aradığım makale olmasa da, burada Jerry Friedman ve Nick Fisher tarafından yüksek boyutlu verilere uygulanan bu fikirleri ele alan çok alakalı bir makale var.

İşte bazı çevrimiçi yorumları olan bir makale.

Umarım en azından cevabımı takdir edersiniz. Fikirlerinizin iyi ve doğru yolda olduğunu düşünüyorum ama evet, tekerleği yeniden yaratabileceğinizi düşünüyorum ve umarım siz ve diğerleri bu mükemmel referanslara bakacaksınız.


3
Ben düşüşler arasında değildim, ama SE sitelerinde Yanıtlar içerik bağlantısı daha fazla olması bekleniyor. İçeriği özetlemek veya özet yanıt vermek ve daha fazla ayrıntı için içeriğe bağlantı oluşturmak daha iyi olacaktır.
Monica'yı eski durumuna getirin - G. Simpson

2
Bunu destekliyorum çünkü (1) iyi bir fikir sunuyor; (2) bazı yorumları vardır; ve (3) serbestçe temin edilebilen malzemeler de dahil olmak üzere özenle seçilmiş bazı bağlantılarla desteklenir. Evet, tipografik olarak kötü görünüyor, çünkü bağlantılar daha güzel biçimlendirilmiş olabilir: ancak umarım insanlar oylama kararlarında cevapların bu yönünü ağırlaştırmazlar!
whuber

1
@whuber Procastinator'ın güzel biçimlendirmesi nedeniyle açıkça okuyabildiğimden sonra katılıyorum. +1 de. Burada yeterince özet olduğunu düşünüyorum ve bazı konular temel fikirden ve daha fazla okuma için bir referanstan başka bir şey için neredeyse çok karmaşık.
Erik

5
Bir eleştiri değildi @MichaelChernick Not gelen kişi oy aşağı olabileceğini bana neden sadece bir sebep sunar. Nedeni bu olsaydı onlara katılmıyorum çünkü cevabınızın özellikle PRIM ile ilgili olduğunu düşünüyorum; PRIM'de söyledikleri konusunda Hastie ve arkadaşlarına (2009) danışıyordum. PRIM'de iki bölüm olduğundan ve PDF ücretsiz olarak bu bağlantıyı Yanıt'a eklemek isteyebilirsiniz.
Monica'yı eski durumuna getirin - G. Simpson

1
@Nikita Test etmek istediğiniz resmi istatistiksel hipotez nedir? Önce bunun büyük bir parçası olan zirveleri bulmalısın. Zirvenin sadece gürültünün bir sonucu olmadığını test ediyor musunuz? Bu sorunu çözmek için hangi literatürün olduğundan emin değilim ama düşüncem, verilere polinom regresyonu (belki de kuadratik olarak yerel olarak) sığdırabileceğiniz olacaktır. Bundan, kalan varyans hakkında bir tahmininiz olacaktır. İkinci dereceden terimin istatistiksel önemi, zirvenin önemi için bir test olacaktır.
Michael R.Chickick

1

Sorumu yanıtlamamış olsanız da, tahminim doğru ise, spektrumun düz olduğunu göstermek için frekans alanında miktar olan bir beyaz gürültü testi arıyorsunuz. Bu yüzden bu referansta Fisher'in kappa adı verilen Fisher periodogram testi kullanılabilir. Bağlantıya bakın.

http://www4.stat.ncsu.edu/~dickey/Spain/pdf_Notes/Spectral2.pdf

Bartlett testi referansta da belirtilmiştir. Şimdi sıfır hipotezini reddetmek, periodogramda önemli bir zirve bulmak anlamına gelir. Bu, zaman serilerinde periyodik bir bileşenin var olduğu anlamına gelir.

Test frekans alanında olduğu ve periodogram koordinatlarını içerdiği için, koordinat null hipotezi altında bir ki kare 2 dağılımına sahiptir ve bağımsızdır. Bu özel dağıtım sadece frekans alanına dönüşümden kaynaklanmaktadır. Eğer x zaman olsaydı, bu zaman alanında işe yaramazdı veya genel olarak ys için dağılım bağımsız ki kare olmazdı.

m


y

Yani y sayım verisidir ve xa sürekli açıklayıcı değişken nedir? Önceki önerilerim muhtemelen bu durumda değil, ancak sayım modelleri hakkında birçok yeni literatür var. Veri hakkında biraz daha spesifik olabilir ve sorun belki bir çözüm işaret edebilir.
Michael R.Chickick

yx

Bunun yardımcı olup olmayacağından emin değilim ama Cameron ve Trivedi sayı regresyon modelleri hakkında bir kitap yayınladı ve 2013'te ikinci bir baskı yayınladı. İşte bazı bilgiler içeren bir bağlantı: cameron.econ.ucdavis.edu/racd/count .html
Michael R.Chernick
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.