Lisansüstü düzeyde istatistiksel kavramları daha iyi anlamak için bilgisayar simülasyonlarını kullanma


11

Merhaba, İstatistik alanında lisansüstü bir ders alıyorum ve Test istatistiklerini ve diğer kavramları ele alıyoruz.

Bununla birlikte, formülleri sık sık uygulayabiliyorum ve işlerin nasıl çalıştığına dair bir tür sezgi geliştirebiliyorum, ancak belki de çalışmamı simüle edilmiş deneylerle desteklersem, eldeki sorunlara daha iyi sezgi geliştireceğim hissine kapılıyorum. .

Bu yüzden, sınıfta tartıştığımız bazı kavramları daha iyi anlamak için basit simülasyonlar yazmayı düşünüyorum. Şimdi Java demek için kullanabilirsiniz:

  1. Normal ortalama ve standart sapma ile rastgele bir popülasyon üretin.
  2. Sonra küçük bir örnek alın ve Tip-I ve Tip-II hatalarını ampirik olarak hesaplamaya çalışın.

Şimdi sorularım:

  1. Bu, sezgiyi geliştirmek için meşru bir yaklaşım mı?
  2. Bunu yapacak yazılım var mı ( SAS?, R?)
  3. Bu İstatistikte böyle bir programlamayla ilgilenen bir disiplindir: deneysel istatistikler?, hesaplama istatistikleri? Simülasyon?

1
Neler olup bittiğini daha iyi anlamak için simülasyonu sürekli kullanıyorum. Bu tür denemeleri (hatta Excel) yapmak için hemen hemen her programlama dilini veya istatistiksel programı kullanabilirsiniz.
John

1
+1, simülasyonlar ve rakamlar, sezgi oluşturmak için en yararlı tekniklerden 2'sidir. Onları başkalarının ve kendimin bir şeyler anlamalarına yardımcı olmak için yaygın olarak kullandım. İşleri göstermek için sims kullanan CV sorularına birçok cevap var. Bazı bağlantılar istiyorsanız, sim'leri bu şekilde kullanan bazı cevaplarımı kolayca listeleyebilirim. Burada da bu damardaki CV hakkında bir soru sorabilirsiniz; örneğin, '_____ anlamaya çalışıyorum, ama zorlanıyorum, birisi daha net hale getirecek bir sim ile bir açıklama yapabilir mi?' veya 'Bu sim'i yaptım ve bu şekilde çalıştığını gösteriyor, doğru mu?'
gung - Monica'yı eski durumuna getirin

4
Bu sitenin yüksek standartlarını ve beklentilerini karşılamak için, bundan faydalanacak her cevapta simülasyon (teorik türevler ve çizimler) kullanıyorum. Son yanıtlarımın büyük bir kısmı bir çeşit simülasyon, özellikle de r etiketi ile ilgili bir soruya hemen hemen her türlü cevabı içerecektir . Örneğin, ilgileniyorsanız arama sayfasından bunlara bakabilirsiniz .
whuber

2
@ Whuber'ın cevaplarına bakarak birçok harika şey bulacaksınız. Yanıtlarım (ve programlama yeteneklerim) daha az karmaşık olma eğiliminde olduğundan, güzel bir 1. adım yapabilirler. Burada bir GLiM'deki en iyi bağlantıyı seçmek için model uyumunun zor olduğunu göstermek için bir sim kullanıyorum: logit ve probit modelleri arasındaki fark . Burada, t-testinde grup boyutları olarak gücün nasıl eşitsiz hale geldiğini göstermek için bir sim kullanıyorum: farklı örnek boyutlarından ortalamaların karşılaştırmasını nasıl yorumlamalıyım .
gung - Monica'yı eski durumuna getirin

2
Bu CV sorusu: istatistiksel-simülasyon açıklaması , bu konunun okuyucuları için de ilgi çekici olabilir.
gung - Monica'yı eski durumuna getirin

Yanıtlar:


7

Sorunuzu beğendim, ancak 2 ve 3'e özel cevaplarınız yok mu? SAS gibi yazılım paketlerinin (sadece SAS / STAT değil, SAS ürünlerinden geniş çapta bahsetmişken) simülasyonu kolaylaştıracak araçlara sahip olabileceğini düşünüyorum ama kesin olarak söyleyemem. Bu tür şeylerin matematik veya istatistik dalı olarak uygun olduğunu düşünmüyorum.

Şimdi 1. soruya odaklanmak istiyorum. Simülasyon, her düzeyde istatistikleri öğrenmeye ve genel olarak istatistiksel araştırmalara yardımcı olabilir. Gerçekten de simülasyon ve hesaplamaya odaklanmış dergiler var. FDA bile, klinik çalışmaların tasarlanmasında simülasyonun öneminin farkındadır ve sonuçları tahmin etmeye yardımcı olur.

1960'larda Julian Simon, simülasyonu motive edici olarak kullanarak giriş istatistiklerini öğretti. Tartışmalı olmasına rağmen daha sonra Efron'dan önce yeniden örnekleme (permütasyon ve bootstrap) yaptığını iddia etti. 1969'da bu fikirleri kullanan bir kitap yayınladı. Bu teori kesinlikle yoktu ve sadece bir öğretim yardımcısıydı ve istatistiksel tahmine yeni bir yaklaşım değildi. Efron ile ve Efron'dan sonra gelen matematiksel özellikleri geliştirmedi.

Giriş istatistikleri için örnekleme dağılımlarını göstermek, merkezi limit teoreminin nasıl ortaya çıktığını göstermek için simülasyon yapmak ve quincunx aracılığıyla fiziksel simülasyon, merkezi limit teoreminin DeMoivre - Laplace versiyonunu göstermek için yararlıdır.

Bazen sezgiyi arttırır. Monty Hall sorununun Paul Erdos gibi matematikçiler için bile şaşırtıcı ve görünüşte paradoksal olduğunu düşünüyorum. Ancak oyunu simüle etmek genellikle çok inandırıcıdır. Olasılıkta ve simülasyonun yapabileceği pek çok sorun var, sanırım yardım.

1978'de aşırı değer teorisinde doktoram üzerinde çalışırken kanıtlamaya çalıştığım bir sınır teoremi için sezgisel bir fikrim vardı. Matematikle mücadele ettim. Sonra stokastik süreci simüle etmeye karar verdim ve simülasyon sonuçlarımı "doğruladı". Bu bana bunu kanıtlama konusunda güven verdi.

Bu yüzden lisansüstü düzeyde ve ötesinde simülasyon iki şekilde faydalı olabilir.

  1. Soru 1'deki öneri olarak sezgiyi geliştirmeye yardımcı olmak için

  2. Tezimde olduğu gibi sezgiyi doğrulamak için


SAS ve R'de Monty Hall sorununu ele alan birini buldum burada sas-and-r.blogspot.com/2010/01/… - keyfini çıkarın
user1172468

Stanford Üniversitesi'nden Susan Holmes, birkaç yıl önce web sitesinde Monty Hall oyun simülasyonunu koydu. Bize @ user1172468 birçok kişinin teor web sitelerine simülasyonlar yapabileceğini ve muhtemelen simülasyon yaptığını hatırlattığınız için teşekkür ederiz.
Michael R.Chickick

R ile Monty Hall sorunu (takip edilmesi çok kolay): bodowinter.com/tutorial/bw_doodling_monty_hall.pdf
vasili111

8
  1. Evet. Sonuçta sizin sezginizle ilgili.
  2. R sana iyi gelirdi. Java'yı zaten biliyorsanız (veya bu konuda başka bir "standart programlama dili") kodlama sizin için oldukça kolay olacaktır.
  3. Hesaplamalı istatistikler, istatistiksel yöntemleri uygulamak için algoritmaların tasarımı ile ilgilenir, muhtemelen burada tarif etmeye çalıştığınız şeye en yakın olanıdır.

Kursunuzla eğlenin!


Bence cevabınız benimkini tamamlıyor. 1'e ayrıntılı bir cevap verdim ve 2 ve 3'e daha kesin bir cevap verdiniz. Birkaç dakika içinde soruyu cevaplıyor gibi görünüyorsunuz. Muhtemelen örtüştük. Her neyse 2 iyi cevap verdin ve ben onlar için size oy verdim!
Michael R.Chernick

Yaşasın için teşekkürler! Cevap vermede bir adım öndesin. :)
usεr11852

Cevap vermeye devam et. Dinleneceğim. Günlük temsil sınırım neredeyse dolmuştu.
Michael R.Chickick

Millet, her iki cevabın da iyi olduğunu düşündüm. @ Michael'ın cevabını seçtim, çünkü sadece bir doğru cevabı seçebiliyorum ve eldeki daha temel bazı konuları ele aldım.
user1172468

1
@ user1172468 Gerçekten açıklamanıza gerek yok ama bunu yapmanız çok hoş.
Michael R.Chernick

4

R için TeachingDemos paketi, sizinkiyle benzer düşünce sürecinden doğmuş, kavramları farklı şekillerde görselleştirmeye ve anlamaya çalışmıştır. Paket içinde bazı temel kavramların anlaşılmasına yardımcı olmak için simülasyon kullanan işlevler vardır. Geliştirme sürümü (R-forge, ancak henüz CRAN'da değil), simülasyonlarla ilgili daha fazla yardım için simülasyon işlevleri oluşturmak için kullanılabilen bir "simfun" işlevi içerir.


1
Zaten
CRAN'da

1
Ayrıca R ile istatistikler için diğer Öğretme ve öğrenme bağlantılarının listesi: cran.r-project.org/web/views/TeachingStatistics.html
vasili111
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.