“Rasgele örnek” ve “iid rasgele değişken” eş anlamlıları mıdır?


18

Ben "rastgele örnek" yanı sıra "iid rastgele değişken" anlamını anlamak zor zamanlar ile karşı karşıya. Birkaç kaynaktan anlam bulmaya çalıştım, ama daha da karıştı. Burada denediğim ve bilmem gerekeni gönderiyorum:

Degroot'un Olasılık ve İstatistikleri diyor:

Rastgele Örnekler / iid / Örnek Boyutu: Gerçek çizgide pf veya pdf f ile temsil edilebilecek belirli bir olasılık dağılımını düşünün f. n rastgele değişkenin X_1 olduğu söylenir . . . X1,...,XnBu değişkenler bağımsızsa ve her birinin marjinal pf veya pdf'si f ise X_n bu dağılımdan rastgele bir örnek oluşturur f. Bu tür rastgele değişkenlerin bağımsız ve özdeş dağılmış, kısaltılmış iid olduğu söylenir. Rasgele değişkenlerin n sayısını örnek büyüklüğü olarak adlandırırız.

Ama sahip olduğum diğer istatistik kitaplarından biri:

Rastgele Örneklemede, popülasyondaki her bir birimin eşit seçilme şansı (olasılığı) elde edildiğini garanti ederiz.

Yani, ben iids rastgele örnek yapı elemanları olduğunu hissediyorum ve rastgele örnek alma prosedürü rastgele örnekleme olduğunu. Haklı mıyım?

Not: Bu konuda çok kafam karıştı, bu yüzden ayrıntılı cevabı takdir edeceğim. Teşekkürler.


6
Bağımsızlık biz bütün değişkenler aynı dağıtılmış (aynı marjinal dağılıma sahip) ama edildiği bir örnek olabilir, çünkü çok önemli bir işlemdir değil bağımsız. Böyle bir örnek hala rastgele bir örnek olarak kabul edilebilir, ancak rastgele bir örnek olduğunu düşündüğünüz deneyin değil. Bu soruya bakın .
Dilip Sarwate

Soru istatistiksel olarak anlamlı görünmüyor. İid ve rasgele örnek, okur yazarlar tarafından belirlenen açıkça farklı kavramlardır.
Subhash C.Davar

2
@ subhashc.davar Onlar mı? Bir tanıma göre: "Rasgele bir örnek, bağımsız, özdeş dağılmış (IID) rasgele değişkenlerin bir dizisidir". Yani iid ve rastgele örnek aynı şey gibi görünüyor? Degroot'un Olasılık ve İstatistik'de belirtilen paragraf temelde aynı şeyi söylüyor. Kafa karıştırıcı buluyorum çünkü bir "örnek" bazen bir birey veya bir dizi birey ve bazen de rastgele değişkenler dizisidir.
Gary Chang

@Gary Chang Alıntı yaptığınız tanım pdf ile ilgilidir. Rasgele değişkenlerin örneği psikometri disiplininde popüler olmuştur. Genel olarak, güvenilirlik veya geçerlilik tahminine ve bir faktör analizi için kullanılır. Psikometri bir alan için testlerin denkliğini kurmakla ilgilenir. İid kavramının doğrusal cebirden kaynaklandığı anlaşılmaktadır. Bir örnek, bir çalışmanın amacına bağlı olarak belirli bir birey popülasyonundan ve / veya (rastgele) değişkenlerden oluşan bir popülasyondan olabilir. Günümüz istatistiklerinin ölçüm teorisinden ödünç alındığı görülmektedir.
Subhash C.Davar

Yanıtlar:


9

Diğer istatistik kitabının ne olduğunu söylemiyorsunuz, ama bunun sınırlı nüfus örneklemesi hakkında bir kitap (veya bölüm) olduğunu tahmin ediyorum .

Rastgele değişkenleri , yani rastgele değişkenin değerini düşündüğünüzde , bağımsız iseler, ve aynı şekilde dağıtılmış , özellikle tüm için ve , o zaman: burada ikincisidir merkezi an. n f ( x 1 , , x n ) = f ( x 1 ) f ( x n ) E ( X i ) = μ Var ( X i ) = σ 2 i ¯ X = i X iX1,...,Xnnf(x1,...,xn)=f(x1)f(xn)E(Xben)=μvar(Xben)=σ2ben σ2

X¯=iXin,E(X¯)=μ,Var(X¯)=σ2n
σ2

Sonlu bir popülasyonun örneklenmesi biraz farklıdır. Nüfus boyutundaysa , değiştirilmeden örneklemede boyutunda olası örnekleri ve bunlar eşlenebilirdir: Örneğin, ve ise örnek alanı ve olası örnekler: ( NN sinp(si)=1(Nn)sin N=5n=3{s1,,s10} s 1 ={1,2,3}, s 2 ={1,2,4}, s 3 ={1,2,5}, s 4 ={1,3,4},

p(si)=1(Nn)i=1,,(Nn)
N=5n=3{s1,,s10}
s1={1,2,3},s2={1,2,4},s3={1,2,5},s4={1,3,4},s5={1,3,5},s6={1,4,5},s7={2,3,4},s8={2,3,5},s9={2,4,5},s10={3,4,5}
Her bireyin oluşum sayısını sayarsanız, bunların altı olduğunu görebilirsiniz, yani her bireyin eşit bir seçilme şansı vardır (6/10). Yani her ikinci tanıma göre rastgele bir örnektir. Bireyler değil rasgele değişkenlerdir çünkü Kabaca, bu bir iid rasgele örneklem değildir: tutarlı tahmin edebilir örnek bir ortalama ile değil onun tam değerini bilmek asla ama olabilir eğer kesin nüfus ortalamasını biliyor (let tekrar ediyorum: kabaca.)siE[X]n=N-1

Let bazı polulation ortalama (ortalama boy, ortalama gelir, ...) olması. olduğunda , rastgele değişken örneklemede gibi tahmin edebilirsiniz : ama örnek ortalama varyans farklıdır: burada popülasyon yarı varyansıdır: . Faktör genellikle " sonlu popülasyon düzeltme faktörü " olarak adlandırılır.μn<N-μ

y¯s=Σben=1nyben,E(y¯s)=μ
var(y¯s)=σ~2n(1-nN-)
σ~2Σben=1N-(yben-y¯)2N--1(1-n/N-)

Bu, (rasgele değişken) iid rasgele örnek ve (sonlu popülasyon) rasgele numunenin nasıl farklı olabileceğine hızlı bir örnektir. İstatistiksel çıkarım esas olarak rasgele değişken örnekleme, örnekleme teorisi sonlu popülasyon örneklemesi ile ilgilidir.


1 Diyelim ki ampul üretiyorsunuz ve ortalama ömürlerini öğrenmek istiyorsunuz. En azından ampul üretmeye devam ederseniz, "nüfusunuz" sadece teorik veya sanal bir nüfustur. Yani bir veri oluşturma sürecini modellemelisinizve bir grup ampulü (rastgele değişken) örnek olarak yorumlayabilir. Şimdi 1000 ampul içeren bir kutu bulduğunuzu ve ortalama ömürlerini bilmek istediğinizi söyleyin. Küçük bir ampul seti (sonlu bir nüfus örneği) seçebilirsiniz, ancak hepsini seçebilirsiniz. Küçük bir örnek seçerseniz, bu ampulleri rastgele değişkenlere dönüştürmez: "all" ve "küçük bir set" arasındaki seçim size bağlı olduğundan rastgele değişken sizin tarafınızdan oluşturulur. Bununla birlikte, sınırlı bir nüfus çok büyük olduğunda (diyelim ki ülke nüfusunuz), "tümü" nü seçmek uygun olmadığında, ikinci durum birincisi olarak daha iyi ele alınmaktadır.


1
Ne demek "bireyler rastgele değişken değil?" Whuber'ın burada ve burada , rastgele değişken kavramını açıklamak için sonlu popülasyon örneklemesini kullanan gerçekten güzel cevapları var .
jsk

Demek istediğim: ise belirsizlik yok. n=N-
Sergio

Bu, bağlantılarda yapılanlarla doğrudan çelişiyor gibi görünen ifadenizi netleştirmede yardımcı olmadı. Lütfen savunmaya gerek yok. ilgili noktanın merak ettiğim ifadeyle ilgisi yok. Ayrıca, dejenere rastgele değişken rastgele değişken değil midir? n=N-
jsk

Savunma? Bu bağlantıları anlamadınız. Whubner'ın dediği gibi, a) kutudaki biletler modeli, "bu yüksek lisans düzeyinde şeyler" şikayetlerinden kaçınmak için sadece bir oyuncak örneğidir ; b) biletleri bir kutuya “nüfus” olarak adlandırmaktan kaçınır ve nedenini açıklar. Yani bir çelişki yok . Eğer kişi ne dediklerini anlayabilirse. BTW, ben rastgele bir değişken değilim, değil mi?
Sergio

IMHO, elbette.
Sergio

2

Ben kolayca herhangi ders kitabı olarak teslim alabilirsiniz olasılık tanımları ve formüller ile delik olmaz (veya burada başlamak için iyi bir yerdir)

Bunu sezgisel olarak düşünün, rastgele örnek rastgele değerler kümesidir. Genel olarak, değerlerin her biri aynı veya farklı şekilde dağıtılabilir. örneği, her bir değerin diğerleriyle aynı dağılımdan gelmesi ve değerinin diğer değerler üzerinde herhangi bir etkisi olmaması için özel bir rastgele örnek örneğidir. Bağımsızlık , değerlerin üretildiğiyle ilgilenirben.ben.d.hÖw

ben.ben.d örnek: desteden rastgele bir kart çizin ve geri getirin (bunu 5 kez yapın). 5 fark edilen değer (kart) alacaksınız . Bu değerlerin her biri tekdüze bir dağılımdan gelir (sonuçların her birini elde etmek için eşit olasılık vardır) ve her çekiliş diğerlerinden bağımsızdır (yani ilk çekilişte bir maça ası almanız, etkilemez. herhangi bir şekilde sonuç başka çekilişlerde alabilirsiniz).

non- örnek: Şimdi aynı şeyi yapın, ancak kartı desteye geri döndürmeden (umarım şimdiye kadar farkı doldurursunuz). Bunu yaptıktan sonra tekrar 5 fark edilmiş değere (kart) sahip olacaksınız. Ancak açıkça bağımlıdırlar (maça asını ilk çekilişte çizmeniz, 2. çekilişe girme şansınız olmayacağı anlamına gelir).ben.ben.d.


1

Genellikle X ile yazılmış bir Rastgele Değişken, olası değerleri rastgele bir fenomenin sayısal sonuçları olan bir değişkendir. Rastgele fenomen, rastgele bir değişkenin - bir madeni paranın 10 tos'undaki kafa sayısı veya bir örnekte gelir / yükseklik vb.
Daha genel olarak Rastgele Değişken, rastgele sonuçları sayısal değerlerle eşleştiren bir fonksiyondur. Her gün güneşli, bulutlu veya yağmurlu olabilir. Yağmurlu ise 1, bulutlu ise 2 ve güneşli ise 3 değerini alan bir Rastgele Değişken tanımlayabiliriz. Rastgele bir değişkenin alanı, olası sonuçların kümesidir.
Rastgele Bir Değişken oluşturmak için kesin olarak tahmin edilemeyen olası sonuçlarla ilişkili bir süreç veya deney olmalıdır.

Şimdi bağımsızlık konusuna geliyor. Bunlardan birinin değeri diğerinin PDF'sini etkilemiyorsa iki Rastgele Değişken bağımsızdır. Diğer değişken hakkında bir şeyler bildiğimizde, bir değişkenin farklı değerlerinin olasılıklarına ilişkin tahminlerimizi gözden geçirmiyoruz. Bu nedenle bağımsızlık durumunda, Posterior PDF'ler Önceki PDF'lerle aynıdır. Örneğin, tarafsız bir bozuk parayı tekrar tekrar attığımızda, 5 vuruştan önce elde ettiğimiz bilgiler mevcut atış hakkında tahminimizi etkilemez, her zaman 0,5 olacaktır. Bununla birlikte, madalyonun önyargısı bilinmiyorsa ve Rastgele Değişken olarak modelleniyorsa, önceki 5 fırçanın sonucu mevcut maşa ile ilgili tahminlerimizi etkiler, çünkü madalyonun bilinmeyen önyargısı ile ilgili çıkarımlarda bulunmamızı sağlar.

Şimdi Örnekleme konusuna geliyor. Örneklemenin amacı, bilinmeyen ve çıkarılması gereken temel bir dağılımın özellikleri hakkında bizi bilgilendirmektir. Bir Dağılımın, Örnek Alandaki (aynı zamanda bir Koşullu Evren de olabilir) olası sonuçların göreli olasılığını ifade ettiğini unutmayın. Örneklediğimizde, Örnek uzayından sınırlı sayıda sonuç seçtik ve Örnek Alanını daha küçük, daha yönetilebilir bir ölçekte yeniden üretiyoruz. Eşit olasılık daha sonra Örneklemdeki Sonuçların olasılığını değil Örnekleme sürecini ifade eder. Eşit olasılık örneklemesi, Numunenin orijinal Numune Alanındaki sonuçların oranlarını yansıtacağını ima eder. Örneğin 10'a sorarsak, 000 kişi daha önce tutuklandıysa, sona erdireceğimiz numunenin Nüfusu - Örnek Alanı - temsil etmemesi muhtemeldir, çünkü tutuklanacak kişiler cevap vermeyi reddedebilir, bu nedenle olası sonuçların oranı (tutuklandı - tutuklanmadı) sistematik nedenlerle örneklemimiz ve popülasyon arasında farklılık gösterecektir. Veya bir anket yapmak için belirli bir mahalleyi seçersek, sonuçlar bir bütün olarak şehri temsil etmeyecektir. Dolayısıyla, eşit olasılık örneklemesi, örneğimizdeki olası sonuçların oranlarının Nüfus / Örnek Alanındaki sonuçların oranlarından farklı olduğuna inanmamızı sağlayan saf saflıktan başka sistematik nedenlerin olmadığı anlamına gelir. bu nedenle olası sonuçların oranı (tutuklandı - tutuklanmadı) sistematik nedenlerle örneklemimiz ve nüfus arasında farklılık gösterecektir. Veya bir anket yapmak için belirli bir mahalleyi seçersek, sonuçlar bir bütün olarak şehri temsil etmeyecektir. Dolayısıyla, eşit olasılık örneklemesi, örneğimizdeki olası sonuçların oranlarının Nüfus / Örnek Alanındaki sonuçların oranlarından farklı olduğuna inanmamızı sağlayan saf saflıktan başka sistematik nedenlerin olmadığı anlamına gelir. bu nedenle olası sonuçların oranı (tutuklandı - tutuklanmadı) sistematik nedenlerle örneklemimiz ve nüfus arasında farklılık gösterecektir. Veya bir anket yapmak için belirli bir mahalleyi seçersek, sonuçlar bir bütün olarak şehri temsil etmeyecektir. Dolayısıyla, eşit olasılık örneklemesi, örneğimizdeki olası sonuçların oranlarının Nüfus / Örnek Alanındaki sonuçların oranlarından farklı olduğuna inanmamızı sağlayan saf saflıktan başka sistematik nedenlerin olmadığı anlamına gelir.


-2

Rasgele bir örnek, rasgele değişkenlerin bir sekansının gerçekleştirilmesidir. Bu rastgele değişkenler iid olabilir veya olmayabilir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.