Bu, ekonometride seçim modelinin bir varyasyonudur. Burada yalnızca seçilen örnek kullanılarak yapılan tahminlerin geçerliliği
. İşte olan hastalığı durumu.Pr(Yi=1∣Xi,Di=1)=Pr(Yi=1∣Xi,Di=0) iDii
Daha fazla ayrıntı vermek için aşağıdaki gösterimleri tanımlayın:
ve ; , örneğindeki olayı ifade eder . Ayrıca, nin basitlik açısından bağımsız olduğunu varsayalım . π 0 = Pr ( D i = 0 ) S i = 1 i D i X iπ1=Pr(Di=1)π0=Pr(Di=0)Si=1iDiXi
Olasılığı bir birim için numune içinde
yinelenen beklenti yasası ile. Hastalık durumu ile ilgili şartlı varsayalım ve diğer değişkenlerin , sonuç
bağımsızdır . Sonuç olarak,
Pr ( Y i = 1 ∣ X i , S i = 1 )Yi=1i DiXiYiSi Pr ( Y i = 1 ∣ X i , S i = 1 )
Pr(Yi=1∣Xi,Si=1)===E(Yi∣Xi,Si=1)E{E(Yi∣Xi,Di,Si=1)∣Xi,Si=1}Pr(Di=1∣Si=1)Pr(Yi=1∣Xi,Di=1,Si=1)+Pr(Di=0∣Si=1)Pr(Yi=1∣Xi,Di=0,Si=1),
DiXiYiSiPr(D i =1∣S i =1)= π 1 p i 1Pr(Yi=1∣Xi,Si=1)=Pr(Di=1∣Si=1)Pr(Yi=1∣Xi,Di=1)+Pr(Di=0∣Si=1)Pr(Yi=1∣Xi,Di=0).
görmek kolaydır olduğu
Burada ve örnekleme planınız tanımlandığı gibidir. Böylece,
pi1pi0Pr(Yi=1∣Xi,Si=1)=π1pi1Pr(Di=1∣Si=1)=π1pi1π1pi1+π0pi0 and Pr(Di=0∣Si=1)=π0pi0π1pi1+π0pi0.
pi1pi0Pr(Yi=1∣Xi,Si=1)=π1pi1π1pi1+π0pi0Pr(Yi=1∣Xi,Di=1)+π0pi0π1pi1+π0pi0Pr(Yi=1∣Xi,Di=0).
Eğer ,
ve örnek seçim sorununu atlayabilirsiniz. Öte yandan, ,
. Özel bir durum olarak, logit modelini düşünün,
Pr(Yi=1∣Xi,Di=1)=Pr(Yi=1∣Xi,Di=0)Pr(Yi=1∣Xi,Si=1)=Pr(Yi=1∣Xi),
Pr(Yi=1∣Xi,Di=1)≠Pr(Yi=1∣Xi,Di=0)Pr(Yi=1∣Xi,Si=1)≠Pr(Yi=1∣Xi)
Pr(Yi=1∣Xi,Di=1)=eX′iα1+eX′iα and Pr(Yi=1∣Xi,Di=0)=eX′iβ1+eX′iβ.
ve arasında sabit
olsa bile , sonuçta elde edilen dağılım logit oluşumunu korumaz. Daha da önemlisi, parametrelerin yorumları tamamen farklı olacaktır. Umarım, yukarıdaki argümanlar probleminizi biraz açıklığa kavuşturmaya yardımcı olur.
pi1pi0i
ek bir açıklayıcı değişken olarak dahil ve modeli . Kullanarak geçerliliğini haklı çıkarmak için , biz kanıtlamak gerektiğini , ki bu yeterli bir istatistiğidir . Örnekleme işleminiz hakkında daha fazla bilgi olmadan, bunun doğru olup olmadığından emin değilim. Soyut bir gösterim kullanalım. Gözlenebilirlik değişkeni , ve diğer rasgele değişkenlerin rastgele fonksiyonu olarakDiPr(Yi∣Xi,Di)Pr(Yi∣Xi,Di)Pr(Yi∣Xi,Di,Si=1)=Pr(Yi∣Xi,Di)DiSiSiDiZi . Göstermek . Eğer
bağımsızdır şartına ve , elimizdeki
bağımsızlığın tanımı ile. Ancak, bağımsız değildir kondüsyonlamanın sonra ve ,
sezgisel hakkında gerekli bazı bilgiler içermektedir
ve genel olarakSi=S(Di,Zi)ZiYiXiDiPr(Yi∣Xi,Di,S(Di,Zi))=Pr(Yi∣Xi,Di)ZiYiXiDiZiYiPr(Yi∣Xi,Di,S(Di,Zi))=Pr(Yi∣Xi,Di) . Bu nedenle, 'ancak' durumda, örnek seçiminin cehaleti çıkarım için yanıltıcı olabilir. Ekonometride örnek seçme literatürüne pek aşina değilim. Microeconometrics: methods and applications' by Cameron
and Trivedi (especially the Roy model in that chapter). Also G. S.
Maddala's classic book
Ekonometride sınırlı bağımlı ve nitel değişkenlerin 16. Bölümü'nün 'örnek seçimi ve ayrık sonuçlarla ilgili sorunların sistematik bir şekilde ele alınmasını tavsiye ederim .