Farklı vekil modellerin öngörülerinde istikrarsızlığın etkisi
Bununla birlikte, binom analizi arkasındaki varsayımlardan biri her deneme için aynı başarı olasılığıdır ve çapraz validasyonda 'doğru' veya 'yanlış' sınıflandırmasının arkasındaki yöntemin, aynı başarı olasılığı.
Genellikle bu eşitlik, farklı vekil modellerin sonuçlarını bir araya getirmenize izin vermek için gereken bir varsayımdır.
Uygulamada, bu varsayımın ihlal edilebileceği sezgileriniz çoğu zaman doğrudur. Ancak durumun böyle olup olmadığını ölçebilirsiniz. Burada yinelenen çapraz doğrulamayı yararlı bulduğum yer: Farklı vekil modeller tarafından aynı durum için tahminlerin istikrarı, modellerin eşdeğer (kararlı tahminler) olup olmadığını yargılamanıza izin verir.
k
i⋅k
Ayrıca her bir yineleme için performansı hesaplayabilirsiniz (çizimde 3 satırlık blok). Bunlar arasındaki herhangi bir fark, vekil modellerin (birbirlerine ve ayrıca tüm durumlarda inşa edilen "büyük model" e eşdeğer olduğu varsayımının karşılanmadığı anlamına gelir. Ancak bu aynı zamanda ne kadar dengesizliğe sahip olduğunuzu da gösterir. Binom oranı için, gerçek performans aynı olduğu sürece (yani her zaman aynı vakaların yanlış tahmin edilip edilmediğinden veya aynı sayı ancak farklı vakaların yanlış tahmin edilip edilmediğinden bağımsız) düşünüyorum. Yedek modellerin performansı için belirli bir dağılımı makul bir şekilde kabul edip edemeyeceğini bilmiyorum. Ancak, bu dengesizliği rapor ederseniz, her durumda yaygın olarak sınıflandırma hatalarının raporlanmasına göre bir avantaj olduğunu düşünüyorum.kk
≪
nki
Çizim, şek. Bu yazıda 5: Beleites, C. & Salzer, R .: Küçük örnek boyutu durumlarında kemometrik modellerin kararlılığının değerlendirilmesi ve geliştirilmesi, Anal Bioanal Chem, 390, 1261-1271 (2008). DOI: 10.1007 / s00216-007-1818-6 Makaleyi
yazdığımızda, burada açıkladığım farklı varyans kaynaklarını henüz tam olarak fark etmediğimi unutmayın - bunu aklınızda bulundurun. Bu yüzden tartışmanınEtkili örneklem büyüklüğü tahmini için, her hastadaki farklı doku tiplerinin belirli bir doku tipine sahip yeni bir hasta kadar genel bilgiye katkıda bulunduğu sonucuna rağmen doğru olmayabilir (tamamen farklı bir tipim var) bu yolu gösteren kanıtlar). Ancak, bu konuda henüz tam olarak emin değilim (ne daha iyi nasıl yapılacağını ve böylece kontrol edebiliyorum) ve bu sorun sorunuzla ilgisiz.
Binom güven aralığı için hangi performans kullanılır?
Şimdiye kadar, ortalama gözlemlenen performansı kullanıyorum. Gözlenen en kötü performansı da kullanabilirsiniz: gözlenen performans 0,5'e yaklaştıkça, varyans ve dolayısıyla güven aralığı artar. Böylece, gözlenen performansın 0,5'e yakın güven aralıkları size bazı muhafazakar "güvenlik payı" verir.
Binom güven aralıklarını hesaplamak için bazı yöntemlerin, gözlenen başarı sayısı bir tamsayı değilse de işe yaradığını unutmayın. Ross, TD'de anlatıldığı gibi "Bayesyan posterior olasılığın entegrasyonu"
nu kullanıyorum: Binom oranı ve Poisson oranı tahmini için kesin güven aralıkları, Comput Biol Med, 33, 509-531 (2003). DOI: 10.1016 / S0010-4825 (03) 00019-2
(Matlab için bilmiyorum, ancak R'de binom::binom.bayes
her iki şekil parametresi 1'e ayarlanmış olarak kullanabilirsiniz).
n
Ayrıca bakınız: Bengio, Y. ve Grandvalet, Y .: K-Katlı Çapraz Doğrulamanın Varyansının Tarafsız Tahmincisi, Makine Öğrenim Araştırmaları Dergisi, 2004, 5, 1089-1105 .
(Bunlar hakkında daha fazla düşünmek araştırma yapılacaklar listemde ... ama deneysel bilimden geldiğimde, teorik ve simülasyon sonuçlarını deneysel verilerle tamamlamayı seviyorum - bu büyük bir ihtiyaç duyduğum için burada zor referans testi için bağımsız vakalar seti)
Güncelleme: Biyomiyal dağılım varsayımı haklı mı?
k
n
npn