«resampling» etiketlenmiş sorular

Yeniden örnekleme bir örnekten numune alıyor. Yaygın kullanım alanları jackknifing (alt örnek alma, örneğin 1 hariç tüm değerler) ve bootstrapping (değiştirme ile örnekleme). Bu teknikler, analitik olarak türetilmesi zor veya imkansız olduğunda örnekleme dağılımının sağlam bir tahminini sağlayabilir.

2
Örnekleme / simülasyon yöntemleri: monte edilmiş carlo, bootstrapping, jackknifing, çapraz doğrulama, randomizasyon testleri ve permütasyon testleri
Farklı yeniden örnekleme yöntemleri (Monte Carlo simülasyonu, parametrik önyükleme, parametrik olmayan önyükleme, jackknifing, çapraz doğrulama, rastgele testler ve permütasyon testleri) ve bunların R'yi kullanarak kendi bağlamlarındaki uygulamaları arasındaki farkı anlamaya çalışıyorum. Diyelim ki aşağıdaki durum var - ANOVA'yı Y değişkeni ( Yvar) ve X değişkeni ( Xvar) ile gerçekleştirmek istiyorum …

5
CV / Bootstrap kullanarak makine öğrenim algoritmalarını çalıştırabilir misiniz?
Bu soru kesin bir cevap alamayacak kadar açık uçlu olabilir, ama umarım değil. SVM, GBM, Rastgele Orman vb. Gibi makine öğrenmesi algoritmaları, genellikle bazı rehberlik kurallarının ötesinde, her bir veri setine ayarlanması gereken bazı ücretsiz parametrelere sahiptir. Bu genellikle, en iyi genelleme hatasını veren parametre setine uyması için bir çeşit …

2
Önyükleme, tahmin edicinin örnekleme dağılımını yaklaşık olarak ne kadar gösterir?
Son zamanlarda bootstrap okuduktan sonra, beni hala şaşırtan kavramsal bir soru buldum: Bir popülasyonunuz var ve popülasyonu temsil etmek için P kullandığım bir popülasyon niteliğini, yani bilmek istiyorsunuz . Bu θ örneğin nüfus ortalama olabilir. Genellikle popülasyondaki tüm verileri alamazsınız. Böylece N popülasyonundan N büyüklüğünde bir X örneği çizersiniz. Diyelim …

2
Neden tabakalı çapraz doğrulama kullanılır? Bu neden varyansa bağlı faydaya zarar vermez?
Bana, özellikle cevap sınıfları dengesiz olduğunda, tabakalı çapraz doğrulama kullanmanın faydalı olduğu söylendi. Çapraz onaylamanın bir amacı, orijinal eğitim verisi örneğimizin rastgelelik durumunun hesaba katılmasına yardımcı olmaksa, her bir katlamanın kesinlikle aynı sınıf dağılımına sahip olmasını sağlamak, orijinal eğitim setinizin temsili bir sınıf dağılımına sahip olduğundan emin olmadığınız sürece, buna …

2
permütasyon testinin varsayımları nelerdir?
Permütasyon testlerinin varsayımları olmadığı sık sık bildirilmektedir, ancak bu kesinlikle doğru değildir. Örneğin, numunelerimin bir şekilde korelasyonu varsa, etiketlerine izin vermenin yapılacak doğru şey olmadığını hayal edebiliyorum. Bu sorun hakkında bulduğumun tek kelimesi wikipedia'dan gelen bu cümledir: "Bir permütasyon testinin arkasındaki önemli bir varsayım, gözlemlerin sıfır hipotezi altında değişebilir olmasıdır." …

2
Caret yeniden örnekleme yöntemleri
caretÇeşitli modelleme prosedürlerini test etmek için R'deki kütüphaneyi kullanıyorum . trainControlNesne bir yeniden örnekleme yöntemini belirtmek için olanak sağlar. Yöntemler, aşağıdakilerde anlatılmıştır belgeler bölüm 2.3 ve şunları içerir: boot, boot632, cv, LOOCV, LGOCV, repeatedcvve oob. Bunlardan bazılarının çıkarılması kolay olsa da, bu yöntemlerin hepsi açıkça tanımlanmamıştır. Bu yeniden örnekleme yöntemlerine …
20 r  resampling  caret 

2
Aşırı Örneklenmiş Dengesizlik Verilerinde Sınıflandırmanın Test Edilmesi
Ciddi dengesiz veriler üzerinde çalışıyorum. Literatürde, yeniden örnekleme (aşırı veya düşük örnekleme) kullanarak verileri yeniden dengelemek için çeşitli yöntemler kullanılmaktadır. İki iyi yaklaşım: SMOTE: Sentetik Azınlık Aşırı Örnekleme Teknikleri ( SMOTE ) ADASYN: Dengesiz Öğrenme için Uyarlanabilir Sentetik Örnekleme Yaklaşımı ( ADASYN ) ADASYN'i uyarladım çünkü uyarlanabilir yapısı ve çok …

2
IID örnekleme testi
Örneklemenin IID (Bağımsız ve Özdeş Dağıtılmış) olup olmadığını nasıl test eder veya kontrol edersiniz? Gauss ve Özdeşçe Dağıtılmış demek istemiyorum, sadece IID. Ve aklıma gelen fikir, numuneyi tekrar tekrar eşit büyüklükte iki alt numuneye ayırmak, Kolmogorov-Smirnov testini yapmak ve p-değerlerinin dağılımının düzgün olup olmadığını kontrol etmektir. Bu yaklaşım hakkında herhangi …

2
“Bootstrap validation” (diğer bir deyişle “çapraz doğrulamayı yeniden örnekleme”) prosedürü nedir?
"Önyükleme doğrulaması" / "çapraz doğrulamayı yeniden örnekleme" benim için yeni, ancak bu sorunun cevabı ile tartışıldı . 2 tür veri içerir: Simüle edilmiş veriler gerçek verilerle aynı boyuta ulaşıncaya kadar değiştirilerek yeniden örnekleme ile gerçek verilerden belirli bir simüle edilmiş veri kümesi oluşturulduğu gerçek veriler ve simüle edilmiş veriler. Bu …

2
Bootstrap yeniden örnekleme konusunda en iyi önerilen ders kitapları?
Ben sadece orada hangi bootstrap üzerinde mevcut en iyi kitaplar hangisi olduğunu sormak istedim. Bununla sadece geliştiricileri tarafından yazılmış olanı kastetmiyorum. Aşağıdaki kriterleri kapsayan önyükleme için hangi ders kitabının size en uygun olduğunu belirtebilir misiniz? Uygulanabilirlik alanı, güçlü ve zayıf yönleri, model seçimi için önemi listeleyen tekniğin felsefi / epistemolojik …

1
Bu zaman serilerini yeniden örnekleme yöntemi literatürde biliniyor mu? Bir adı var mı?
Son zamanlarda zaman serilerini yeniden örneklemenin yollarını arıyordum, Uzun bellek işlemlerinin otomatik korelasyonunu yaklaşık olarak koruyun. Gözlemlerin alanını koruyun (örneğin, yeniden örneklenmiş bir tamsayılar dizisi dizisi hala bir tamsayı dizisidir). Gerekirse yalnızca bazı ölçekleri etkileyebilir. uzunluğunda bir zaman dizisi için aşağıdaki permütasyon şemasını buldum 2N2N2^N: Zaman serilerini birbirini izleyen çiftler …


1
Örnek ortalama önyükleme yaparken merkezleme gerekli mi?
Örneklemin dağılımının yaklaşık olarak nasıl hesaplanacağını okurken parametrik olmayan önyükleme yöntemiyle karşılaştım. Görünüşe göre nin dağılımı dağılımı ile yaklaşık olabilir , burada , önyükleme örneği. ˉ X ∗ n - ˉ X n ˉ X ∗ nX¯n−μX¯n−μ\bar{X}_n-\muX¯∗n−X¯nX¯n∗−X¯n\bar{X}_n^*-\bar{X}_nX¯∗nX¯n∗\bar{X}_n^* O zaman sorum şu: Merkezlemeye ihtiyacım var mı? Ne için? Değil sadece yaklaşık …


1
Neden her zaman bootstrap CI kullanmıyorsunuz?
Bootstrap CI'lerin (ve bartikülerdeki BCa) normal olarak dağıtılan verilerde nasıl performans gösterdiğini merak ediyordum. Çeşitli dağıtım türlerindeki performanslarını inceleyen çok fazla iş var gibi görünüyor, ancak normal olarak dağıtılan veriler üzerinde hiçbir şey bulamadı. İlk önce çalışmak bariz bir şey gibi göründüğünden, sanırım kağıtlar çok eski. R önyükleme paketini kullanarak …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.