«model-selection» etiketlenmiş sorular

Model seçimi, bazı setlerden hangi modelin en iyi performansı gösterdiğine karar verme problemidir. Popüler yöntemler şunları içerir:R,2, AIC ve BIC ölçütleri, test setleri ve çapraz doğrulama. Bir dereceye kadar, özellik seçimi, model seçiminin bir alt problemidir.



3
Makine öğrenim probleminizin umutsuz olduğunu nasıl bilebilirim?
Standart bir makine öğrenme senaryosu hayal edin: Çok değişkenli büyük bir veri kümesiyle karşı karşıya kalıyorsunuz ve oldukça bulanık bir anlayışınız var. Yapmanız gereken şey, sahip olduğunuza bağlı olarak bazı değişkenler hakkında tahminlerde bulunmaktır. Her zamanki gibi, verileri temizler, açıklayıcı istatistiklere bakar, bazı modelleri çalıştırır, bunları doğrular vb., Ancak birkaç …

8
Otomatik model seçimi için algoritmalar
Otomatik model seçimi için bir algoritma uygulamak istiyorum. Kademeli bir regresyon yapmayı düşünüyorum ama her şey yapacaktır (ancak doğrusal regresyonlara dayanmalıdır). Benim sorunum bir metodoloji veya açık kaynaklı bir uygulama bulamamamdır (Java’da uyanıyorum). Aklımdaki metodoloji şöyle bir şey olurdu: Tüm faktörlerin korelasyon matrisini hesaplar birbiriyle düşük korelasyona sahip faktörleri seçmek …

6
K-katlama çapraz doğrulama işleminden sonra öngörülü bir model nasıl seçilir?
K-kat çapraz doğrulama yaptıktan sonra prediktif bir model seçmeyi merak ediyorum. Bu garip bir şekilde ifade edilebilir, bu yüzden daha ayrıntılı olarak açıklamama izin verin: K-kat çapraz onaylamayı her çalıştırdığımda, eğitim verilerinin K altkümelerini kullanıyorum ve K farklı modellerle bitirdim. K modellerinden birini nasıl seçeceğimi bilmek istiyorum, böylece onu birisine …


2
“Vahşi doğada” p-hackleme hakkında ne biliyoruz?
İfade s (ayrıca: -hacking "veri tarama" , "balık" "gözetleme" ya da) yapay olarak istatistiksel olarak anlamlı hale sonuçlarında olduğu istatistiksel uygulama hataları çeşitli ifade eder. Aşağıdakiler dahil ancak bunlarla sınırlı olmamak üzere, “daha ​​önemli” bir sonuç elde etmenin birçok yolu vardır: sadece bir kalıbın bulunduğu verilerin "ilginç" bir alt kümesini …

3
Model seçimi için iç içe çapraz doğrulama
Model seçimi için iç içe çapraz doğrulama nasıl kullanılır ? Çevrimiçi okuduklarımdan, iç içe geçmiş CV şu şekilde çalışır: Şebeke araştırması yapabildiğimiz iç CV döngüsü vardır (örneğin, mevcut her model için K-katını çalıştırma, örneğin hiperparametrelerin / özelliklerin kombinasyonu) İç katmanda kazanılan modelin performansını ayrı bir dış kat üzerinde ölçtüğümüz dış …

14
Neden sağlam (ve dirençli) istatistikler klasik tekniklerin yerine geçmedi?
Verileri kullanarak iş sorunlarını çözerken, klasik istatistiklerin altını çizdiği en az bir anahtar varsayımın yaygın olduğu yaygındır. Çoğu zaman, hiç kimse bu varsayımları kontrol etmekte hiçbir sıkıntı çekmez. Örneğin, ortak web metriklerinin çoğunun "uzun kuyruklu" olduğu (normal dağılıma göre) şimdiye dek çok iyi belgelendirildiği anlaşılmaktadır. Diğer bir örnek olarak, çevrimiçi …

5
Kademeli regresyona modern, kolay kullanılan alternatifler nelerdir?
Yaklaşık 30 bağımsız değişken içeren bir veri kümesine sahibim ve bunlar ile bağımlı değişken arasındaki ilişkiyi araştırmak için genelleştirilmiş bir doğrusal model (GLM) oluşturmak istiyorum. Bu durum için öğretildiğim yöntemin, adım adım gerilemenin artık istatistiksel bir günah olarak kabul edildiğinin farkındayım . Bu durumda hangi modern model seçim yöntemleri kullanılmalıdır?

6
Tahmini modelleme için değişken seçimi 2016'da gerçekten gerekli mi?
Bu soru, birkaç yıl önce CV'de sorulmuştu, 1) büyüklük sırasına göre daha iyi hesaplama teknolojisi (örneğin paralel hesaplama, HPC vb.) Ve 2) daha yeni teknikler, örneğin [3] ışığında bir röportaja benziyor. İlk olarak, bazı bağlamlar. Amacın hipotez testi değil, tahmini etkileme değil, görünmeyen test setindeki tahmin olduğunu varsayalım. Bu nedenle, …

2
Neden sadece üç bölüm? (eğitim, doğrulama, test)
Modelleri geniş bir veri kümesine sığdırmaya çalışırken, ortak tavsiye, verileri üç bölüme ayırmaktır: eğitim, doğrulama ve test veri kümesi. Bunun nedeni, modellerin genellikle üç "seviye" parametresine sahip olmalarıdır: ilk "parametre", model sınıfıdır (örneğin, SVM, sinir ağı, rasgele orman), ikinci parametre grubu, "düzenlileştirme" parametreleri veya "hiperparametreler" dir ( örneğin, kement ceza …

2
Değişken seçimin daha kesin bir tartışması
Arka fon Tıpta klinik araştırma yapıyorum ve birkaç istatistik dersi aldım. Doğrusal / lojistik regresyon kullanarak bir makale yayınlamamıştım ve değişken seçimini doğru yapmak istiyorum. Yorumlanabilirlik önemlidir, bu nedenle fantezi makine öğrenme teknikleri yoktur. Değişken seçim anlayışımı özetledim - birileri herhangi bir yanılgıya ışık tutabilir mi? Buna iki (1) benzer …


3
Kütle dönüşümlü cevaplı doğrusal model ve kütük bağlantılı genelleştirilmiş doğrusal model
In Bu yazıda başlıklı "Genelleştirilmiş Lineer Modeller UYGULAMALI İÇİN TIBBİ BİLGİ ARASINDA SEÇİMİ" yazarlar yazın: Genelleştirilmiş bir doğrusal modelde, ortalama, yanıtın kendisini dönüştürmek yerine, bağlantı işlevi tarafından dönüştürülür. İki dönüşüm yöntemi oldukça farklı sonuçlara yol açabilir; örneğin, log-dönüştürülmüş tepkilerin ortalaması, ortalama cevabın logaritması ile aynı değildir . Genel olarak, birincisi …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.