«model-selection» etiketlenmiş sorular

Model seçimi, bazı setlerden hangi modelin en iyi performansı gösterdiğine karar verme problemidir. Popüler yöntemler şunları içerir:R,2, AIC ve BIC ölçütleri, test setleri ve çapraz doğrulama. Bir dereceye kadar, özellik seçimi, model seçiminin bir alt problemidir.

1
logloss vs gini / auc
İki model (h2o AutoML kullanarak ikili sınıflandırıcılar) eğittim ve kullanmak için bir tane seçmek istiyorum. Aşağıdaki sonuçlara sahibim: model_id auc logloss logloss_train logloss_valid gini_train gini_valid DL_grid_1 0.542694 0.287469 0.092717 0.211956 0.872932 0.312975 DL_grid_2 0.543685 0.251431 0.082616 0.186196 0.900955 0.312662 aucve loglosskolonlar çapraz doğrulama metriklerdir (çapraz doğrulama sadece eğitim verileri kullanır). …

2
Bootstrap yeniden örnekleme konusunda en iyi önerilen ders kitapları?
Ben sadece orada hangi bootstrap üzerinde mevcut en iyi kitaplar hangisi olduğunu sormak istedim. Bununla sadece geliştiricileri tarafından yazılmış olanı kastetmiyorum. Aşağıdaki kriterleri kapsayan önyükleme için hangi ders kitabının size en uygun olduğunu belirtebilir misiniz? Uygulanabilirlik alanı, güçlü ve zayıf yönleri, model seçimi için önemi listeleyen tekniğin felsefi / epistemolojik …

1
Çok modelli çıkarım konusunda Burnham-Anderson kitabı önerilebilir mi?
R'nin öngörme paketindeki AIC'den AICc'ye yapılan varsayılan model seçim istatistiğindeki son değişikliklerin motive ettiği gibi, ikincisinin gerçekten nerede olursa olsun geçerli olup olmadığını merak ediyorum. Bu konuda bir dizi sorum var ve işte birincisi. AIC'yi her yerde AICc ile değiştirmenin , burada özetlendiği gibi, Burnham ve Anderson'ın (istatistikçi olmayanlar ) …

2
Kademeli regresyon, nüfusun r-karesi hakkında önyargılı bir tahmin sağlıyor mu?
Psikoloji ve diğer alanlarda genellikle aşağıdakileri içeren bir tür kademeli regresyon kullanılır: Kalan yordayıcılara bakın (ilk başta modelde hiçbiri yoktur) ve en büyük r-kare değişikliğine neden olan yordayıcıyı tanımlayın; R-kare değişikliğinin p-değeri alfadan (tipik olarak .05) düşükse, o zaman kestiriciyi ekleyin ve 1. adıma geri dönün, aksi takdirde durun. Örneğin, …

5
Neden AIC kullanarak model seçimi uygulamak, değişkenler için bana anlamlı olmayan p değerleri veriyor?
AIC ile ilgili bazı sorularım var ve umarım bana yardımcı olabilirsiniz. Verilerimdeki AIC'ye dayalı olarak model seçimi (geri veya ileri) uyguladım. Seçilen değişkenlerin bazıları p değeri> 0,05 ile sonuçlandı. İnsanların p-değeri yerine AIC'ye dayalı modeller seçmemiz gerektiğini söylediklerini biliyorum, bu yüzden AIC ve p-değeri iki fark kavramıdır. Birisi bana farkın …

2
Box-Jenkins model seçimi
Zaman serisi analizinde Box-Jenkins model seçim prosedürü, serinin otokorelasyon ve kısmi otokorelasyon fonksiyonlarına bakarak başlar. Bu grafikler bir ARMA modelinde uygun ve değerlerini önerebilir . Prosedür, kullanıcıdan beyaz gürültü hata terimi olan bir model üretenler arasında en uysal modeli seçmek için AIC / BIC kriterlerini uygulamasını isteyerek devam eder.pppqqq( p …

4
Çok değişkenli regresyondan önce tek değişkenli regresyonun anlamı nedir?
Şu anda küçük bir veri setine sahip olduğumuz ve bir tedavinin sonuç üzerindeki nedensellik etkisi ile ilgilenen bir sorun üzerinde çalışıyorum. Danışmanım, her bir prediktör üzerinde sonuç olarak yanıt olarak, daha sonra yanıt olarak tedavi atamasıyla tek değişkenli bir regresyon yapmamı söyledi. Yani, bir seferde bir değişkenle regresyona uymam ve …

2
Değişken seçiminde çelişkili yaklaşımlar: AIC, p değerleri veya her ikisi mi?
Anladığım kadarıyla, p-değerlerine (en azından regresyon bağlamında) dayalı değişken seçim çok kusurlu. AIC'ye (veya benzeri) dayalı değişken seçimin de benzer nedenlerle bazıları tarafından kusurlu olduğu düşünülmektedir, ancak bu biraz belirsiz görünmektedir (örneğin soruma ve bu konudaki bazı bağlantılara bakın: "Kademeli model seçimi" tam olarak nedir? ). Ancak, modelinizdeki en iyi …


2
Yığın testleri nedir?
Bir soruya yanıt olarak çoklu doğrusal varlığında model seçimi , Frank Harrell önerdi : Tüm değişkenleri modele koyun ancak rakip değişkenlerin etkilerine göre ayarlanmış bir değişkenin etkisini test etmeyin ... Rakip değişkenlerin yığın testleri güçlüdür, çünkü eş değişkenler genel olarak çoklu serbestlik derecesi ilişkilendirme testinde güçlerini birleştirir. değişkenleri tek tek …

2
Doğrulama ve model seçimi için önyüklemeyi anlama
Sanırım önyüklemenin temellerinin nasıl çalıştığını anlıyorum , ancak model seçimi veya aşırı sığmayı önlemek için önyüklemeyi nasıl kullanabileceğimi bilmiyorum. Örneğin model seçimi için, önyükleme örnekleri arasında en düşük hatayı (belki de varyans?) Veren modeli seçer misiniz? Model seçimi veya doğrulaması için önyüklemenin nasıl kullanılacağını tartışan metinler var mı? DÜZENLEME: Bu …

2
AIC ve Schwarz kriterlerini anlama
Lojistik bir model kullanıyorum. Gerçek model veri kümesinin 100'den fazla değişkeni var, ancak yaklaşık 25 değişkenin bulunduğu bir test veri kümesi seçiyorum. Ondan önce 8-9 değişkenli bir veri kümesi de yaptım. AIC ve SC değerlerinin modeli karşılaştırmak için kullanılabileceği söylendi. Değişkenin düşük p değerleri olsa bile modelin daha yüksek SC …

3
Mesafeleri ve hacimleri tanımlamak için bilgi geometrisini kullanmak… faydalı mı?
Olasılık dağılımları alanında Fisher's Information metriğini doğal bir yerel metrik olarak kullanmayı ve daha sonra mesafeleri ve hacimleri tanımlamak için entegre etmeyi savunan geniş bir literatüre rastladım . Peki bu "entegre" miktarlar aslında herhangi bir şey için yararlı mıdır? Hiçbir teorik gerekçe ve çok az pratik uygulama bulamadım. Bir adam …


3
Bayesian vs MLE, aşırı uyum sorunu
Bishop'un PRML kitabında, aşırı sığmanın Maksimum Olabilirlik Tahmini (MLE) ile ilgili bir sorun olduğunu ve Bayesian'ın bundan kaçınabileceğini söylüyor. Ama bence, aşırı takma, parametre tahmini yapmak için kullanılan yöntemle değil, model seçimi ile ilgili bir sorundur. Yani, diyelim ki ile oluşturulan bir veri kümesi sahibim, şimdi verilere uymak ve bulmak …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.