«model-selection» etiketlenmiş sorular

Model seçimi, bazı setlerden hangi modelin en iyi performansı gösterdiğine karar verme problemidir. Popüler yöntemler şunları içerir:R,2, AIC ve BIC ölçütleri, test setleri ve çapraz doğrulama. Bir dereceye kadar, özellik seçimi, model seçiminin bir alt problemidir.

1
Bir modelden terim düştükten sonra uygun kalan serbestlik dereceleri
Bu sorunun etrafındaki tartışmaya ve özellikle Frank Harrell'in yorumuna, indirgenmiş bir modelde (yani, birkaç açıklayıcı değişkenin test edildiği ve reddedildiği bir varyans tahmininin) Ye'in Genelleştirilmiş Serbestlik Dereceleri kullanması gerektiği yorumunu yansıtıyorum . Profesör Harrell, bunun orijinal "tam" modelin (serbest bırakma modelinin) kalan serbestlik derecelerine (bir dizi değişkenin reddedildiği) son bir …

4
CART kullanırken “değişken önemi” nasıl ölçülür / derecelendirilir? (özellikle R'den {rpart} kullanarak)
Rpart (R) kullanarak bir CART modeli (özellikle sınıflandırma ağacı) oluştururken, modele tanıtılan çeşitli değişkenlerin önemini bilmek genellikle ilginçtir. Dolayısıyla benim sorum şu: Bir CART modelinde katılımcı değişkenlerin değişken önem derecesini sıralamak / ölçmek için hangi ortak önlemler var? Ve bu nasıl R kullanılarak hesaplanabilir (örneğin, rpart paketini kullanırken) Mesela, işte …

3
AIC farklı model tipleri arasında karşılaştırma yapabilir mi?
Doğrusal olmayan modelleri R'de karşılaştırmak için AIC'yi (Akaike'ın Bilgi Ölçütü) kullanıyorum. Farklı model türlerinin AIC'lerini karşılaştırmak geçerli midir? Spesifik olarak, glm ile takılmış bir modeli karşılaştırırken, glmer (lme4) tarafından takılan rastgele etki terimine sahip bir modeli karşılaştırıyorum. Olmazsa, böyle bir karşılaştırma yapmanın bir yolu var mı? Yoksa fikir tamamen geçersiz …


4
Model belirsizliğini ele almak
CrossValidated toplumundaki Bayesanların model belirsizlik problemini nasıl gördüklerini ve bununla nasıl başa çıkmayı tercih ettiklerini merak ediyordum ? Sorumu iki bölümden ortaya çıkarmaya çalışacağım: Model belirsizliği ile (deneyiminize / görüşünüze göre) ne kadar önemli? Makine öğrenen topluluğunda bu konuyla ilgili herhangi bir makale bulamadım, bu yüzden sadece nedenini merak ediyorum. …

5
Karışık bir modelde bir faktörü rastgele olarak görmenin ters tarafı nedir?
Birkaç nedenden ötürü bir model faktörünü rastgele olarak etiketlemenin faydalarını benimseme konusunda bir sorunum var. Bana göre, neredeyse her durumda olduğu gibi, optimal çözüm tüm faktörleri sabit olarak ele almaktır. İlk olarak, sabit vs rastgele ayrımı oldukça keyfidir. Standart açıklama, eğer kişi kendi başına belirli deneysel birimlerle ilgileniyorsa, o zaman …

4
Bu analiz teknikleri hakkında küresel bir vizyonunuz var mı?
Şu anda, çıktısının girdisiyle nasıl ilişkili olduğunu anlamak için, hepimizin yaptığı gibi, temelde ihtiyacım olan bir . Buradaki özellik, verilerin bana her seferinde bir parça verilmiş olması, böylece her yeni aldığımda analizimi güncellemek istiyorum . Gerekli olan tüm verilere sahip olduğunuz ve tüm verilerinizi aynı anda kullanarak hesaplamalarınızı yaptığınız "toplu …

2
Konu modellerinde konu dengesi
Bir dizi açık uçlu makalenin içeriği hakkında biraz bilgi edinmek istediğim bir proje üzerinde çalışıyorum. Bu özel projede 148 kişi, daha büyük bir deneyin parçası olarak varsayımsal bir öğrenci organizasyonu hakkında yazılar yazdı. Alanımda (sosyal psikoloji), bu verileri analiz etmenin tipik yolu, makaleleri elle kodlamak olsa da, bunu nicel olarak …

3
AIC ve zaman serilerinde çapraz onaylama: küçük örneklem durumu
Bir zaman serisi ayarında model seçimi ile ilgileniyorum. Somutluk için, farklı gecikme sıralarına sahip bir ARMA model havuzundan bir ARMA modelini seçmek istediğimi varsayalım. Nihai amaç tahmin etmek . Model seçimi yapılabilir çapraz doğrulama, bilgi kriterlerinin kullanılması (AIC, BIC), diğer yöntemlerin yanı sıra. Rob J. Hyndman, zaman serileri için çapraz …

2
Neden Wilks'in 1938'i yanlış tanımlanmış modellerde işe yaramaz?
Ünlü 1938 makalesinde (" Karmaşık hipotezlerin test edilme olasılığı oranının büyük örneklem dağılımı ", Matematiksel İstatistik Annals, 9: 60-62), Samuel Wilks, ( oranı) ' nın asimptotik dağılımını türetmiştir. iç içe hipotezler için, daha büyük hipotezin doğru bir şekilde belirtildiği varsayımı altında. Sınırlayıcı dağılımı (ki-kare) ile serbestlik derecesini daha hipotez ve …

4
Shao'nun dışarıda bırakılma çapraz onaylama sonuçları ne zaman geçerlidir?
Çapraz Doğrulama ile Doğrusal Model Seçimi adlı makalesinde , Jun Shao, çok değişkenli doğrusal regresyonda değişken seçimi problemi için, bir kez dışarıda bırakılma çapraz doğrulama yönteminin (LOOCV) 'asimptotik olarak tutarsız' olduğunu göstermektedir. Düz İngilizce olarak, çok değişkenli modelleri seçme eğilimindedir. Bir simülasyon çalışmasında, Shao, en az 40 gözlem için bile, …

1
Uygun puanlama kuralları arasında seçim yapma
Uygun puanlama kurallarıyla ilgili çoğu kaynak, log kaybı, Brier puanı veya küresel puanlama gibi farklı puanlama kurallarından bahseder. Ancak, genellikle aralarındaki farklar hakkında çok fazla rehberlik yapmazlar. (Sergi A: Vikipedi .) Logaritmik skoru maksimize eden modelin seçilmesi, logaritmik skorlamanın kullanılması için iyi bir argüman gibi görünen maksimum olabilirlik modelinin seçilmesine …

3
Büyük , küçük problemiyle uğraşırken model kararlılığı
tanıtım: Klasik "büyük p, küçük n problemi" olan bir veri kümem var. Mevcut sayıların sayısı n = 150 iken olası yordayıcıların sayısı p = 400'dür. Sonuç sürekli bir değişkendir. En "önemli" tanımlayıcıları, yani sonucu açıklamak ve bir teori oluşturmaya yardımcı olmak için en iyi aday olanları bulmak istiyorum. Bu konuda …

2
Model seçimi için en iyi yaklaşım Bayesian veya çapraz doğrulama?
Çeşitli modeller veya eklenecek özelliklerin arasında seçim yapmaya çalışırken, iki yaklaşım düşünebileceğimi tahmin ediyorum. Verileri eğitim ve test setlerine ayırın. Daha da iyisi, önyükleme ya da k-kat çapraz doğrulama kullanın. Her seferinde egzersiz setini eğitin ve test setindeki hatayı hesaplayın. Plot test hatası - parametre sayısı. Genellikle, böyle bir şey …


Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.