«cross-validation» etiketlenmiş sorular

Gizli veri alt kümelerindeki model performansını ölçmek için, model uydurma sırasında verilerin alt kümelerini sürekli olarak saklamak.

2
İç içe çapraz doğrulamanın kullanımı
Scikit Learn'ün Model Seçimi sayfasındaki iç içe çapraz doğrulamanın kullanıldığından bahsedilir: >>> clf = GridSearchCV(estimator=svc, param_grid=dict(gamma=gammas), ... n_jobs=-1) >>> cross_validation.cross_val_score(clf, X_digits, y_digits) İki çapraz doğrulama döngüsü paralel olarak gerçekleştirilir: biri GridSearchCV tahmincisi tarafından gama ayarlamak için, diğeri cross_val_score tarafından tahmincinin tahmin performansını ölçmek için. Elde edilen puanlar, yeni verilerdeki tahmin …

2
Düz İngilizce R kullanarak Cox orantılı tehlikeler regresyon modelinin yorumlanması ve onaylanması
Birisi bana Cox modelimi düz İngilizce olarak açıklayabilir mi? Bu işlevi kullanarak tüm verilerime aşağıdaki Cox regresyon modelini yerleştirdim cph. Verilerim adlı bir nesneye kaydedilir Data. Değişkenler w, xve ysüreklidir; ziki seviyeli bir faktördür. Zaman ay olarak ölçülür. Bazı hastalarım değişkenleri için veri eksik z( Not : Dr.Harrell'in aşağıda, modelime …

1
Tren ve Test Hatası Boşluğu ve Aşırı Donatmayla İlişkisi: Çatışan tavsiyeleri uzlaştırmak
Özellikle ikisi arasında bir boşluk olduğunda trenle test hatasını karşılaştırmanın nasıl ele alınacağı konusunda çelişkili tavsiyeler var gibi görünüyor. Bana göre, çatışan iki düşünce okulu var gibi. İkisini nasıl uzlaştıracağımı (veya burada eksik olanı anladığımı) arıyorum. Düşünce # 1: Sadece tren ve test seti performansı arasındaki boşluk aşırı uyuşmayı göstermiyor …

2
K-kat çapraz doğrulaması eğitim / doğrulama / test setleri bağlamına nasıl uyuyor?
Benim asıl sorum, k / kat çapraz doğrulamanın eğitim / doğrulama / test setlerine sahip olma bağlamında nasıl uyduğunu anlamaya çalışmakla ilgilidir (eğer bu bağlamda uyuyorsa). Genellikle, insanlar verileri bir eğitim, validasyon ve test setine - örneğin Andrew Ng'in kursu başına 60/20/20 oranında) bölmekten söz ederler, böylece doğrulama seti model …

2
Çapraz doğrulama ve parametre optimizasyonu
10 kat çapraz doğrulamayı kullandığımda parametre optimizasyonu hakkında bir sorum var. Her katın model eğitimi sırasında parametrelerin düzeltilip düzeltilmeyeceğini sormak istiyorum, yani (1) her katın ortalama doğruluğu için bir dizi optimize edilmiş parametre seçin. veya (2) Her kat için optimize edilmiş parametreyi bulmalıyım ve daha sonra her kat, modelini eğitmek …

5
Lojistik regresyon hakkında felsefi soru: optimal eşik değeri neden eğitilmiyor?
Genellikle lojistik regresyonda, bir modele uyuyoruz ve eğitim seti hakkında bazı tahminler alıyoruz. Daha sonra bu eğitim tahminlerini ( burada olduğu gibi ) çapraz doğrular ve ROC eğrisi gibi bir şeye dayanarak optimum eşik değerine karar veririz . Neden gerçek modele INT eşiğinin çapraz doğrulamasını dahil etmiyoruz ve her şeyi …

1
Random Forest: OOB vs CV'yi değerlendirin
Rastgele Bir Orman'ın kalitesini, örneğin AUC kullanarak değerlendirdiğimizde, bu miktarları Torba Dışı Örnekler üzerinden veya bekletme çapraz doğrulama seti üzerinden hesaplamak daha uygun mudur? OOB Örnekleri üzerinden hesaplamanın daha kötümser bir değerlendirme verdiğini duydum, ama nedenini göremiyorum.

4
Çapraz doğrulamanın veri gözetlemesinden farkı nedir?
"İstatistiksel Öğrenime Giriş" i yeni bitirdim . Çeşitli makine öğrenme teknikleri için en iyi ayarlama parametrelerini bulmak için çapraz doğrulamanın kullanılmasının veri gözetlemesinden farklı olup olmadığını merak ettim. Ayar parametresinin hangi değerinin test setinde en iyi tahmin sonucuyla sonuçlandığını tekrar tekrar kontrol ediyoruz. Ulaştığımız ayar parametresi, bu özel test setini …

1
K-kat çapraz doğrulaması ile, tüm modellerini nihai modeli oluşturmak için ortalama mı kullanıyorsunuz?
K-kat çapraz doğrulaması gerçekleştirirken, bir kat dışındaki tüm katları işaret ederek doğruluk metriklerini elde ettiğinizi ve tahminlerde bulunduğunuzu ve bu işlemi kez tekrarladığınızı anlıyorum . Daha sonra tüm örneklerinizde doğruluk metrikleri çalıştırabilirsiniz (kesinlik, hatırlama, doğru olarak sınıflandırılan%), her seferinde bunları hesaplayıp aynı zamanda sonucun ortalamasını almanız gerekir (yanlışsam beni düzeltin).kkk …

2
Doğrulama ve model seçimi için önyüklemeyi anlama
Sanırım önyüklemenin temellerinin nasıl çalıştığını anlıyorum , ancak model seçimi veya aşırı sığmayı önlemek için önyüklemeyi nasıl kullanabileceğimi bilmiyorum. Örneğin model seçimi için, önyükleme örnekleri arasında en düşük hatayı (belki de varyans?) Veren modeli seçer misiniz? Model seçimi veya doğrulaması için önyüklemenin nasıl kullanılacağını tartışan metinler var mı? DÜZENLEME: Bu …


1
LogisticRegressionCV'de yakınsama nasıl düzeltilir?
Ben scikit-learn veri kümesi (> 7000 normalleştirilmiş gözlemler ile yaklaşık 14 parametre) ile çapraz validasyon ile lojistik regresyon gerçekleştirmek için kullanıyorum. Ayrıca 1 veya 0 değerine sahip bir hedef sınıflandırıcı var. Sahip olduğum sorun, kullanılan çözücüden bağımsız olarak, yakınsama uyarıları almaya devam etmem ... model1 = linear_model.LogisticRegressionCV(cv=10,verbose=1,n_jobs=-1,scoring='roc_auc',solver='newton-cg',penalty='l2') /home/b/anaconda/lib/python2.7/site-packages/scipy/optimize/linesearch.py:285: LineSearchWarning: The …


1
Jackknifing'in çağdaş kullanımları var mı?
Soru: Bootstrapping jackknifing'ten üstündür ; Ancak, jackknifing'in parametre tahminlerindeki belirsizliği karakterize etmek için tek veya en azından uygulanabilir bir seçenek olup olmadığını merak ediyorum. Ayrıca, pratik durumlarda önyüklemeye göre önyargılı / yanlış jackknifleme vardır ve jackknife sonuçları daha karmaşık bir bootstrap geliştirilmeden önce ön fikir verebilir mi? Bazı bağlamlar: Bir …

4
Çapraz doğrulama ile temel gerçeği olmayan bir veri kümesinde farklı kümeleme yöntemlerini karşılaştırabilir misiniz?
Şu anda, temel gerçeği olmayan bir metin belgesi veri kümesini analiz etmeye çalışıyorum. Farklı kümeleme yöntemlerini karşılaştırmak için k-kat çapraz doğrulamayı kullanabileceğiniz söylendi. Ancak, geçmişte gördüğüm örnekler temel bir hakikat kullanır. Sonuçlarımı doğrulamak için bu veri kümesinde k-katlama araçlarını kullanmanın bir yolu var mı?

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.