İstatistikler ve Büyük Veri

İstatistik, makine öğrenmesi, veri analizi, veri madenciliği ve veri görselleştirmesi ile ilgilenen kişiler için soru cevap




9
Matematikçi eşdeğer bilgiyi kalite istatistik derecesi ile istiyor
İnsanların benim am böylece çiftleri kapatmak için sevdiğini bilmek değil bir referans soran başlatmak (aynı öğrenme istatistiklerini burada ). Matematik alanında doktora yaptım ama istatistik öğrenmedim. Eşdeğer bilgiye giden en kısa yol hangisidir? BS istatistik derecesinin en iyisi ve bunu nasıl elde ettiğimi nasıl ölçebilirim. Eğer bir kitap listesi yeterliyse …

7
İstatistiklerdeki 'büyük problemler' nedir?
Matematiğin, ünlü Millennium Problemleri (ve tarihsel olarak Hilbert'in 23 ), alanın yönünü şekillendirmeye yardımcı olan soruları vardır. Bununla birlikte, Riemann Hipotezleri ve P ile NP'nin istatistiklerinin ne olacağı hakkında çok az fikrim var. Öyleyse, istatistiklerdeki genel açık sorular nelerdir? Eklemek için düzenlendi: Aradığım cevabın genel ruhunun (tam olarak belli değilse) …
77 history 

3
Özellik seçimi ve çapraz doğrulama
Son zamanlarda bu sitede (@Aniko, @Dikran Marsupial, @Erik) ve başka yerlerde çapraz onaylama ile ortaya çıkan aşırı teçhizat sorunu hakkında çok fazla şey okudum - (Smialowski ve diğerleri 2010 Bioinformatics, Hastie, istatistiksel öğrenmenin unsurları). Öneri, çapraz doğrulama (veya önyükleme gibi başka bir model tahmin metodu) kullanılarak yapılan model performans tahmininin …


5
Kademeli regresyona modern, kolay kullanılan alternatifler nelerdir?
Yaklaşık 30 bağımsız değişken içeren bir veri kümesine sahibim ve bunlar ile bağımlı değişken arasındaki ilişkiyi araştırmak için genelleştirilmiş bir doğrusal model (GLM) oluşturmak istiyorum. Bu durum için öğretildiğim yöntemin, adım adım gerilemenin artık istatistiksel bir günah olarak kabul edildiğinin farkındayım . Bu durumda hangi modern model seçim yöntemleri kullanılmalıdır?

1
Anlamam için bana yardım et Destek
Bir Destek Vektörü Makinelerinin amacının, bir girişin birkaç farklı sınıfa sınıflandırılması açısından ne anlama geldiğinin temellerini anlıyorum; Yeni başlayanlar için biraz Slack Değişkenleri ile kafam karıştı. Amaçları nedir? Bir ayakkabının iç tabanına yerleştirdiğim sensörlerden basınç ölçümleri aldığım bir sınıflandırma problemi yapıyorum. Basınç verileri kaydedilirken bir konu birkaç dakika oturacak, duracak …

6
Makine öğrenmesinde çapraz doğrulama yapılırken “son” model için özellik seçimi
Özellik seçimi ve makine öğrenmesi konusunda kafam biraz karıştı ve bana yardım edip edemeyeceğinizi merak ediyordum. İki gruba ayrılan ve 1000’lik özelliklere sahip bir mikro dizi veri setine sahibim. Amacım, teorik olarak bu örnekleri en iyi şekilde sınıflandırmak için diğer veri setlerine uygulayabileceğim bir imzayla az sayıda gen (özelliklerim) (10-20) …

3
Kement neden Değişken Seçim sağlıyor?
İstatistiksel Öğrenme Öğelerini okudum ve Lasso'nun neden değişken seçim sağladığını ve sırt regresyonunun neden olmadığını bilmek istiyorum. Her iki yöntem de artık kareler toplamını en aza indirir ve parametrelerinin olası değerleri üzerinde bir kısıtlamaya sahiptir . Kement için sınırlama iken, sırt için bazı için .| | β | | 1 …


3
Bir yayında rastgele bir orman sunmanın en iyi yolu?
Rastgele orman algoritmasını, iki grubun sağlam bir sınıflandırıcısı olarak, 1000'li özelliklere sahip bir mikro dizi çalışmasında kullanıyorum. Rastgele ormanı sunmanın en iyi yolu nedir, böylece bir makalede tekrarlanabilir kılmak için yeterli bilgi olacak? Az sayıda özellik varsa, aslında ağacı çizmek için R'de bir çizim yöntemi var mı? OOB hata oranı …

5
Lütfen bekleme paradoksunu açıklayın
Birkaç yıl önce olaylar arasındaki süreyi ölçmek yerine saymak yerine çalışan bir radyasyon dedektörü tasarladım. Benim tahminime göre, bitişik olmayan örnekleri ölçerken, ortalama olarak gerçek aralığın yarısını ölçeceğim. Ancak devreyi kalibre edilmiş bir kaynakla test ettiğimde okuma, iki aralığın çok yüksek olduğu ve tüm aralığı ölçtüğüm anlamına geliyordu. Olasılık ve …

3
Lojistik regresyon için teşhis?
Doğrusal regresyon için, doğrusal regresyon varsayımlarının ihlal edilip edilmediğini kontrol etmek için teşhis grafiklerini (artıklar grafikleri, Normal QQ grafikleri, vb.) Kontrol edebiliriz. Lojistik regresyon için, lojistik regresyon modelinin uygunluğunun nasıl teşhis edileceğini açıklayan kaynakları bulmakta güçlük çekiyorum. GLM için bazı ders notları kazmak, sadece kalıntıları kontrol etmenin lojistik bir regresyon …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.