İstatistikler ve Büyük Veri

İstatistik, makine öğrenmesi, veri analizi, veri madenciliği ve veri görselleştirmesi ile ilgilenen kişiler için soru cevap


7
Düzenleme terimi * maliyet işlevine * eklenmiştir (çarpım yerine vs.)?
Düzenleme kullanıldığında, genellikle aşağıdaki maliyet işlevindeki gibi maliyet işlevine eklenir. Bu, ekranın küçültülmesinden beri sezgisel bir anlam ifade eder. maliyet fonksiyonu, aynı zamanda hatayı minimize etmek (sol terim) ve katsayıların büyüklüğünü (doğru terim) en aza indirmek (veya en azından iki minimizasyonu dengelemek) anlamına gelir.J(θ)=12(y−θXT)(y−θXT)T+α∥θ∥22J(θ)=12(y−θXT)(y−θXT)T+α‖θ‖22 J(\theta)=\frac 1 2(y-\theta X^T)(y-\theta X^T)^T+\alpha\|\theta\|_2^2 Sorum …


8
Masa tasarımında iyi bir kaynak nedir?
Grafik Gramer gibi çeşitli teorik grafik uygulamaları gördüm . Ancak masalarla ilgili hiçbir eşdeğer görmedim. Bu süre zarfında tablo tasarımında gayrı resmi bir uygulama modeli geliştirdim. Ancak, öğrencilere iyi bir referans verebilmek istiyorum. APA Stili Manuel masa tasarımı üzerine birkaç ipucu vardır, ancak yalnızca bir başlangıç noktasıdır. Soru: Sayısal sonuçların …
51 tables 

6
En iyi kesme noktası ve güven aralığı R'de ROC eğrisi kullanılarak nasıl belirlenir?
Normal ve tümör hücrelerini ayırt etmek için kullanılabilecek bir test verisine sahibim. ROC eğrisine göre bu amaç için iyi görünüyor (eğri altındaki alan 0,9): Benim sorularım: Bu test için kesme noktası ve okumaların belirsiz olarak değerlendirileceği yerdeki güven aralığı nasıl belirlenir? Bunu (kullanarak ggplot2) görselleştirmek için en iyi yolu nedir …


3
İstatistik ve nedensel çıkarım?
1984 tarihli "İstatistik ve Nedensel Çıkarım" adlı makalesinde Paul Holland, istatistikteki en temel sorulardan birini dile getirdi: İstatistiksel bir model nedensellik hakkında ne söyleyebilir? Bu onun sloganına yol açtı: Manipülasyon olmadan neden yok Bu nedensellik düşünen deneyler etrafında kısıtlamaların önemini vurguladı. Andrew Gelman da benzer bir noktaya değindi : “Bir …
51 causality 



5
Rastgele orman bir yükseltme algoritması mıdır?
Kısa tanım artırılması : Bir grup zayıf öğrenci tek bir güçlü öğrenci yaratabilir mi? Zayıf bir öğrenci, gerçek sınıflandırma ile sadece hafifçe ilişkili olan bir sınıflayıcı olarak tanımlanır (örnekleri rastgele tahmin etmekten daha iyi etiketleyebilir). Rastgele Ormanın Kısa Tanımı : Rastgele Ormanlarda birçok sınıflandırma ağacı bulunur. Bir giriş vektöründen yeni …




4
Aykırılıklara dayanıklı hızlı doğrusal regresyon
Aykırı değerlere sahip doğrusal verilerle uğraşıyorum, bunlardan bazıları tahmini regresyon çizgisinden 5 standart sapmadan daha uzak. Bu noktaların etkisini azaltan lineer bir regresyon tekniği arıyorum. Şimdiye dek yaptığım, bütün verileri içeren regresyon çizgisini tahmin etmek, ardından veri noktasını çok büyük kare artıkları ile atmak (ilk% 10'u söyleyin) ve regresyonu bu …

9
Veritabanından veri görselleştirmek için iyi bir açık kaynaklı yazılım bilen var mı?
Son zamanlarda Tableau'yla karşılaştım ve verileri veritabanı ve csv dosyasından görselleştirmeye çalıştım. Kullanıcı iterface, kullanıcının zaman ve uzamsal verileri görselleştirmesini ve anında araziler oluşturmasını sağlar. Bu tür bir araç, verileri kod yazmadan grafiksel olarak gözlemleyebildiği için gerçekten kullanışlıdır. Verileri almak ve görselleştirmek zorunda olduğum birçok veri kaynağı olduğu için, sadece …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.