EDA'ya Bayesçi ve sık sık yaklaşımlarda farklılıklar var mı?


14

Çok basit bir ifadeyle: Keşifsel Veri Analizine Bayesci ve Sıkça Yaklaşımlarda herhangi bir fark var mı?

Histogram, histogram, dağılım grafiği dağılım grafiği vb. . Sonunda, uygulanan her şeyin hakemi olan CRAN'a baktım: Bayesci bir yaklaşıma uygun paketler bulamadım. Bununla birlikte, CV'nin buna ışık tutabilecek birkaç insanı olabileceğini düşündüm.

Neden farklılıklar olmalı?

Yeni başlayanlar için:

  1. Uygun önceki dağılımları belirlerken, bunu görsel olarak araştırmamak gerekir mi?
  2. Verileri özetlerken ve bir frekansçı mı yoksa Bayesci bir model mi kullanacağınızı önerirken, EDA hangi yöne gidileceğini önermemeli mi?
  3. İki yaklaşım, karışım modellerinin nasıl ele alınacağı konusunda çok açık farklılıklara sahiptir. Bir numunenin muhtemelen bir popülasyon karışımından geldiğini tanımlamak zordur ve karışım parametrelerini tahmin etmek için kullanılan yöntemle doğrudan ilişkilidir.
  4. Her iki yaklaşım da stokastik modelleri içerir ve model seçimi verilerin anlaşılmasıyla sağlanır. Daha karmaşık veriler veya daha karmaşık modeller EDA'da daha fazla zaman gerektirir. Stokastik modeller veya üretim süreçleri arasındaki bu ayrımlarla, EDA faaliyetlerinde farklılıklar vardır, bu nedenle farklı stokastik yaklaşımlardan kaynaklanan ayrımlar olmamalı mı?

Not 1: Her iki kampın da felsefesiyle ilgilenmiyorum. Yalnızca EDA araç takımım ve yöntemlerimdeki boşlukları ele almak istiyorum.

Yanıtlar:


17

Benim düşünceme göre, Bayes vs frekansçı biçimsel çıkarımdan ibaret değildir ve keşifsel veri analizi de değildir.

Kesinlikle, (1), (3) ve (4) puanlarınızı sınıflandıracağım model değerlendirme / uyum iyiliği ve duyarlılık analizi söz konusu olduğunda, birinin nasıl ilerleyeceği konusunda farklılıklar olacaktır, ancak çünkü felsefe yerine analiz ve hesaplama yöntemleri arasındaki farklılıkların doğası.

(2) ile ilgili olarak, genel olarak EDA'nın sonuçlarını sizi Bayesci veya frcialist yaklaşıma yönlendirdiğini görmüyorum, daha çok çalışmanın amacı en önemli olduğunu düşünüyorum.

Şahsen benim için, EDA (artı derin içgözlem) beni bir modele işaret edecekti ve bilimsel soruyu makul şekilde cevaplayan doğal bir frekansçı yaklaşım bulabilirsem, bununla giderdim, ama durumun doğası gereği , hiçbir sık ​​kullanılan yöntem iyi sonuç vermezdi ve makul bir öneri olsaydı Bayes'i kullanırdım.


(+1) Çok iyi söyledi - özellikle, "EDA (artı derin içgözlem) beni bir modele doğru işaret eder"
suncoolsu

+1 de. EDA gerçekten bir perspektif seçmekle ilgili değil, daha bilinçli kararlar vermek için verilerinizi anlamakla ilgili.
Fomite

+1 İyi bir cevap için. Ne yazık ki, asıl sorunun yanlış anlaşıldığını düşünüyorum. Bayesian veya frekanslı modeller arasında karar vermek için EDA'yı kullanma hakkında soru sormuyordum. Birkaç kişi aynı yanlış anlama sahip görünüyorsa, nasıl ifade ettiğimi gözden geçirmem gerekecek.
Iterator

@Iterator Ana sorunuzun şu anlama geldiğini anlıyorum: Bayesli ve sık sık EDA yaklaşımları arasında farklılıklar var mı? Buna cevabım: hayır; EDA ne sıkıcı ne de Bayesci değildir.
Karl

3
"Keşifsel veri analizi" tanımımın sizinkinden daha dar olduğunu düşünüyorum. Bana göre, tüm iyi veri analizleri keşif yapmayı içerir. "Keşifsel veri analizini" ayıran şey, bir modelin olmaması veya biçimsel çıkarım için herhangi bir çaba olmamasıdır.
Karl

0

EDA'nın bir model oluşturmanıza, bazı varsayımlar yapmanıza ve (gerekirse) modeli ve varsayımlarını güncellemenize yardımcı olduğunu düşünüyorum. Model uydurma ve değerlendirme için kullanılacak pragmatik bir yaklaşım seçiyorum.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.