Ya da daha fazla "olacak" mı? Büyük Veri , istatistikleri ve ilgili bilgileri daha da önemli hale getirir ancak Örnekleme Teorisinin altını çizer.
Bu yutturmaca 'Büyük Veri' etrafında gördüm ve "neden" her şeyi analiz etmek isteyeyim merak ediyorum yardımcı olamaz ? "Örnekleme Teorisi" nin tasarlanması / uygulanması / icat edilmesi / keşfedilmesi için bir sebep yoktu mu? Veri setinin tüm 'popülasyonunu' analiz etme noktasını anlamıyorum. Sırf yapabileceğin için yapman gerektiği anlamına gelmiyor (Aptallık bir ayrıcalık ama kötüye kullanmamalısın :)
Yani benim sorum şu: Tüm veri setini analiz etmek istatistiksel olarak anlamlı mı? Örnekleme yaparsanız, yapabileceğiniz en iyi hatayı en aza indirmek olacaktır. Ancak bu hatayı azaltmanın maliyeti buna gerçekten değer mi? "Bilginin değeri" gerçekten büyük ölçüde paralel bilgisayarlar üzerinde büyük verilerin analizinde kullanılan çabaya, zaman maliyetine vb. Değer mi?
Biri tüm popülasyonu analiz etse bile, sonuç en iyi ihtimalle doğru olma ihtimalinin yüksek olduğu bir tahmin olacaktır. Muhtemelen örneklemeden biraz daha yüksek (ya da çok daha fazla olurdu mı?) Nüfusu analiz etmekten ve örneği analiz etmekten edinilen bilgiler geniş ölçüde farklılık gösterir mi?
Yoksa "zaman değişti" olarak mı kabul etmeliyiz? Bir aktivite olarak örnekleme, yeterli hesaplama gücü verildiğinde daha az önemli olabilir :)
Not: Bir tartışma başlatmaya çalışmıyorum ama neden büyük verinin neden yaptığını anlamak (yani her şeyi analiz etmek) ve örnekleme teorisini dikkate almamak (ya da değil mi?) Anlamak için bir cevap arıyorum.