'Havuz verilerinin' tam olarak anlamı nedir?


16

Ben 'veri havuzu' basitçe daha önce kategorilere ayrılmış veri birleştirmek anlamına düşündüm ... temelde, kategorileri görmezden ve veri kümesi dev bir veri havuzu 'yapmak. Sanırım bu, istatistiklerin uygulanmasından ziyade terminoloji hakkında bir soru.

Örneğin: 2 siteyi karşılaştırmak istiyorum ve her site içinde iki yıllık tipim var (iyi ve kötü). 2 siteyi 'genel' olarak karşılaştırmak istersem (yani, yıl türlerini göz ardı ederek), her bir sitedeki verileri birleştirdiğimi söylemek doğru mu? Buna ek olarak, birkaç yıllık veriler iyi ve kötü yıl türlerini içerdiğinden, her sitede 'iyi yıl' ve 'kötü yıl' verisi elde etmek için yıllar arasında verileri bir araya getirdiğimi söylemek doğru mu? Yardımın için teşekkürler! Mog

Yanıtlar:


13

Evet, örnekleriniz doğru.

Oxford İngilizce Sözlük havuzu şöyle tanımlar :

havuz,

(Pul)

1.1 çev. Anlaşmaya göre dağıtılacak ortak bir hisse veya fona atmak; ortak menfaat için birleştirmek (sermaye veya çıkarlar); Spec. demiryolu şirketleri vb. listesi: Paylaşmak veya bölmek (trafik veya makbuzlar).

Başka bir örnek:

erkeklerde ve kadınlarda kandaki X maddesi düzeylerini ölçersiniz. İki grup arasında istatistiksel farklar görmüyorsunuz, böylece verileri bir araya toplayarak deneysel deneğin cinsiyetini görmezden geliyorsunuz .

Bunu yapmanın istatistiksel olarak doğru olup olmadığı çok fazla özel duruma bağlıdır.


12

Havuzlama, veri birleştirmeyi ifade edebilir, ancak ham veri yerine bilgileri birleştirmeyi de ifade edebilir. Havuzlamanın en yaygın kullanımlarından biri varyansı tahmin etmektir. 2 popülasyonun aynı varyansa sahip olduğuna, ancak aynı ortalamaya sahip olmadığına inanırsak, 2 grubun örneklerinden varyansın 2 tahminini hesaplayabilir, ardından tek bir tahmin elde etmek için bunları havuzlayabiliriz (ağırlıklı bir ortalama alabilir) ortak varyans. Birleştirilmiş verilerden varyansın tek bir tahminini hesaplamıyoruz çünkü araçlar eşit değilse, bu varyans tahminini şişirir.


Teşekkürler @Greg. Açıklamak için (literatürden de varyansları birleştirmeye çalıştığım için), söylediğiniz şey, çoklu popülasyonlar için 'ortalama' bir varyans elde etmek için, hesaplanmış varyansların ağırlıklı bir ortalamasını alabilir miyim? Bu varyansları nasıl ağırlıklandırabilirim? Her nüfus = 1 değil mi?
Mog

Örnek boyutları eşitse, basit ortalama çalışma eğilimindedir. Genellikle her veri noktasına eşit ağırlık veririz, standart formül her varyansı serbestlik dereceleriyle (veya paydada gruptan n-1'e göre sayı ile) çarpmak, sonra tüm parçaları toplamak, sonra toplamını bölmektir. özgürlük dereceleri (tüm n_i-1).
Greg Snow
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.