Fisher'ın DoE hakkında verdiği alıntıdan gerçek bir örnek almak


13

Ekibim ve ben, şirketin istatistikçi olmayanlarına deney tasarımının faydası hakkında bir sunum yapmak istiyoruz. Bu istatistikçi olmayanlar da bizim müşterilerimizdir ve genellikle verilerini toplamadan önce bize danışmazlar. Fisher'in ünlü sözünü iyi gösterecek bazı gerçek örnekler biliyor musunuz? "Deney yapıldıktan sonra istatistikçiyi aramak, ondan sonra ölüm sonrası inceleme yapmasını istemekten başka bir şey olmayabilir: sadece denemenin öldüğünü söyleyebilir nın-nin." ? Tercihen endüstriyel / farmasötik / biyolojik bağlamda bir örnek arıyoruz. Ön iyi tasarlanmış olsaydı başarılı olabilecek sonuçsuz bir istatistiksel analizin bir örneğini düşünüyoruz, ancak belki de başka olası örnekler de var.



Teşekkürler. Takımımın önceki patronu muhtemelen bu kitaba sahip.
Stéphane Laurent

@onestop Kitabı ellerimde tutuyorum. Bahsettiğiniz bölüm nedir? Kitabın ikinci baskısı var ve p47'de hiçbir şey yok.
Stéphane Laurent

Hmm, yukarıdaki Google Kitaplar bağlantısının 4. sürümüne bakıyordum. Bölüm 3, 'Veri Toplama' bölümünde 'Deney Tasarımı' başlıklı bir bölüm var.
onestop

Yanıtlar:


12

Deneycinin konu etkileri arasında test etmek istediği tasarımlarla karşılaştım, ancak tasarım konu etkileri için daha uygun.

Örneğin, bir deney 8 sıçan, dördü A diyetinde ve dördü B diyetinde oluştu ve sıçanın ağırlığı dört hafta boyunca her gün ölçüldü. Her diyetin zaman etkisi ile ilgileniyorlarsa iyi oldu, ancak amaç diyetlerdeki farklılıkları araştırmaktı.

Her sıçanı 28 kez ölçerek çok fazla veriye sahip olduklarını düşünüyorlardı, ancak diyet etkisi için deney birimi, her tedavi için sadece 4 olan sıçandı. Fareleri günde 10 kez ölçebilirlerdi, ancak hiçbir fark yaratmazdı, sonunda daha fazla fareye ihtiyaçları vardı.


5
(+1) Tıbbi araştırmaların, daha fazla fareye sahip olma ihtiyacı ve arzusu ile ilgili insan çabalarında neredeyse tek başına durduğundan şüpheleniyorum.
kardinal

1
Lankenau'da birçok laboratuvar denemesine katıldım ve örnek boyutları her zaman küçük ve fareler veya sıçanlar içeriyor.
Michael R. Chernick

Laboratuar deneyleri yapılırken hayvanlar sıklıkla feda edilir ve bence hayvan sayısını mümkün olduğunca az tutmaya çalışmasının bir nedeni budur. Ancak bu gibi durumlarda anlamlı sonuçlar elde etmek için yeterince şey almak istersiniz.
Michael R. Chernick

7

Ulusal Çölyak Bilinci Vakfı adlı bir organizasyon için biraz çalıştım. Organizasyon, halkın Çölyak Hastalığı konusundaki farkındalığını arttırır ve gluten içeren gıdalara karşı toleranssızlık içeren hastalığın semptomlarının bir kontrol listesini sağlar. Sadece katılmak isteyen herkese açarak internette bir anket yaptılar. Yıllar boyunca halktan binlerce yanıt topladılar. Ancak anket sonuçlarına dayanarak halk hakkında sonuçlar çıkarmayı umuyorlardı. Onlara katılımcıların rastgele değil kendi seçtiklerini söylemek zorundaydım ve bu önyargı yaratabilir. Önyargı derecesi bilinmediğinden, büyük miktarda veri için herhangi bir çıkarım yapamadık.

Şimdi katılımcılar tuhaf bir grup gibi görünüyordu. Birçoğu çok ciddidir ve kendilerinin veya akrabalarının hastalığa sahip olabileceği endişesini ifade etmek için cevaplanmıştır. Ama aynı zamanda bilge bir şekilde cevap veren çok sayıda insan vardı. Bu, sahte isimlerden, garip e-posta adreslerinden ve cevaplarıyla birlikte verdikleri posta adreslerinden açıktı.

Verilerin sadece keşifsel anlamda yararlı olduğunu ve yanıtların sıklığının, iyi planlanmış bir gelecekteki ankette test edilebilecek hipotezleri çözmek için yararlı olabileceğini düşündüm. Ama şu ana kadar benim tavsiyem dikkate alınmadı ve internette kendi kendine seçim anketleri yapmak için bu kolay bir başka çalıştırıyorlar.


(+1) İyi örnek. Bazen müşteriler çok spesifik örnekler toplarlar, ancak tüm popülasyon hakkında sonuç çıkarmak isterler.

Bu ilginç örnek için teşekkürler (ancak istatistikçi olmayan meslektaşlarım için uygun değil)
Stéphane Laurent

@ StéphaneLaurent Evet, değil mi? tıbbi bir çalışma için kötü tasarımla ilgilidir.
Michael R. Chernick

Evet Michael ama müşterilerim asla anket yapmıyor.
Stéphane Laurent

@ StéphaneLaurent Fikir, randomizasyon eksikliğinden kaynaklanan önyargı ilkesidir. Deneyler ve anketler için de aynı şekilde geçerlidir.
Michael R. Chernick

6

Bir süre önce, bir fotovoltaik güneş dizisinin gece depolama konumunun, toprağın dizide birikme hızını nasıl etkilediğine ilişkin bir deneyin sonuçlarını analiz etmem istendi. (Bu büyük konsantre fotovoltaik diziler tüm gün güneşi takip eder, ancak geceleri genellikle izleyici için minimum stres konumu olduğu için doğrudan yukarı doğru saklanırlar.) Kirlenme büyük bir sorundur, çünkü enerji üretimini ve temizlemeyi önemli ölçüde azaltır. ucuz değil. Deney, yaklaşık 120 izleyici tarlasında yürütülmüştür; batı yarısı dikey olarak ve doğu yarısı yatay olarak yerleştirilmişti (bu, iki invertöre izleyici bağlantıları ile hizalandı, aksi takdirde önemli bir etki ve belirli bir kirlenme paterni yoksa deney sırasında enerji üretiminde bir avantaj sağlayacaktır, bu nedenle değil,

Ne yazık ki, güney-güneybatıdan çöl boyunca güçlü bir hakim rüzgar deseni ve tarlanın batı kısmının güneyinde büyük bir bina var, tarlanın batı kısmının çoğunu rüzgar üflemeli partiküllerden "gölgelemek" (biraz) . Ek olarak, izleyiciler birbirlerini rüzgardan bir dereceye kadar "gölgeler". Sonuç olarak, toprağın biriktiği mekanizmalar (örneğin rüzgarla üflenen veya çöktürülen) tarlada göreceli büyüklükte değişir. Bu da dizilerin yere bağlı olarak farklı oranlarda toprağı biriktirdiği anlamına gelir; bu küçük bir etki değildir.

Analizin nihai sonucu, temel olarak, depolama konumunun bir fark yaratması mantıksız değildi, ancak hiçbir şekilde etkinin önemsiz olma olasılığını göz ardı edemedik veya büyük bir güven ( veriler üzerinde) etkisinin işareti. Daha sonra, her iki depolama konumu için tarladaki kir "tepki yüzeyini" tahmin edebilmek, "rüzgar üflemeli" kir oranlarını "düzelterek" ve "rüzgar üflemeli" kir oranlarını tahmin etmek amacıyla dizi konumuna dayalı depolama konumları atayarak ve tabii ki depolama açısının her ikisi üzerindeki etkisi. Bu deney oldukça başarılıydı ve sadece birkaç ay sonra dikey istifin faydalarının net bir resmini elde edebildik.


6

Bir meslektaşımdan, belirli bir hava olayı türü ile tipik olarak basit aşınma ve yıpranmaya atfedilen bir tür altyapıdaki başarısızlıklar arasındaki korelasyonu araştıran bir çalışmada 'istatistikleri yapması' istenmişti. Meslektaşım, hava olaylarının gerçekten başarısızlığa katkıda bulunup bulunmadığını görmek istedi. Bir grup insan zaten çok miktarda veri toplamak için çok fazla zaman ve çaba harcamıştı ve araştırma makalesi neredeyse bitmişti, sadece 'istatistikleri yapmak' ve sonuçlar bölümünün son bitini doldurmak için birine ihtiyaç duydular.

Sorun şuydu ki, veri kümesinin söz konusu hava olayının gerçekleştiği sadece 'ilginç' dönemler içermesini titizlikle sağladılar. Bu, olaylar sırasındaki başarısızlık oranını olay olmayan zamanlarla karşılaştırmanın bir yolu olmadığı anlamına geliyordu. Sorunu açıklamak için tekrar tekrar denedim, ama asla gerçekten ikna olmamışlardı, çünkü basitçe o kadar çok veri vardı ki kesinlikle bir şey çıkarabilirim.

Neyse ki hala hava olaylarının bir ciddiyeti vardı ve ciddiyet ve başarısızlık oranı arasında zayıf bir yazışma vardı, bu yüzden en azından ondan bir şey kurtardık, ancak sonuç nasıl yapılacağını düşünürlerse çok daha kesin olabilirdi veri toplama alıştırmasına başlamadan önce 'istatistikleri yapın'.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.