[1, §3.2] 'de, David Freedman , sorunuza esasen olumsuz bir cevap önerir . Başka bir deyişle, hiçbir istatistiksel model veya algoritma John Snow'un problemini çözemez. Snow'un problemi, kolera'nın , günümüzdeki geçerli miasma teorisine karşı, su kaynaklı bulaşıcı bir hastalık olduğu teorisini destekleyen eleştirel bir tartışma geliştirmekti . (“İstatistiksel Modeller ve Ayakkabı Derisi” başlıklı [1] 'deki 3. Bölüm, daha önce burada yayınlanan [2] formunda da mevcuttur .)
Freedman, “John Snow'un kendisinin uzun bir alıntı olduğu bu birkaç kısa sayfada [1, s.47–53], Freedman,“ Snow'un 1853–54 yıllarında yaptıklarının gerçektekinden daha ilginç ”olduğunu iddia ediyor Sokak Pompası]. " İstatistiki kanıtların karşılaştırılması kadarıyla (endeks vaka tanımlaması vb. Gibi diğer ilkeler de tartışılır), Snow gerçekten dikkate değer bir yarı deney yapmak için doğal varyasyondan yararlandı .
Daha erken bir zamanda, Londra'daki su tedarik şirketleri arasında şiddetli bir rekabetin yaşandığı ve bunun (Snow'un sözleriyle) “en samimi tür” olan su tedarikinin mekansal olarak karıştırılmasıyla sonuçlandığı ortaya çıktı.
Her bir Şirketin boruları tüm caddelerde ve hemen hemen tüm mahkemelerde ve sokaklarda bulunur. Su Şirketleri aktif rekabet halindeyken, mal sahibinin veya işgalcinin kararına göre, birkaç şirket bir Şirket tarafından ve birkaç diğer şirket tarafından tedarik edilmektedir.
...
Evlerde veya iki Su Şirketinin tedarikini alan insanlarda veya çevrelerinde bulundukları fiziki şartlarda herhangi bir fark olmadığı için, daha kapsamlı bir şekilde test edilecek bir deney tasarlanamayacağı açıktır. su arzının kolera'nın ilerleyişine etkisi, bu koşullar gözlemciden önce hazırlanmıştır.
—John Kar
Bu yarı deneyde sömürülen bir diğer önemli kritik “doğal çeşitlilik” John Snow ise, bir su şirketinin , atık su deşarjlarının akış aşağı yönündeki Thames'te su alımını gerçekleştirirken , diğerinin alımını gerçekleştirmeden önceki birkaç yılını almasıydı . John Snow'un veri tablosundan hangisinin hangisi olduğunu tahmin etmenize izin vereceğim!
| Sayısı | Kolera | Başına ölüm
Şirket | evler | ölümler | 10.000 ev
-------------------------------------------------- --------
Southwark ve Vauxhall | 40,046 | 1263 | 315
Lambeth | 26,107 | 98 | 37
Londra'nın geri kalanı | 256,423 | 1422 | 59
Freedman'ın dikkatsizce yazdığı gibi,
Bir istatistiksel teknoloji parçası olarak, [yukarıdaki tablo] hiçbir şekilde dikkate değer değildir. Ancak anlattığı hikaye çok ikna edici. Argümanın gücü, önceki akıl yürütmenin netliği, birçok farklı kanıt satırının bir araya getirilmesi ve Snow'un verileri almak için kullanmaya istekli olduğu ayakkabı derisi miktarından kaynaklanıyor. [1, s.51]
Snow tarafından sömürülen bir başka doğal varyasyon noktası da zaman boyutunda meydana geldi : yukarıda belirtilen su alımı yer değiştirmesi iki salgın arasında gerçekleşti ; ( Twitter üzerinden bu bilgi için [1] 'in bir yazarı olan Philip B. Stark'a teşekkürler . Bu çevrimiçi dersine bakın .)
Bu konu ayrıca, bu cevapta tartışıldığı gibi, tümdengelimcilik ile indüktivizm arasındaki zıtlıkta öğretici bir çalışma sunar .
Freedman D, Collier D, Sekhon JS, Stark PB. İstatistiksel Modeller ve Nedensel Çıkarım: Sosyal Bilimler ile Diyalog. Cambridge; New York: Cambridge Üniversitesi Yayınları; 2010.
Freedman DA. İstatistiksel Modeller ve Ayakkabı Deri. Sosyolojik Metodoloji . 1991; 21: 291-313. DOI: / 270.939 10.2307. Tam metin