Yanıtlar:
Persi Diaconis’dan duyduğum kısa cevap şudur: Olasılık ve istatistik tarafından düşünülen sorunlar birbirine ters. Olasılık teorisinde, rasgele değişkenler tarafından modellenen rasgele ya da belirsizliğe sahip bazı altta yatan süreçleri ele alıyoruz ve ne olduğunu çözüyoruz. İstatistiklerde olanları gözlemliyoruz ve altında yatan sürecin bu gözlemleri açıklayacağını anlamaya çalışıyoruz.
Kırmızı ve yeşil reçel kavanozu örneğini beğendim.
Bir olasılıkçı her birinin oranını bilmekle başlar ve kırmızı bir jöle çekirdeği çizme olasılığını sorar. Bir istatistikçi kavanozdan örnekleyerek kırmızı jöle fasulye oranını verir.
İstatistiklerin sadece ihtimalin tersi olduğunu söylemek yanıltıcıdır. Evet, istatistiksel sorular ters olasılıkla ilgili sorulardır, ancak tersine çevrilmiş ters problemlerdir ve bu onların nasıl ele alındığı açısından büyük bir fark yaratır.
Olasılık saf bir matematiğin dalıdır - olasılık soruları aksiyomatik muhakeme kullanılarak ortaya konup çözülebilir ve bu nedenle herhangi bir olasılık sorusuna doğru bir cevap vardır.
İstatistiksel sorular, olasılık modellerini kullanarak olasılık sorularına dönüştürülebilir . . Verileri üreten mekanizma hakkında bazı varsayımlar yaptıktan sonra, olasılık teorisini kullanarak istatistiksel soruları cevaplayabiliriz. Bununla birlikte, bu olasılık modellerinin doğru formülasyonu ve kontrolü, bu modelleri kullanan problemin sonraki analizinden daha önemlidir, hatta daha da önemlidir.
Birisi istatistiklerin iki bölümden oluştuğunu söyleyebilir. İlk bölüm, problem için olasılıksal modellerin nasıl formüle edileceği ve değerlendirileceği sorusudur; bu çaba "bilim felsefesi" alanında yatmaktadır. İkinci bölüm, belirli bir model kabul edildikten sonra cevapların alınması sorunudur. İstatistiğin bu kısmı aslında uygulanan bir olasılık teorisi meselesidir ve pratikte, aynı zamanda oldukça sayısal bir analiz de içermektedir.
Bunu Steve Skienna'nın Hesaplanmış Bahsi'nden beğeniyorum (tam tartışma için bağlantıya bakınız):
Özetle, olasılık teorisi belirli bir ideal dünyanın sonuçlarını bulmamızı sağlarken, istatistiksel teori de dünyamızın idealliğini ölçmemizi sağlar.
Olasılık saf bir bilimdir (matematik), istatistikler verilerle ilgilidir. Bunlar birbirine bağlıdır çünkü olasılık, istatistikler için bir çeşit temel oluşturup temel fikirler verir.
Sezgisel Biyoistatistik Tablo 3.1, bu soruyu aşağıda gösterilen diyagramla cevaplamaktadır. Tüm okların olasılık için sağa, istatistik için de sola dönük olduğuna dikkat edin.
OLASILIK
Genel ---> Belirli
Nüfus ---> Örnek
Model ---> Veri
İSTATİSTİK
Genel <--- Özel
Nüfus <--- Örnek
Model <--- Veri
Olasılık ne olacağı ile ilgili soruları yanıtlar , istatistikler ne olduğu ile ilgili soruları yanıtlar .
Olasılık belirsizliği ölçmekle ilgilidir, istatistikler ise gerçek dünyada gözlemlediğimiz bazı ilgi ölçütlerindeki (örneğin, gelir düzeyleri neden değişir?) Farklılığı açıklıyor.
Değişimi bazı gözlemlenebilir faktörleri kullanarak açıklıyoruz (örneğin, gelir örneği için cinsiyet, eğitim düzeyi, yaş vb.). Bununla birlikte, geliri etkileyen tüm olası faktörleri muhtemelen göz önünde bulunduramayacağımız için, rastgele hatalara (belirsizliğin ölçülmesinin tespit edildiği yer olan) açıklanamayan bir varyasyon bırakırız.
Zira, “Değişken = Gözlenebilir Faktörlerin Etkisi + Rastgele Hataların Etkisi” olarak nitelendiriyoruz, rastgele hataların gözlemlediğimiz varyasyon üzerindeki etkisini hesaba katmak için olasılık tarafından sağlanan araçlara ihtiyacımız var.
Bazı örnekler:
Belirsizliğin Ölçülmesi
Örnek 1: 6 taraflı bir kalıbı yuvarlıyorsunuz. 1 alma olasılığı nedir?
Örnek 2: Amerika Birleşik Devletleri'nden rastgele seçilen bir yetişkin bireyin yıllık gelirinin 40.000 ABD Dolarından düşük olma olasılığı nedir?
Varyasyonu Açıklamak
Örnek 1: Bir kişinin yıllık gelirinin değiştiğini gözlemliyoruz. Bir kişinin gelirindeki değişimi açıklayan faktörler nelerdir?
Açıkçası, tüm faktörleri hesaba katamayız. Bu nedenle, bir kişinin gelirini bazı gözlemlenebilir faktörlere (örneğin, eğitim düzeyi, cinsiyet, yaş vb.) Bağlıyor ve kalan herhangi bir değişkenliği belirsizliğe (veya istatistik dilinde: rastgele hatalara) bırakıyoruz.
Örnek 2: Bazı tüketicilerin bir deterjan satın aldıkları zaman çoğu zaman Tide'yi seçtiklerini, diğer bazı tüketiciler ise deterjan markası xyz'i seçtiğini gözlemliyoruz. Seçimdeki çeşitliliği ne açıklar? Seçimlerdeki çeşitliliği, fiyat, marka adı vb. Gibi bazı gözlemlenebilir faktörlere bağlıyoruz ve açıklanamayan herhangi bir değişikliği rastgele hatalara (veya belirsizliğe) bırakıyoruz.
Olasılığı bir olayın uzun işletilen göreceli frekansıdır. Yani temelde size söylüyorolarak örneğin, bir madalyonun bir sonraki yüzüne bir “baş” veya bir sonraki kalıbın bir “3” e girme şansını.
Bir istatistik , popülasyon örneğinden hesaplanan herhangi bir sayısal ölçüdür. Örneğin, örnek ortalama. Bunu, parametre olan popülasyon ortalamasını tahmin eden bir istatistik olarak kullanıyoruz. Yani temelde size bir tür özet veriyor bir örnek .
Olasılık çalışmaları, pekala, olayların ne kadar muhtemel olduğu. Sezgisel olarak olasılığın ne olduğunu biliyorsun.
İstatistikler veri çalışmasıdır: gösterme (çizelgeler gibi araçlar kullanarak), özetleme (ortalamalar ve standart sapmalar vb. Kullanarak), bu verilerin çizildiği dünyayla ilgili sonuçlara ulaşma (verilere çizgileri sığdırma vb.) Ve - bu anahtardır - sonuçlarımız hakkında ne kadar emin olabileceğimizi ölçmek.
Sonuçlarımız hakkında ne kadar emin olabileceğimizi ölçmek için Olasılık kullanmamız gerekir. Diyelim ki geçen yıl yaşadığınız ve yaşadığım bölgedeki yağışlarla ilgili verileriniz var. Geçen yıl yaşadığın yerde haftada ortalama 1/4 inç, yaşadığım yerde 3/8 inç yağmur yağdı. Yani bölgemdeki yağışların yaşadığınız yerin ortalama% 50 üzerinde olduğunu söyleyebiliriz, değil mi? Çok hızlı değil, Sparky. Bir tesadüf olabilir: belki de geçen sene yaşadığım yerde çok yağmur yağdı. Olasılığını, evimin sizinkinden% 50 daha sağlıklı olduğu sonucuna vardığımızı tahmin etmek için kullanabiliriz.
Temel olarak, Olasılığın İstatistik Teorisi için matematiksel bir temel olduğunu söyleyebilirsiniz.
Olasılık teorisinde, rastgele değişkenler olan X1, X2, ... bir şekilde verilir ve sonra onların özelliklerini inceleriz, yani olasılık B1'deki P {X1 \ olasılıklarını hesaplar, X1, X2, ... vb. .
Matematiksel istatistiklerde, bazı rasgele değişken X ve gerçekleşen dağılımlar kümesi için n gerçeklenmeleri verilmiştir; Buradaki sorun, gözlemlediğimiz verileri üretme olasılığı en yüksek olan D dağılımından bulmaktır.
Olasılıkta, dağılım önceden bilinir ve bilinir - bilinen bir olasılık dağılım fonksiyonu (veya benzeri) ile başlarsınız ve ondan örnek alırsınız.
İstatistiklerde, dağılım önceden bilinmemektedir. Bilinmeyen bile olabilir. Bu verilerle ilgili sıfır bir hipotezin reddedilip edilemeyeceğini bilmek amacıyla olasılık teorisini bu verilere uygulayabilmek için gözlemlenen verilerin arkasındaki olasılık dağılımı hakkında varsayımlar varsayılmaktadır.
Gerçek dünyada olasılık gibi bir şey olup olmadığı ya da matematiksel hayallerimizin ideal bir ürünü olup olmadığı ve tüm gözlemlerimizin sadece istatistiksel olabileceği hakkında felsefi bir tartışma var.
İstatistikler belirsizlik karşısında gerçeğin peşinde koşmaktır. Olasılık belirsizliği ölçmemize izin veren bir araçtır.
(Bana sorulanın "büyükannene nasıl açıklarsın?" Satırları boyunca bir şey olduğunu varsaydığını söyleyen daha uzun bir cevap verdim.)
, farklı olasılık ölçümleri (farklı dağılımlar) alırsınız.
Feragatname: Yukarıdakiler matematiksel cevaplardır. Gerçekte, İstatistiklerin çoğu aynı zamanda uygun modelleri tasarlamak / keşfetmek, mevcut modelleri sorgulamak, deney tasarlamak, kusurlu verilerle uğraşmak vb. İle ilgilidir. "Tüm modeller yanlış."
Olasılık : Bilinen parametreler göz önüne alındığında, belirli bir veri kümesini gözlemleme olasılığını bulun.
İstatistikler : Belirli bir dizi gözlemlenmiş veri göz önüne alındığında, parametrelerin ne olabileceği hakkında bir çıkarım yapın.
İstatistikler "öznel" ve "fen bilimlerinden daha fazla sanattır" (olasılıkla göreceli).
Olasılık : Diyelim ki
Çoğu olasılıkçı aynı, basit cevabı verir: "Olasılık
Farklı istatistikçiler farklı, genellikle uzun soluklu cevaplar verirler.
Olasılıklar ve istatistikler arasındaki fark, olasılıklarda hata olmamasıdır. Olasılıktan eminiz, çünkü kaç tarafının bir madeni para olduğunu veya vazoda kaç tane mavi karamel olduğunu biliyoruz. Ancak istatistiklerde, incelediğimiz her bir popülasyonu inceliyoruz ve bundan gerçeği görmeye çalışıyoruz, ancak her zaman yanlış sonuçların% 'si var. İstatistiklerdeki doğru olan tek şey, bu% hata, aslında bir olasılık.
Savage’ın İstatistik Temelleri metni, Google Akademik’de 12000’den fazla alıntılanmıştır. [3] Aşağıdakileri söyler.
İstatistiklerin bir şekilde olasılıklara bağlı olduğu oybirliğiyle kabul edildi. Ancak, olasılıkların ne olduğu ve istatistiklerle nasıl bağlantılı olduğu ile ilgili olarak, Babil Kulesi'nden bu yana nadiren bu kadar tam bir anlaşmazlık ve iletişim koptu. Kuşkusuz, anlaşmazlığın çoğu sadece terminolojiktir ve yeterince keskin bir analizde ortadan kalkacaktır.
https://en.wikipedia.org/wiki/Foundations_of_statistics
Öyleyse, Olasılık Teorisinin bir İstatistik Vakfı olduğu konusu tartışılmaz. Her şey adil bir oyundur.
Fakat daha yararlı olmaya çalışırken, bir cevapla pratik ...
Bununla birlikte, olasılık teorisi çoğunlukla matematiksel ilgi alanına giren ve istatistiklerle doğrudan ilgisi olmayan pek çok şey içermektedir. Dahası, istatistikteki birçok konu olasılık teorisinden bağımsızdır
https://en.wikipedia.org/wiki/Probability_and_statistics
Yukarıdakiler hiçbir şekilde ayrıntılı veya yetkili değildir, ancak yararlı olduğuna inanıyorum.
Genelde böyle şeyleri görmeme yardımcı oldu ...
Descrete Matematiği >> Olasılık Teorisi >> İstatistik
Her biri ortalama olarak bir diğerinin temellerinde yoğun olarak kullanılıyor. Bu, bir sonraki vakıfları nasıl incelediğimize dair büyük kesişimler var.
PS. Endüktif ve tümdengelimli İstatistikler var, bu yüzden farkın olduğu yer orası değil.
Pek çok kişi ve matematikçi, 'İSTATİSTİK, SORUMLULUK'NIN tersidir' der, ancak bu özellikle doğru değildir. Bu 2'ye yaklaşma ya da çözme yöntemi tamamen farklıdır ancak BAĞIMSIZDIR .
arkadaşım John D Cook'a atıfta bulunmak isterim .....
"Kırmızı ve yeşil reçel kavanozu örneğini beğendim.
Bir olasılıkçı, her birinin oranını bilmekle başlar ve diyelim ki kırmızı jöleli fasulye çekme olasılığını bulur. Bir istatistikçi kavanoza örnekleyerek kırmızı jöle fasulye oranını verir. "
Şimdi, kavanozdan örnekleme yoluyla elde edilen kırmızı jöle çekirdeğinin oranı, probilistler tarafından kavanozdan kırmızı bir fasulye çekme olasılığını bulmak için kullanılır.
Bu örneği düşünün ---- >>>
Bir sınavda öğrencilerin% 30'u fizikte başarısız olmuş,% 25'i matematikte başarısız olmuş,% 12'si hem fizik hem de matematikte başarısız olmuştur. Rastgele seçilen bir öğrenci, öğrencinin matematikte başarısız olduğu biliniyorsa Fizik'te başarısız olma ihtimalini bulur.
Yukarıdaki toplam bir olasılık sorunudur, ancak dikkatle bakarsak, toplamın bazı istatistiksel verilerle sağlandığını göreceğiz.
% 30 öğrenci fizikte başarısız olmuş,% 25 "" "matematik '' 'Bunlar, yüzdeler hesaplanırsa temelde sıklıklar. Bu nedenle, olasılıkları bulmamıza yardımcı olan istatistiksel bir veri sağlıyoruz.
SO YANLIĞI VE İSTATİSTİKLERİ ÇOK BAĞIMSIZ VEYA DAHA FAZLASI OLANABİLİRLİĞİNİN İSTATİSTİK ÜZERİNE BAĞLI OLDUĞUNDAN BELİRDİ
"İstatistikler" terimi, JC Maxwell tarafından Moleküller makalesinde ( Nature 8, 1873, s. 437-441'de) güzel bir şekilde açıklanmaktadır . İlgili bölümden alıntı yapmama izin verin:
F Bölümünün çalışma üyeleri, Nüfus Sayımı Raporunu veya Ekonomik ve Sosyal Bilimin sayısal verilerini içeren diğer belgeleri aldıklarında, yaş, gelir vergisi, eğitime göre tüm nüfusu gruplara dağıtarak başlarlar. dini inanç veya cezai mahkumiyet. Bireylerin sayısı, her birinin geçmişini ayrı ayrı izlemelerine izin vermeyecek kadar büyüktür, böylece emeklerini insan sınırları dahilinde azaltmak için, dikkatlerini az sayıda yapay gruplara yoğunlaştırırlar. Her gruptaki değişen birey sayısı, her bireyin değişen durumu değil, çalıştıkları birincil veridir.
Elbette bu, insan doğasını inceleyen tek yöntem değil. Bireysel erkeklerin davranışlarını gözlemleyebilir ve önceki karakterlerinin ve mevcut durumlarının mevcut en iyi teoriye göre bizi beklememizi sağlayacak davranışlarla karşılaştırabiliriz. Bu yöntemi uygulayanlar, insan doğası unsurları hakkındaki bilgilerini, bir astronomla aynı şekilde geliştirmeye çabalarlar, gezegen unsurlarını, asıl konumlarını, alınan unsurlardan elde edilen sonuçlarla karşılaştırarak düzeltirler. Bu nedenle, insan doğasının ebeveynler ve okul yöneticileri, tarihçiler ve devlet adamları tarafından incelenmesi, kayıt memurları ve tabulatörler ve rakamlara inancını veren devlet adamlarının yaptıklarından ayırt edilmelidir. Biri tarihsel, diğeri istatistiksel yöntem olarak adlandırılabilir.
Dinamik denklemleri maddeye uygulanan tarihsel yöntemin yasalarını tamamen ifade eder, ancak bu denklemlerin uygulanması tüm veriler hakkında mükemmel bir bilgi anlamına gelir. Ancak, deneye maruz kalabileceğimiz maddenin en küçük kısmı, hiçbiri bizim için bireysel olarak duyarlı hale gelmeyen milyonlarca molekülden oluşur. Bu nedenle, bu moleküllerden herhangi birinin gerçek hareketini tespit edemiyoruz, böylece katı tarihsel yöntemi terk etmek ve büyük molekül gruplarıyla uğraşmanın istatistiksel yöntemini benimsemek zorundayız.
İstatistiki yöntemin bu açıklamasını başka birçok çalışmada da vermektedir. Örneğin, "İstatistiksel inceleme yönteminde, sistemi hareketi sırasında takip etmiyoruz, ancak dikkatimizi belirli bir aşamaya sabitliyoruz ve sistemin bu aşamada olup olmadığını ve aynı zamanda aşamaya girip girmediğini tespit ediyoruz. ve onu terk ettiğinde "(Trans. Cambridge Philos. Soc. 12, 1879, s. 547-570).
Maxwell'in "olasılık" hakkında başka bir güzel geçidi daha var (James Clerk Maxwell'in Hayatında yeniden basılan bir mektuptan Campbell, 1850'ye , s. 143):
Mevcut mantık bilimi, şu anda yalnızca hiçbiri (neyse ki) üzerinde düşünmemiz gereken kesin, imkansız veya tamamen şüpheli olan şeylerle konuşmaktadır . Bu nedenle, bu dünya için gerçek Mantık, olasılığın büyüklüğünü hesaba katan (mantıklı bir insanın aklında olması gereken) Olasılıklar Hesabıdır.
Yani şunu söyleyebiliriz:
- İstatistiklerde “dikkatimizi az sayıda yapay gruba yoğunlaştırıyoruz” ya da miktarları; Bir çeşit kataloglama veya nüfus sayımı yapıyoruz.
- Olasılıkta , bazı olaylar veya miktarlarla ilgili belirsizliğimizi hesaplıyoruz.
İkisi farklıdır ve birini diğeri olmadan yapabiliriz.
Örneğin, bir ulusun tüm nüfusunun tam bir nüfus sayımını yaparsak ve yaş, cinsiyet vb. Gibi belirli gruplara ait kişilerin tam sayısını sayarsak, istatistik yapıyoruz. Belirsizlik yoktur - olasılık vardır - çünkü bulduğumuz sayılar kesindir ve bilinir.
Öte yandan, önümüzden sokakta geçen birini hayal edin ve yaşlarını merak ediyoruz. Bu durumda belirsiziz ve olasılık kullanıyoruz, ancak nüfus sayımı ya da kataloglama yapmadığımız için hiçbir istatistik mevcut değil.
Fakat ikisi birlikte de ortaya çıkabilir. Eğer bir nüfus sayımını tam olarak yapamazsak , belirli yaş-cinsiyet gruplarında kaç kişinin olduğunu tahmin etmeliyiz . Bu yüzden istatistik yaparken olasılık kullanıyoruz. Aksine, insanların yaşları hakkında kesin istatistiksel verileri göz önünde bulundurabiliriz ve bu verilerden karşımıza geçen kişi hakkında daha iyi bir tahminde bulunmaya çalışabiliriz. Bu nedenle, olasılık olasılığına karar verirken istatistikleri kullanıyoruz.