Ben hiçbir şekilde bir istatistikçi olmasam da, bir çok 'modelleme' yapmak için iniş yapıyorum - istatistiksel ve istatistiksel olmayan.
İlk olarak temel bilgilerle başlayalım:
Model tam olarak nedir?
Bir model, oldukça basitleştirilmiş de olsa gerçekliğin bir temsilidir. Bir ev için bir balmumu / ahşap 'modeli' düşünün. Dokunabilir / hissedebilir / koklayabilirsiniz. Şimdi matematiksel bir model sayılar kullanılarak gerçekliğin bir temsilidir.
Sorduğunu duyduğum bu 'gerçeklik' nedir? Tamam. Bu basit durumu düşünün: Eyalet valisi, bir paket sigara fiyatının gelecek yıl için 100 dolara mal olacağını söyleyen bir politika uyguluyor. 'Amaç', insanların sigara satın almasını caydırmak, böylece sigarayı azaltmak ve böylece sigara içenleri daha sağlıklı hale getirmek (çünkü istifa ettikleri).
1 yıl sonra vali soruyor - bu bir başarı mıydı? Bunu nasıl söylersin? Günde veya yılda satılan paket sayısı, anket yanıtları, sorunla ilgili olarak elde edebileceğiniz ölçülebilir veriler gibi verileri yakalarsınız. Sorunu 'modellemeye' yeni başladınız. Şimdi bu 'modelin' ne söylediğini analiz etmek istiyorsunuz . İstatistiksel modelleme burada işe yarar. Modelin nasıl göründüğünü görmek için basit bir korelasyon / dağılım grafiği çalıştırabilirsiniz. Nedensellik belirlemek için süslü olabilirsiniz, yani artan fiyat sigara içmenin düşmesine neden olmuşsa veya oyunda başka karıştırıcı faktörler varsa (örneğin, belki de tamamen başka bir şeydir ve modeliniz belki de kaçırmış olabilir mi?).
Şimdi, bu modeli oluşturmak bir 'kurallar dizisi' (daha çok yönergeler gibi) ile yapılır, yani neyin yasal olduğu / neyin olmadığı veya neyin anlamlı olmadığı / neyin mantıklı olmadığı. Ne yaptığınızı ve bu modelin sonuçlarını nasıl yorumlayacağınızı bilmelisiniz. Bu modeli oluşturmak / yürütmek / yorumlamak temel istatistik bilgisi gerektirir. Yukarıdaki örnekte korelasyon / saçılma grafikleri, regresyon (tek ve çok değişkenli) ve diğer şeyleri bilmeniz gerekir. İstatistikleri sezgisel olarak anlama hakkındaki mutlak eğlenceli / bilgilendirici okumayı okumanızı öneririm: Yine de p-değeri nedir İstatistiklere mizahi bir giriş ve basitten ileriye (yani, doğrusal regresyon) yol boyunca size 'modelleme' öğretecek. Sonra devam edip başka şeyler okuyabilirsiniz.
Dolayısıyla, bir modelin gerçekliğin bir temsili olduğunu ve "Tüm modeller yanlış ama bazıları diğerlerinden daha yararlı" olduğunu unutmayın . Bir model gerçeğin basitleştirilmiş bir temsilidir ve her şeyi düşünemezsiniz. ancak size anlamlı sonuçlar verebilecek iyi bir modele sahip olmak için neyi ve neyi gerektiğini bilmelisiniz.
Burada bitmiyor. Gerçekliği simüle etmek için modeller de oluşturabilirsiniz! Bir grup sayı zaman içinde bu şekilde değişecektir (diyelim). Bu sayılar, alan adınızdaki bazı anlamlı yorumlarla eşleşir. Bu modelleri benim için de oluşturabilirsiniz çeşitli önlemler birbirleriyle ilişkisini (burada belki sorgulanabilir istatistiklerin uygulanması, ama şimdilik endişe yok) nasıl olduğunu öğrenmek için verileri. Örnek: Ayda bir mağaza için bakkal satışlarına bakıyorsunuz ve her bira alındığında bir bebek bezi paketi olduğunu fark ediyorsunuz (veri kümesinden geçen ve size bu ilişkiyi gösteren bir model oluşturuyorsunuz). Tuhaf olabilir, ancak çoğu zaman babaların bebeklerini çocuklarını otururken hafta sonu satın aldıkları anlamına gelebilir? Bira yakın bebek bezi koymak ve satışlarınızı artırabilir! Aaah! Modelleme :)
Bunlar sadece örnektir ve hiçbir şekilde profesyonel çalışma için referans değildir. Temelde, realitenin nasıl işleyeceğini / işleyeceğini anlamak / tahmin etmek ve çıktılara dayalı olarak daha iyi kararlar almak için modeller oluşturursunuz. İstatistikler olsun ya da olmasın, muhtemelen tüm hayatınızı farkında olmadan modelleme yapıyorsunuzdur. İyi şanslar :)