Verileri toplarken veya yorumlarken insanların yaptığı en yaygın önyargılar nelerdir?


39

Ben bir ekonomi / stat uzmanıyım. Ekonomistlerin, insanların rasyonel davranmadıkları durumları belirleyerek, insan davranışı ve rasyonellik hakkındaki varsayımlarını değiştirmeye çalıştıklarının farkındayım. Örneğin, 1000 dolar zarar için % 100 şans veya 2500 dolar zarar için % 50 şans sunduğumu varsayalım, bu rakam beklenen değer 1000 dolardan fazla olsa bile insanlar 2500 dolar seçeneğini tercih ediyor kaybı. Bu, "kayıptan kaçınma" olarak bilinir. Davranışsal iktisatçılar şimdi bu kalıpları inceliyorlar ve insanların normal olarak "rasyonel" davranışı teşkil ettiği varsayılan bu aksiyomlardan sapma yollarını belirlemeye çalışıyorlar. Burada en az beklenen zararı tercih etmenin rasyonel olduğunu varsayıyorum.

İstatistikçilerin, veri toplamada, insanların verileri nasıl yorumladıklarına dair önyargılı sonuçlar veren ortak kalıplar tespit edip etmediklerini merak ediyordum. Esasen veri toplamanın “rasyonel” bir yolu varsa, insanların bundan saptıkları ve “önyargı” gösterdikleri örnekler olduğunu varsayıyorum. Öyleyse, veri toplarken veya yorumlarken insanların yaptığı en yaygın önyargılar nelerdir?


5
Podsakoff ve ark. O yaygın yöntem önyargıların yorumları ve hem istatistik ve prosedürel ilaçları önerir: ln.edu.hk/mkt/staff/gcui/CommonMethodBias.pdf Tablo 2'de de bakabilirsiniz
ayhan


10
Mantıksız bir mantık varsayımına sahipsiniz. Sonuca bir yardımcı program işlevi uygulayamıyorsunuz. Belirlediğiniz örnekte, kişinin 1000 dolar olduğunu ve bir dakika sonra bir gangsterin borcunu ödemek için kullanması gerektiğini yoksa gangster tarafından öldürüleceğini varsayalım. % 100 şans $ % 100 şans 1000 kayıp sonuçlarının% 50 şans ise öldürülme $ kaybı sadece öldürülme% 50 şans ile sonuçlanır 2500. Bir ekonör majör olarak, mantıksızlığı ilan etmeden önce bir başlangıç ​​noktası olarak işe başlamanız gerekir.
Mark L. Stone,

3
İstatistikçiler tipik olarak bu tür bir araştırma yapmazlar. Bu Q'nun Psikoloji ve Sinirbilim SE sitesi için daha uygun olup olmadığını merak ediyorum .
gung - Reinstate Monica

3
Ben sokak ışık efekti - ışık direğinin altında kaybolan anahtarları (verileri) arıyorum, çünkü ışığın gece olduğu yer burası - özellikle şimdi, dokunulduğunda çok kolay verilerle oldukça yaygın. // Veri toplamanın "rasyonel bir yolu" yok çünkü sen - onu toplayan araştırmacı - randomize değil.
AS

Yanıtlar:


23

Bence akademi'de p değerleri çok yanlış anlaşılıyor. İnsanlar, p-değerinin şartlı bir olasılık ifade ettiğini unutma eğilimindedir. Bir deney mükemmel bir şekilde yapılmış olsa ve seçilen istatistiksel testin tüm gereklilikleri karşılansa bile, yanlış keşif oranı tipik olarak alfa önem seviyesinden çok daha yüksektir. Yanlış keşif oranı, istatistiksel gücün azalması ve gerçek pozitiflerin yaygınlığı ile artar (Colquhoun, 2014; Nuzzo, 2014).

Ek olarak, insanlar tahminlerini gerçek ve tahmin ettikleri parametre olarak rasgele olarak görme eğilimindedirler (Haller ve Kraus, 2002). Örneğin “vakaların% 95'inde bu tanımlanmış güven aralığının parametreyi kapsadığını” söylediklerinde ...

Korelasyon ve nedensellik karışıklığı da muhtemelen veri yorumunda çok yaygın bir hatadır.

Veri toplama açısından, ortak bir hatanın, en temsili örneklemden ziyade en kolay erişilebilmesi olduğunu düşünüyorum.

Colquhoun, D. (2014). Yanlış keşif oranının araştırılması ve P değerlerinin yanlış yorumlanması. Kraliyet Topluluğu Açık Bilim, 1-15.

Nuzzo, R. (2014). İstatistiksel hatalar: P değerleri, istatistiksel geçerliliğin “altın standardı”, birçok bilim insanının varsaydığı kadar güvenilir değildir. Nature, 506, 150-152.

Haller, H. ve Kraus, S. (2002): Önemle İlgili Yanlış Yorumlar: Öğrencilerin Öğretmenleriyle Paylaşdıkları Bir Sorun? Çevrimiçi Psikolojik Araştırma Yöntemleri, Cilt 7, Sayı 1


19

Gerçek rastlantısallığın neye benzediğini anlamada genel bir yetersizlik diyebilirim. İnsanlar, rastgele olaylar dizisinde gerçekleşmekten çok daha az sahte desen bekliyor gibi görünüyor. Bu aynı zamanda rastgeleliği kendi başımıza simüle etmeye çalıştığımızda da ortaya çıkıyor.

Oldukça yaygın olan diğer bir tanesi, kumarbazın yanıltmasındaki gibi, bağımsızlığı anlamak değildir. Bazen, önceki olayların gelecekteki olayları açıkça imkansız olsa bile etkileyebileceğini düşünüyoruz.


7

(Davranışsal) ekonomistler tarafından "irrasyonel" veya "önyargılı" olarak adlandırılan davranışların ve düşünce süreçlerinin çoğunun gerçekte gerçek dünyada oldukça uyumlu ve etkili olduğu belirtilmişti. Bununla birlikte, OP'nin sorusu ilginç. Bununla birlikte, ekonomik literatürde tartışılanlara karşılık gelen belirli bir “önyargı” aramak yerine, bilişsel süreçlerimiz hakkında daha temel ve tanımlayıcı bilgilere başvurmanın karlı olabileceğini düşünüyorum (örneğin, kayıptan kaçınma, bağış etkisi, temel ihmal vb.)

Örneğin, değerlendirme , veri analizinde kesinlikle bir konudur. Değerlendirilebilirlik teorisi , yorumlamak veya değerlendirmek için kolay bulduğumuz bilgileri fazla kilomuz olarak belirtir. Bir regresyon katsayısı durumunu düşünün. Bir katsayının "gerçek dünya" sonuçlarını değerlendirmek zor iş olabilir. Bir katsayının pratik alaka düzeyine sahip olup olmadığını anlamak için bağımsız ve bağımlı değişkenlerin birimlerini de dikkate almamız gerekir. Diğer taraftan, bir katsayının önemini değerlendirmek kolaydır: p-değerini sadece alfa seviyemle karşılaştırırım. P değerinin katsayının kendisiyle karşılaştırıldığında daha iyi değerlendirilebilmesi göz önüne alındığında, çok fazla p değerinden yapılması şaşırtıcı değildir.

(Standardizasyon bir katsayının değerlendirilebilirliğini arttırır, ancak belirsizliği artırabilir : işlediğimiz verilerin "orijinal" formu bizim için mevcut olmadığından ilgili bilginin kullanılamadığı veya saklı olduğu duygusu.)

İlgili bir bilişsel "önyargı", somutluk ilkesidir, bir karar bağlamında "tam orada" olan aşırı kilo verme eğilimindedir ve bellekten alınmayı gerektirmez. (Somutluk ilkesi aynı zamanda bilgiyi verildiği formatta kullanmamızın muhtemel olduğunu ve dönüşüm yapmaktan kaçınma eğiliminde olduğumuzu da belirtir.) P-değerini yorumlamak sadece regresyon çıktısına bakarak yapılabilir; modellediğim şey hakkında herhangi bir temel bilgiyi almamı gerektirmiyor.

İstatistiksel verilerin yorumlanmasındaki bir çok önyargının, bir problemi çözerken ya da bir yargı oluştururken kolay bir yol izlemenin muhtemel olduğu genel anlayışına kadar izlenebileceğini umuyorum (bkz. "Bilişsel taciz", "sınırlı rasyonellik" vb.) . Buna bağlı olarak, "kolaylıkla" bir şeyler yapmak genellikle ortaya çıkan inançlara olan güvenimizi arttırır ( akıcılık teorisi ). (Biri ayrıca, ifade edilmesi daha kolay olan verilerin ihtimalini de göz önüne alabilir.- kendimize veya başkalarına - analizlerimizde aşırı kilolu.) Muhtemel istisnalar göz önüne alındığında, bunun özellikle ilginç olacağını düşünüyorum. Bazı psikolojik araştırmalar, örneğin, bir sorunun çözülmesinin zor olması gerektiğine inandığımızda, daha az somut ve daha zor olan yaklaşımları ve çözümleri tercih edebileceğimizi, örneğin basit bir yöntemle daha fazla okşama yöntemi seçebileceğimizi öne sürüyor.


7

Aklıma gelen en büyük tek faktör genel olarak "onaylama yanlılığı" olarak bilinir. Çalışmamın göstereceği şeye karar verdikten sonra, bu sonuca yol açan verileri eleştirel olarak kabul ederken, onu çürüten görünen tüm veri noktaları için mazeret buluyorum. Bilinçsiz bir şekilde, sonucuma uymayan herhangi bir veri noktasını "açık araç hatası" (veya bazı eşdeğeri) olarak reddedebilirim. Bazı durumlarda, bu kadar keskin olmayacak; Bu veri noktalarını tamamen atmak yerine, "hataları" gidermek için bazı formüller hazırladım, bu da sonuçları uygun bir şekilde önceden belirlenmiş sonucumu doğrulamaya yönlendirecektir.

Bu konuda özellikle dışlayıcı bir şey yok; beyinlerimiz böyle çalışır. Bu tür önyargıları filtrelemek için çok çaba sarf etmek gerekir ve bilim insanlarının çift kör çalışmaları yürütmek istemelerinin nedenlerinden biri, ölçümleri yapan kişinin deneyi neyin kanıtlaması gerektiğini bilmemesidir. Daha sonra, inançla ölçtüğü şeyi düzeltmemek için muazzam bir disiplin gerektirir.


1
Bunun aslında en tehlikeli önyargı olduğunu düşünüyorum, çünkü veri toplama aşamasında zaten meydana gelebilir, örneğin beklentilerinizi onaylama olasılığı en yüksek olan küçük bir alt örnekte veri toplama veya önde gelen anket sorularını kullanma.
stijn

1
Doğrulama önyargıları, disiplinlerin iddia edilen temel dayanaklarının bile farklı olduğu, disiplinler arasında gerçekten kötü olabilir, disiplinlerinizi “kullanmanın imkansız olduğunu (algılama yöntemleri ile) imkansız olduğunu, ancak benimkinde açık olduğunu (ancak yapabiliriz) X anlamında) ". örneğin Elmalar ağaçlara asmak veya yerde yatmak içindir; kendi istekleriyle 'düşemez'. Genellikle, fizik bilimlerinde, karışıklığı gizleyen matematiksel bir temel değişikliği vardır.
Philip Oakley

6

Doğrusallık .

Verilerin yorumlanması / analizi sırasında ortak bir önyargı, insanların genellikle doğrusal ilişkiler kurma konusunda hızlı olmaları olduğunu düşünüyorum. Matematiksel olarak, bir regresyon modeli deterministik bileşeninin yordayıcıların doğrusal bir işlevi olduğunu varsayar; ne yazık ki bu her zaman doğru değildir. Geçenlerde bir lisans posteri konferansına gittim ve lineer bir modelle donatıldığımı gördüğüm açık açık kuadratik ya da doğrusal olmayan trendlerin miktarı en azından endişeliydi.

p


2

Bir ilginç örnek, Kumarbaz Yanılgısının tartışılması.

Mevcut veriler dahil edilmeli mi yoksa dışlanmalı mı? Zaten 6 sixes ile öndeysem, bunlar bir düzine denemelerime dahil edilecekler mi? Önceki veriler hakkında net olun.

Mutlak sayılardan oranlara ne zaman geçmeliyim? İntial kazanan bir çizgi sırasındaki kazanılan avantajın sıfıra (rastgele bir yürüyüş) dönmesi uzun zaman alır .

Bir milyon doların% 0,1'i büyük bir şirket için fazla olmayabilir, ancak 1000 $ 'ı kaybetmek tek bir tüccarın yaşamı ve ölümü olabilir (bu nedenle yatırımcılar insanları yatırım yapmaya' yönlendirmek ister '). Yüzdelere geçebilmek bir önyargı olabilir.

İstatistikçilerin bile önyargıları var.


Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.