İstatistiksel bir hakemi nasıl rahatsız edebilirim?


102

Kısa bir süre önce bildirilerdeki istatistikleri gözden geçirme hakkındaki genel prensiplerle ilgili bir soru sordum . Şimdi sormak istediğim, bir makaleyi gözden geçirirken özellikle sizi rahatsız eden şey, yani istatistiksel bir hakemi gerçekten sinirlendirmenin en iyi yolu nedir!

Cevap başına bir örnek lütfen.


İlk incelemeye cevap olarak alınan gerekçeleri de içeriyor mu (küçük ve / veya büyük revizyonların istendiği yer)?
chl

@chl: Evet, neden olmasın.
csgillespie

Yanıtlar:


69

Beni özellikle kişisel olarak rahatsız eden şey , kullanıcı tarafından yazılan paketleri istatistiksel yazılımlar için açıkça kullanan ancak bunları uygun şekilde veya hiç alıntılamayan, dolayısıyla yazarlara herhangi bir kredi veremeyen insanlar. Bunu yapmak özellikle yazarlar akademi'deyken ve işleri alıntı yapılan makalelerin yayınlanmasına bağlı olduğunda önemlidir . (Belki de kendi alanımda suçluların çoğunun istatistikçi olmadığını eklemeliyim.)


2
Benim için + 1. Bu özellikle beni yanlış bir şeyden alıntı yaptıklarında hayal kırıklığına uğrattığında ve paketleri nasıl alıntılayacağımızla ilgili ayrıntıları verdim
Gavin Simpson

3
Soru: Bir paketten alıntı yaparken, skeçten (varsa) ya da paketin kendisinden söz eder misiniz?
Brandon Bertelsen

7
@Brandon: Eğer paket yazarı size rehberlik edecek kadar önemserse, cevapları alıntı yaparak alacağı bir formda vermişlerdir ("some_package")
Ben Bolker

2
Yapılması o kadar kolay olmayan bir dönüm noktası kağıdın yanı sıra, alıntı almanın en kolay yolu makalenizde en az bir hata bırakmaktır. Ardından, orijinal makaleyi gösteren bir düzeltme yayınlayabilirsiniz. Düzeltmede bir hata bırakın; orijinal düzeltmeyi ve orijinal makaleyi referans alan bir düzeltme yayınlayabilirsiniz (1. sınıf mezun öğrenci gibi bir şey gördüm). Alıntıların sayısı O (N ^ 2) süreci olarak artar, burada N düzeltme sayısıdır.
Mark L. Stone

67

Tanrı aşkına, aklıma gelen pek çok şey var ...

  • Kademeli regresyon

  • Sürekli verileri gruplara ayırma

  • P-değerleri verilmesi ancak etki büyüklüğü ölçüsü yok

  • Verilerin simetrik ve unimodal olup olmadığını belirten ortalama ve standart sapmayı kullanarak verileri tanımlama

  • Net altyazısız rakamlar (bu hata çubukları ortalamanın standart hataları mı, yoksa gruplar içindeki standart sapmalar mı, yoksa ne?)


5
Kademeli regresyon mermisini biraz merak ediyorum. Kademeli regresyonu bu kadar kötü yapan şey nedir? Veri tarama ve çoklu karşılaştırmalar sorunu mu?
Christopher Aden

17
Sorun, adım adım prosedürlerin, p değerlerine dayanan "normal" çıkarımsal istatistiklere ilişkin tüm varsayımları ve ön koşulları tamamen geçersiz kılmalarıdır, ki bunlar daha sonra kötü bir şekilde önyargılıdır (aşağıya doğru "daha anlamlı" olmak üzere). Yani, temelde, cevap "evet" dir, kişinin bu çoklu karşılaştırmalar için (fakat daha önce hiç yapmadığım) ilke olarak doğru bir şekilde uyarlayabileceği uyarısı vardır. Bunun, psikoloji alanında çoğaltılamayacak kadar çok araştırma yapmamın - ki bunun sonucunda büyük miktarda kaynak israfına yol açmasının tek önemli nedeni olduğuna inanıyorum.
Stephan Kolassa

10
@Stephan: Katılıyorum, adım adım kötü bir fikir. Yine de, henüz psişik yöntemlere ulaşmamış olabilirler, ancak tahminleri ve standart hataları ayarlayarak fazladan takma ile ilgili önyargıları ayarlayan çeşitli seçim prosedürleri vardır. Bu genellikle çoklu karşılaştırmaların bir sorunu olarak düşünülmez. Büzülme yöntemleri olarak bilinir. Bu konudaki cevabımı görmek için < stats.stackexchange.com/questions/499/… > ve Harrell'in "Regresyon Modelleme Stratejileri" veya Tibshirani'yi kementte görün .
Brett

5
@Brett Magill: Bu konuda +1 ve evet, büzülmeyi ve kementi biliyorum. Şimdi tek ihtiyacım olan psikologları bunların mantıklı geldiğine ikna etmenin bir yolu ... ama insanlar psikologların güven aralıklarını bildirmelerini sağlamak için çok sınırlı bir başarı ile mücadele ediyorlar, bu yüzden bir sonraki psikologların büzülmesini kabul etmeleri konusunda pek iyimser değilim. yirmi yıl.
Stephan Kolassa

10
Ayrıca, psikolojide tahminleri maksimize etmenin tipik olarak teorik amaç olmadığını, ancak aşamalı olarak regresyonun, tamamen benzer bir şekilde de olsa, tahminleri maksimize etmeyle ilgili olduğunu savunuyorum. Bu nedenle, prosedür ve soru arasında tipik olarak bir kopukluk vardır.
Jeromy Anglim


32

Simüle edilmiş sonuçları üretmek için kullanılan kod sağlanmamıştır. Kodu istedikten sonra, hakem tarafından oluşturulan veri setinde çalışmasını sağlamak için ek çalışma talep eder.


2
Ve kötü biçimlendirilmiş, yorumlanmamış ve çözülemez değişken ve işlev adları kullanıyor. Ooooh evet.
naught101

30

İntihal (teorik veya metodolojik). İlk derlemem, aslında 10 yıl önce yayınlanan köklü bir metodolojik makaleden pek çok referansı olmayan kopyala / yapıştır işlemi yapan bir yazıydı.

Bu konuyla ilgili birkaç ilginç makale buldum: Bilimde yazarlık ve intihal .

Aynı şekilde, tahrifat (veri veya sonuç) ile ilgili en kötüsünü buldum .


20
Bir hakem olarak benim ilk günlerinde i harcadığını hatırlatıyor kadar çok uzun sonunda söz konusu derginin tarafından reddedildi istatistiksel bir kağıt incelerken, ancak diğer hakemler ve ben yöntemi için daha kullanışlı bir uygulama önerdi, ben de bir cebirsel ispat kabataslak Metindeki tatmin edici olmayan bir simülasyon çalışmasının yerini almak. Yazarlar o zamandan iki tane yayınlanmış makale var. Ben değilim rahatsız Bununla ancak böyle "biz yararlı yorumlar için kağıt önceki bir sürümünün hakemlere teşekkür ederim" gibi bir onay görgü olurdu.
23'te

1
@onestop Evet, böyle bir durumun ne kadar hayal kırıklığına uğradığını hayal edebilirim ...
chl

24
Birkaç hafta önce, incelemem için bana bir yazı verildi ve% 85'inin aynı yazarlar tarafından başka bir dergide yayınlandığını öğrendi. Bu da hala intihal olarak kabul edilir. Son birkaç yıldır, herhangi bir inceleme yapmadan önce düzenli olarak kağıt yığınlarını - özellikle özetleri, girişleri ve sonuçları - web arama motorlarına gönderdim . Herhangi bir zaman okumaya yatırım yapmadan önce çalışmanın orjinal olduğundan emin olmak istiyorum.
whuber

7
+1, @whuber. Metodolojik bir derginin editörü olarak, sık sık (zorunluluk olarak, köklü yazarlardan; genç yazarların henüz bu yörüngeye ulaşmadığını) katkısı olup olmadığına karar vermek zor işim var. Yaptıkları ise, önceki beş makalesini içeren sekiz Lego bloğunu farklı bir şekilde birleştirmeleridir. Bu, bu yazarların da yayınladığı önceki elli makaledeki katkıyı sorgulamama yol açıyor :(.
StasK

26

Yazarlara sorduğumuzda

  1. Elimizdeki bir fikir hakkında ufak bir yorum (bu anlamda, makalenin reddedilmesinin bir nedeni olarak düşünülmedi, ancak yazarların başka bir POV'yi tartışabildiklerinden emin olmak için) veya
  2. net olmayan veya çelişen sonuçlar,

ve yazarların (1) gerçekten cevap vermemesi veya (2) 'deki suçlu sonuçların MS’ten kaybolması durumunda cevap vermemesi.


7
Gizemli bir şekilde kaybolan sonuçlar otomatik reddetme olmalı, yani. Bunun, "perde arkasında" (çok fazla kağıt gönderilmeden önce) çok fazla olacağına eminim, ancak bu, kağıdın normal okuyucularının asla bilmeyeceği "kiraz toplama" nın açık bir kanıtıdır.
Makro

3
Açık meslektaş bir inceleme sisteminin başka bir nedeni.
saat

24

Kafa karıştırıcı p-değerleri ve etki büyüklüğü (yani etkimi belirtmek çok büyük çünkü çok küçük bir p-değerim var).

Stephan'ın efekt boyutlarını dışlama ancak p-değerleri verme yanıtından biraz farklıdır . İkisini birden vermelisin (ve farkı umarım anlarsın!).


23

Efekt boyutları dahil değil.

Araştırmanın her yerine katılıyor (en sevdiğim lisansüstü profesörümü bu hat için ödünç almam gerekiyor).

Kanıtlanmış sayılarda haneler vermek (erkekler kadınlardan 3.102019 lira kazandılar)

Sayfa numaraları dahil değil (bu, incelemeyi zorlaştırır)

Yanlış numaralar ve tablolar

(daha önce de belirtildiği gibi - adım adım ve sürekli değişkenleri kategorilere ayırma)


7
(+1) yüksek sesle güldü ve “alçakgönüllü bir rakam (erkeklerin 3.102019 pound kazandı)” demişti.
Makro

19

Analizlerini yeterince açıklamıyorlarsa ve / veya gerçekte ne yapıldığını çözmeyi zorlaştıran basit hatalar içerdiklerinde. Bu genellikle, yazarın farkedildiğinden daha fazla belirsiz olan ve aynı zamanda kötüye kullanılabilecek bir açıklama yoluyla, çok sayıda jargon atmayı da içerir.


Kabul - yazarların bilimsel içeriği değerlendirmeden önce ne anlama geldiklerini anlamakta zorlanıyorlar.
Laurent,

5
Katılıyorum, ancak bir gözden geçiren kişi size analiz konusunda çok önemli detayların ne olduğunu, atıfta bulunmamanızı söylediğinde (ya da ek materyallere geçmeyi) söylerken daha sinir bozucu buluyorum. Bu problem, en karmaşık analizleri bile yapan çok sayıda bilim / sosyal bilim makalesinin bu açıdan oldukça kriptik olmasını sağlar.
Makro

16

İhmal edilen değişkenlerin gözlemsel verilerdeki ilişkileri tanımlamak için nedensel dili kullanmak neredeyse kesinlikle ciddi bir endişe kaynağıdır.


3
Araştırmacıların gözlemsel araştırma tasarımlarının, özellikle de ihmal edilen değişkenlerle ilgili olanlar gibi yükümlülüklerini anlamaları gerektiğine katılıyorum, ancak nedensel dilden kaçınmanın bunu yaptığını sanmıyorum. Nedensel dili kullanmanın savunmasında daha ayrıntılı bir tartışma için, özellikle deneysel olmayan araştırmalarda Nedensel Çıkarımlar adlı kitabında Hubert Blalock'un çalışmasına bakın.
Andy W,

3
(+1) Bu, epidemiyolojik araştırmalarla ilgili en büyük sorunum olabilir.
Makro 13.06

14

Yazarlar bildikleri bir istatistiksel testi kullandığında (benim alanımda, genellikle bir t testi veya bir ANOVA), uygun olup olmadığına bakılmaksızın, reklam sonsuzdur. Kısa bir süre önce, yazarların bir düzine farklı tedavi grubunu karşılaştırmak istedikleri bir makaleyi gözden geçirdim, bu yüzden olası her bir tedavi çifti için iki örnekli bir t testi yaptılar ...


13

Mevcut kavramlar için yeni sözcükler geliyor veya tam tersini, farklı bir şeyi belirtmek için mevcut terimleri kullanıyorsunuz.

Mevcut terminoloji farklılıklarından bazıları literatürde uzun süredir yer almaktadır: Biyoistatistikte uzunlamasına veriler ve ekonometride panel verileri; sosyolojideki sebep-sonuç göstergeleri - psikolojideki biçimlendirici ve yansıtıcı göstergeler; Onlardan hala nefret ediyorum, ama en azından kendi edebiyatlarında her birine birkaç bin referans bulabilirsin. Bunlardan en sonuncusu nedensel literatürdeki yönlendirilmiş asiklik grafikler üzerindeki bu çalışma dizisidir: çoğu, hepsi olmasa da, bunlardaki tanımlama ve tahmin teorisinin çoğu, 1950'lerde eşzamanlı denklemler adı altında ekonomistler tarafından geliştirilmiştir.

Üçlü değil, iki katına çıkanlar, "sağlam" terimdir ve farklı anlamlar genellikle çelişkilidir. "Sağlam" standart hatalar çok fazla abartı için sağlam değildir; dahası, modelden varsayılan sapma dışında hiçbir şeye karşı dayanıklı değildirler ve genellikle küçük örneklem performansları düşüktür. White'ın standart hataları, seri veya küme korelasyonlarına karşı sağlam değildir; SEM'deki "sağlam" standart hatalar, model yapısının yanlış tanımlanmasına (atlanmış yollar veya değişkenler) karşı güçlü değildir. Tıpkı boş hipotez anlamlılık testi fikrinde olduğu gibi, herhangi bir kimseye parmağını işaret etmek ve "Gerçekten ismini anlamayan bu kavramı ortaya koymak için birkaç araştırmacı neslinin kafasını karıştırmaktan sorumlusunuz" deyin.


1
Her iki günahı taahhüt ettiğimi itiraf etmeliyim: Verilerimi "hiyerarşik bir yapıya sahip: 1: n ilişkileriyle seviyelendiğimde (her numunenin birçok ölçümü, hasta başına birden fazla örnek). Olarak tanımlıyorum. "kümelenmiş" bir veri yapısı olarak adlandırılır - şimdi her iki terimi de kullanıyorum.Ama hala bu terimi nasıl bulabileceğimi bilmiyorum, veri yapımı tanımlamak için kelimeye umutsuzca baktım ... Diğer taraftan: Uzaktan algılamada yumuşak sınıflandırma denilen teknikleri kullanıyorum,
alanım

2
Her şey yolunda - bu yapıya başvurma yollarını da listenize "çok düzeyli" ekleyebilirsiniz. "Kümelenmiş" genellikle, gözlemlerin ilişkili olduğu bilinir, ancak hiç kimse birincil korelasyon olmadığından bu korelasyonu modelleme umrunda değildir ve GEE gibi bu korelasyona karşı güçlü olan metotları ortadan kaldırmaz. Sahip olduğun şey tekrarlanan önlemler gibi bir şey MANOVA. gllammVerilerinizi çok düzeyli / hiyerarşik bir veri olarak düşünen bir Stata paketi var, ancak diğer paketlerin çoğu birden çok ölçümü değişkenler / sütunlar olarak ve örnekleri gözlemler / satırlar olarak düşünür.
StasK

Giriş için teşekkürler. Eh, bugünlerde elbette buraya nasıl denir diye soracağım ... Tam olarak tekrarlanan ölçümler değil: genellikle numune üzerinde bir sayı (büyüklük sırası: 10 ^ 2 ile 10 ^ 4 arasında) farklı noktalar ölçmek için farklı bileşenlerin yanlış renkli haritaları üretin ve her ölçümde zaten 10 ^ 2 - 10 ^ 3 gözlem (spektrumdaki dalga boyları) var. Her numune içinde, birçok spektrum birbiriyle koreledir, fakat hepsi değil: numuneler homojen değildir. ...
cbeleites

1
... "Kümelenmiş" tanımınız bizim yaptığımıza çok benziyor. Ancak doğrulama için numuneleri bölmeye özen gösteriyorum, etkili örneklem büyüklüğü hakkında hiçbir fikrim yok, (en azından dahil olan gerçek örneklerin sayısı olduğu kadar) olmadığını söylüyorum ve bazen her birinin bu ölçümleri aldığını gösteriyor Örnek aslında model eğitimi için yardımcı olur.
cbeleites,

1
Elbette ilginç ve zorlu veriler.
StasK

11

Eksik verilerin sıfır değerlendirilmesi.

Birçok pratik uygulama, en azından bazı kayıp değerleri olan verileri kullanır. Bu epidemiyolojide kesinlikle çok doğru. Eksik veriler, doğrusal modeller de dahil olmak üzere birçok istatistiksel yöntem için sorun sunar. Doğrusal modellerde eksik olan veriler çoğu zaman tüm değişkenlerde eksik veriler bulunan vakaların silinmesi ile ele alınmaktadır. Bu, tamamen Tamamen Rastgele Eksik (MCAR) verilerinin eksik olduğu varsayımı altında veriler olmadığı sürece bir sorundur.

Belki de 10 yıl önce, ek bir kaygı gözetmeksizin doğrusal modellerden sonuçların yayınlanması mantıklıydı. Bundan kesinlikle suçluyum. Bununla birlikte, istatistiki paketler / modeller / kütüphaneler / vb. Gibi, eksik verilerle nasıl başa çıkılacağına ilişkin çok iyi bir öneride bulunuldu. eksiklik olduğunda daha makul varsayımlar altında daha uygun analizleri kolaylaştırmak.


1
Eğitmeye çalışmanın ruhunda, daha fazla şey yapabilir misin? Neyi göz önünde bulundurmayı düşünürsünüz - onun var olduğunu kabul etmek ya da karşısında istatistiksel analizi düzeltmek (örneğin emir). Uygun olduğunda, supp'i eklemeye çalışıyorum. İlgilenen değişkenlerin belirttiği eksik değer tabloları, ancak bu söz konusu olduğunda "dikkate almak" için yeterli olup olmadığı açık değildir.
Andy W,

8

Önemine yaklaşan (örneğin, p <.10) etkilerini rapor etmek ve daha sonra, daha katı ve kabul edilebilir bir düzeyde önem kazanmış gibi onlar hakkında yazmak İyi kurulmuş bir analitik strateji alıp bunu daha önce hiç kimsenin kullanmayı düşünmüyormuş gibi sunması belki de birinci derece intihal niteliğindedir.


Belki intihaldan ziyade tekerleği yeniden icat ediyordur?
gerrit

7

Aşağıdaki iki makaleyi öneririm:

Martin Bland:
İstatistiği Hakem Nasıl Düşürür
Bu, Martin Bland tarafından verilen ve diğer istatistiksel hakemlerden ('düşük cevap oranına sahip kolaylık örneği') gelen bir dizi görüşmeye dayanmaktadır. İstatistiği hakem üzmekten kaçınmak için 11 puanlık bir liste ile sona erer.

Stian Lydersen:
İstatistiksel inceleme: sık verilen yorumlar
Bu son makale (2014/2015 tarihinde yayınlanmıştır), yazarın yaklaşık 14 yorumuna dayanarak yazarın en yaygın 14 yorumunu listeler. Bilimsel makalelerin 200 istatistiki değerlendirmesi (belirli bir dergide). Her açıklamaya nasıl sorunu ve talimatların kısa bir açıklama vardır düzgün analiz / raporlama yapmak. Atıfta bulunulan referansların listesi ilgi çekici makalelerin bir hazinesidir.


Lydersen'ın listesi ilginç. Sanırım bir avuçla aynı fikirde değilim. . .
İstatistikleriStudent

6

Test verilerinin bağımsız olmadığı öngörücü modellerin genelleştirme hatasını hedefleyen "doğrulama" beni en çok (ve en sık) rahatsız ediyorum (örneğin, tipik olarak verilerde, önyükleme dışı veya çapraz doğrulama bölme ölçümlerinde veri başına hasta başına çoklu ölçümler) hastalar ).

Daha da sinir bozucu olan, böyle hatalı çapraz onaylama sonuçları veren belgeler artı çapraz onaylamanın genel önyargısını gösteren bağımsız bir test setinin yanı sıra çapraz onaylamanın tasarımının yanlış olduğu tek bir kelime değil ...

(Aynı veri sunulduysa çok mutlu olurdum "çapraz onaylamanın hastaları ayırması gerektiğini biliyoruz, ancak buna izin vermeyen bir yazılımla sıkışıp kaldık. Bu nedenle, gerçekten bağımsız bir test hastası grubunu test ettik. ")

(Ayrıca bootstrapping = değiştirme ile yeniden örneklemenin genellikle çapraz doğrulamadan daha iyi performans gösterdiğinin de farkındayım = değiştirme olmadan yeniden örnekleme. Bununla birlikte, çapraz doğrulamayı tekrarlayan / yineleyen spektroskopik verilerde (simüle edilmiş spektrumlar ve hafif yapay model kurulumu ancak gerçek spektrumlar) bulduk önyüklemenin genel belirsizliği benzerdi, oob daha fazla önyargıya sahipti, ancak daha az sapma vardı - yeniden değerlendirme için, buna çok pragmatik bir bakış açısıyla bakıyorum: tekrarlanan çapraz onaylama ve önyükleme dışına çıkma pek çok makale olmadığı sürece önemli değil ne hastaya göre bölünmüş ne de sınırlı test örneği büyüklüğünden dolayı rastgele belirsizliği rapor et / tartış / bahset.)

Bunun yanlış olmasının yanı sıra, uygun bir onaylama yapan kişilerin, sonuçlarının neden literatürdeki diğer sonuçlardan daha kötü olduğunu savunmaları gerektiği yan etkisi de vardır.


1
Bunu söylemek isteyip istemediğinizden emin değilim, ancak "iyimserlik" önyükleme modeli bir modeli doğrulamanın en iyi yollarından biridir ve eğitim ve test örnekleri birbiriyle örtüşür.
Frank Harrell

1
@ Frank Harrell - Amacını anladığımdan emin değilim. Belki de zorluk şudur: kemometride "prediktif modelin validasyonu" her zaman yeni, bilinmeyen, gelecekteki vakalar için performansla ilgilidir (örnekte: yeni hastaları teşhis etmek). Her zaman boot-out-out veya yinelenen / tekrarlanan çapraz onaylama kullanıyorum. Test ve tren setleri üst üste binme avantajının hasta düzeyinde bölünme ile karşılaştırılmasının ne olduğunu açıklayabilir misiniz ("örtüşen" anlamına gelir, ölçümlerin bölünmesi anlamına gelir, böylece test ve eğitim ölçümleri aynı hastaya ait olabilir, her zaman hastalar arası bir modelden söz eder) )?
cbeleites,

... Ve evet, model onaylamanın bazı noktaları, verileri farklı test ve eğitim durumlarında (örn. Katsayılar açısından model istikrarı) bölmeden cevaplanabilir. Ama zaten model kararlılığı wrt. Tahminler, bilinmeyen hastalar kullanılarak ölçülmelidir (bilinmeyen: hiçbir zaman tüm vakaları hesaba katan veri odaklı ön işleme dahil, model oluşturma sürecinde ortaya çıkmadı). Aslında, kemometride geleneksel bir nicel ölçüm için, validasyonun bağımsız olarak ölçülmüş test verisine ihtiyaç duyan adımları vardır: ...
cbeleites

alet ve analitik yöntemin bir önemli özelliği bilinmeyen operatör için iyi bir uygulama çağrıları doğrulama esnasında belirlenecek kalibrasyon yeniden yapılması gereken (ya da cihazın kayması belirli bir zaman miktarı boyunca önemsiz olduğunu gösteren) ne sıklıkta - bazı Hatta yazarlar, bu tür bağımsız test setlerinin ihmal edilmesine yol açan "yeniden örneklemenin kötüye kullanılması" hakkında bile konuşurlar .
cbeleites,

1
Ekipman veya ölçüm tekniklerinin onaylanması gerekiyorsa, bağımsız bir örnek gereklidir. Ancak genel bir hata, bağımsız bir onaylamayı simüle etmeye çalışmak için veri bölme kullanmaktır. Bu hala dahili bir doğrulamadır. Yukarıdaki @cbeleites sorusuna cevap vermek için, önyükleme işlemine dahil olan üst üste binen örnekler, birinin görmesi muhtemel veri setlerinin çoğundaki veri bölmelerinden daha gelecekteki model performansının daha doğru tahminlerine yol açacaktır. Veri bölüşümünün n = 17.000 ve 0.30 olay oranı ile düşük performans gösterdiğini gördüm.
Frank Harrell

4

Tekil anlamda "veri" kullanımı. Veri ARE, asla değildir.


2
Muhtemelen bir Fransız istatistikçi;)
Stéphane Laurent

9
Kabul etmeliyim ki, yakın zamanda 10 yıldan fazla bir süre boyunca tutulduktan sonra verilerin çoğul kullanımından vazgeçtim. Genelde teknik olmayan izleyiciler için yazıyorum ve görkemli geldiğim için endişelendim. APA hala çoğul olduğu konusunda katı bir okumaya sahip görünüyor, ancak ilginç bir şekilde Kraliyet İstatistik Kurumu'nun belli bir görüşü yok gibi görünüyor. Burada ilginç bir tartışma var: guardian.co.uk/news/datablog/2010/jul/16/data-plural-singular
Chris Beeley

1
Ben bir İngilizce konuşmacısı değilim, ancak tekil olarak "data" veya "media" gibi çalışmalarla ilgili sorun İngilizce'nin birçok başka Latince kelimeyi ödünç almış olması ve tüm Latince kelimelerin tutarlı bir şekilde kullanılması gerekir. Sıradaki ne? "Müfredat" veya "Müfredat" mı? "Orta" mı? Eğer "data" Latince ise, o zaman çoğul. Tartışmanın sonu. Kaç kişi şimdi onu görmezden gelmek isterse önemli değil.
Fran

Belki kötüye kullanıyorum ama içeriğe bağlı olarak tekil ve plurar arasında geçiş yapıyorum.
StatsStudent

'Veri' kelimesinin düşük ve sadece özel durumlarda kullanılması, 'veri' kelimesini 'kurtlar' açısından 'paket' kelimesine eşdeğer bir şey olarak düşünüyorum. Birden fazla kurt tanımlamak için 'paket' kelimesini tekil olarak kullanmak kesinlikle kabul edilebilir. 'Veri' kelimesi yavaş yavaş kendi kolektif ismine dönüşüyor ...
Robert de Graaf

3

Bana göre, nedensel bir analiz yapılmaksızın veya yanlış bir nedensellik çıkarımı olması durumunda sebep göstermektir.

Ayrıca, eksik verilerin nasıl işlendiğine hiç dikkat edilmemesinden nefret ediyorum. Yazarların sadece vaka analizini tamamladıkları ve sonuçların eksik değerleri olan nüfusa genelleştirilip genleştirilemeyeceği veya eksik değerlere sahip popülasyonun tam veriler içeren popülasyondan sistematik olarak nasıl farklı olabileceğinden hiç söz etmeyen çok sayıda makale görüyorum.


Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.