SE katılımcılarının “çok yönlü” ölçüsü nasıl ölçülür?


12

Stack Exchange, hepimizin bildiği gibi, çeşitli konulara sahip Soru-Cevap sitelerinin bir koleksiyonudur. Bir kullanıcının sahip olduğu istatistikler göz önüne alındığında, her sitenin birbirinden bağımsız olduğu varsayılarak, bir sonraki adama kıyasla "çok yönlü" ifadesi nasıl hesaplanır? Kullanmam gereken istatistiksel araç nedir?

Dürüst olmak gerekirse, "iyi yuvarlaklığı" matematiksel olarak nasıl tanımlayacağımı tam olarak bilmiyorum, ancak aşağıdaki özelliklere sahip olması gerekir:

  1. Her şey eşit olduğunda, bir kullanıcı ne kadar çok temsilci varsa, o kadar iyi
  2. Her şey eşit olduğunda, bir kullanıcı ne kadar çok siteye katılırsa o kadar kapsamlı olur.
  3. Cevap veya sorunun iyi yuvarlaklığı etkilememesi

Her şeyden önce, SE bağlamında “çok yönlülüğü” nasıl tanımlarsınız?
JM bir istatistikçi değil

@JM, bilmiyorum, bu yüzden topluluğun kavramları biraz daha fazla etmesine yardımcı olacağını umuyorum.
Graviton

1
Diz sarsıntılı PC polisi gibi görünme riski altında - Sitemizi ziyaret eden kadınları dahil edelim. @Graviton, Tüm referanslarınız erkekler içindir.
rolando2

Bir kullanıcı kimliğinin tanımladığı kapsamlılık size bir katkının kapsamlılığı hakkında bilgi vermez , çünkü bir katılımcı farklı SE'ler için farklı kullanıcı kimliğine sahip olabilir. Bazı kullanıcı kimlikleri birden fazla katılımcı tarafından da kullanılabilir (ör. Hesabı paylaşan ortaklar).
Alexis

Yanıtlar:


7

Siteler arasındaki benzerliği de hesaba katmanız gerekir. StackOverflow ve Seasoned Advice'a katılan bir kişi, SO ve CrossValidated'a katılan birinden daha iyi bir şekilde yönlendirilir, bu da SO ve Programcılara katılan birinden daha iyi bir şekilde (tartışacağım) . Kuşkusuz bunu yapmanın birçok yolu vardır, ancak üst üste binen kaydı kontrol ederek sadece bunu hissedebilirsiniz.


1
@Matt Parker, iyi noktalar - Temsilci metriğin bir parçasıysa, temsilcinin nasıl kazanıldığına da bakmanız gerektiğini düşünüyorum. Temsilcilerini çok sayıda soru / cevapta küçük kazanımlardan alan bir kişi, bir ton yukarı oy alan tek bir soru üzerinde aynı temsilcisi alan bir kişiden daha iyi yuvarlanabilir.
DQdlM

3
@Kenny Bu iyi bir nokta ve bence bunu doğru şekilde ifade ettiniz - ancak en çok oylanan soruların ve cevapların çoğu genellikle uzmanlığın en az göstergesidir, oysa gerçekten cesur teknik soruların iyi cevapları genellikle çok düşük oylar.
Matt Parker

1
Örneğin, whuber'ın cevaplarına bir göz atın. Cevapları eşit derecede mükemmel, bu yüzden yüksek puan alan cevapları ve 1 seçmeni arasında ne fark var? Birincisine baktığımda anladığım sorulara mükemmel cevaplar görüyorum; ikincisinde, grok yapmaya bile başlamadığım sorulara mükemmel cevaplar. Bu yüzden düşük oylanan cevaplar aslında derin uzmanlaşmanın göstergesi olabilir (ancak not: çok yönlü bir SE kullanıcısının neye benzediğini merak ediyorsanız, budur ).
Matt Parker

1
Aslında, @Graviton, çok yönlü kullanıcıları aradığınızı ve çeşitli metriklerinizde nasıl performans gösterdiğini göreceğiniz akıllıca olabilir.
Matt Parker

1
@KennyPeanuts, yukarıdaki Matt'in noktasını tamamlamak için, SE sitelerinde çok sayıda soruya cevap veren, ancak birkaç yukarı oy veren önemli sayıda kullanıcı var gibi görünüyor. Bu da genellikle uzmanlık veya çok yönlü olduğunun göstergesi değildir. (Olsa da, bir Garner "ün" en kolay stratejilerinden biri).
kardinal

6

ÖRNEK: üç site olduğunu varsayalım ve A, B, C Kullanıcılarının iyi yuvarlaklığını karşılaştırmak istiyoruz. Kullanıcıların itibarlarını üç sitede vektör biçiminde yazıyoruz:

A Kullanıcısı: [23, 23, 0]

Kullanıcı B: [15, 15, 0]

Kullanıcı C: [10, 10, 10]

B'den çok daha iyi bir seçim yaptık (itibarlarının ikisi de iki siteye eşit olarak yayılmıştır, ancak A'nın daha fazla itibarı vardır). Ayrıca, C'yi B'den daha iyi yuvarlanmış olarak değerlendiririz (aynı toplam itibara sahiptirler, ancak C daha fazla siteye daha da yayılmıştır.) A'nın C'den daha iyi mi yoksa tam tersi mi olduğu kararlaştırılmamıştır. .

xAxBxC

f(x)ff(xA)>f(xB)f(xC)>f(xB)

f(x)

Dışbükey fonksiyonların iki yaygın örneği 'kesirli norm'dur

f([x1,...,xm])=ixip

0<p<1

p=1/2

f(xA)=2239.6
f(xB)=2157.7
f(xC)=3109.5

1/2

f

f([x1,...,xm])=ixilog(xi/c).

c=ixi

f

f(xA)=46log(2)31.9
f(xB)=30log(2)20.8
f(xC)=30log(3)33.0

Ölçekli Shannon entropisine göre ölçüldüğünde, C'nin üçün en yuvarlak olduğunu ve A'nın en iyi yuvarlak olduğunu söyleyebiliriz.

f(x)

EDIT2: whuber'ın yorumu ışığında bir örnek eklendi.


f

f[1,101]f

Herhangi bir x_i <0 olduğunda fraksiyonel norm tanımlanmamıştır. Herhangi bir x_i / c ≤ 0 olduğunda Shannon entropisi başarısız olur.
200_success

4

Bu gerçekten, gerçekten ilginç bir soru (gerçekten de genel olarak yığın değişim sitelerini modelleme fikrine aşığım).

Geniş kapsamlılık konusunda, bunu değerlendirmenin bir yolu, belirli kullanıcıların cevaplamaya eğilimli olduğu etiketler ve sitelere dağıtılmasıdır. Örnekler bunu daha açık hale getirebilir.

TeX, StackOverflow, CrossValidated ve AskUbuntu üyesiyim. Şimdi, gerçekten sadece buraya ve StackOverflow'a katkıda bulunuyorum ve sadece Stackoverflow'daki R hakkında. Bu nedenle, iyi yuvarlaklığı tanımlamak için, a) iki sitenin ortak olduğu etiketlerin miktarı (siteler arasında benzerlik tanımlamak için) ve bir kullanıcının ortak etiketleri çok az olan veya hiç olmayan sitelerdeki soruları ne ölçüde cevapladığı incelenir.

Örneğin, birisi StackOverflow ve yemek pişirmedeki Python etiketlerine katkıda bulunursa, bu kişi Taşma ve istatistik soruları hakkındaki istatistiki yazılım sorularını (örneğin) yanıtlayan birinden daha kapsamlıdır.

Umarım bu biraz yardımcı olur.


4
(+1) Python etiketlerine hem SO'da hem de yemek pişirmede katkıda bulunan birisinin yiyeceklerde bazı egzotik lezzetleri var :-) Tavuk gibi tadı duyuyorum.
whuber

3

'Çok yönlü' ifadesini 'birçok farklı Stack Exchange Sitesine katkıda bulunma' olarak tanımlarsanız, site başına bazı katkı metriklerini hesaplarım. Toplam gönderiyi veya günlük ortalama gönderiyi veya itibarını kullanabilirsiniz. Ardından, bu metriğin tüm siteler arasındaki dağılımına bakın ve çarpıklığını mantıklı bir şekilde hesaplayın.

Diğer bir deyişle, 'çok yönlü' bir kişi birçok farklı siteye katkıda bulunan bir kişi olurken, 'çok yönlü olmayan' bir kişi öncelikle bir siteye katkıda bulunan bir kişi olacaktır. Tüm sitelerde metriğinizi bir kullanıcının toplamıyla ölçeklendirerek bunu daha da iyileştirebilirsiniz. yani birçok farklı siteye çok katkıda bulunan biri, sitelerin hiçbirine katkıda bulunmayan birinden daha iyi düşünülmelidir. Daha önce SE kullanmayan bir kişi çok iyi değil!


1

Zaten çok iyi cevaplar, neden bir tane daha? Bu tartışılan ilginç fikirlere dikkat çekmek çoğunlukla burada en n-Kategori Café . Ekolojide (ve başka yerlerde) çeşitlilik çoğunlukla sadece bolluğa bakarken, farklı türlerin ne kadar benzer / farklı olduğuna da bakılmalıdır.

Türleri (veya SE siteleri gibi her şeyi ...) bir metrik uzaydaki noktalar olarak temsil ederek, bu, entropinin metrik uzaylara genelleştirilmesine yol açar , bkz. Örneğin Tom Leinster, Emily Roff tarafından bir metrik alanın maksimum entropisi . Aynı fikirler, metrik alandaki noktalar olarak etiketlere bakılarak SE sitelerinde kullanılabilir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.