Çerezlerin “ziyaretçilere” standart oranı?


31

Yakın tarihli bir blog yayınında belirtildiği gibi , Google Analytics "ziyaretçiler" ile Quantcast "ziyaretçiler" arasında büyük bir tutarsızlık görüyoruz .

Ayrıca, asla çözemediğimiz nedenlerden dolayı, Google Analytics, Quantcast'ten daha büyük rakamlar alıyor. Şu anda GA, stackoverflow.com’da yalnızca tek başına Quantcast'in ağda (14 milyon) gördüğünden daha fazla ziyaretçi (15 milyon) gösteriyor :

Niye ya? Bilmiyorum. Google Analytics bazen çerezleri kaybeder veya Quantcast ziyaretçileri özlüyor. Sayma yanlış bir bilimdir.

Bunun nedeni Quantcast'in ziyaretçilere daha muhafazakar bir çerez oranı kullanmasıdır . Google Analytics her çerezi bir "ziyaretçi" olarak kabul edebiliyor olsa da, Quantcast sadece her 1,24 çerezi "ziyaretçi" olarak kabul edecektir. Bu, insanlar sitelerimize birden fazla bilgisayardan, birden çok tarayıcıdan, vb.

Yakından ilgili iki sorum var:

  1. Ziyaretçilere kabul edilen standart bir çerez oranı var mı? Bu, açık bir şekilde kesin olmayan bir bilimdir, ancak ortaya çıkmakta olan herhangi bir kural var mı?

  2. Tarayıcı ziyaretçisine güvenmekten başka bir web sitesinde "ziyaretçileri" saymanın daha doğru bir yolu var mı? Yoksa bu sadece ölçtüğünüz önemli değil, her zaman bir tür en iyi çaba tahmin crapshoot olacak mı?


Quantcast kesinlikle çerezleri kullanır, değil mi? Sadece IP adreslerine mi gitmiyorlar?
DisgruntledGoat

@disgruntledgoat sadece web sitesini kontrol ettim: "Quantcast, hem benzersiz çerez sayıları hem de insanlar için izleyici verileri sağlar."
Matthew Brookes

@DisgruntledGoat bu sayfayı kontrol edin. Çerezleri var quantserve.com.
Yahel

Yanıtlar:


14

Quantcast bana e-posta attı:

GA numaralarınız ve QC numaralarınız arasında oldukça önemli bir delta bulunduğundan bahsettiniz. Bu çok sık olmamakla birlikte, gerçekleşir ve bunun gerçekleşmesinin birkaç nedeni vardır. Örneğin, 3. parti çerezleri ve otomatik yenilemeleri hesaba katarız ve GA bunu yapmaz. Ayrıca yayıncılardan MRC ve IAB standartlarına uymak için etiketimizi sayfanın altına yerleştirmelerini rica ediyoruz. Diğer ölçüm etiketleriniz sayfada daha yüksekse, Quantcast'in yapmadığı zamanlarda patlayabilirler. (Biz sadece MRC onaylı trafik ölçüm servisi vardır). Ayrıca, zaman dilimi kaygıları nedeniyle sayılar hiçbir zaman aynı olmayacak - normalleştirme işlevini kullanıyoruz ve GA'lar sabittir.

Sayılarımızı nasıl belirlediğimizle ilgili daha fazla bilgi edinmek istiyorsanız, lütfen göz atın: http://www.quantcast.com/how-we-do-it . Ayrıca çerez düzeltmeli kitle verilerimiz ve burada yer alan metodolojimiz hakkında beyaz kağıtlarımız bulunmaktadır.

Beyaz kağıtlara bakıldığında, Jeff'in önerdiği şeyi yaptıklarını görüyorum: “resmi” sayıları, gerçek insan sayısına daha yakın olduğunu düşündükleri bir şeyle karıştırmak. Sistemlerinde oldukça sihirli bir sayıya bölünmek kadar basit değil, sistemlerinin oldukça karmaşık olduğunu belirten bir Çerez Düzeltilmiş İzleyici Tanıtım Belgesi (PDF bağlantısı) vardır:

Quantcast Quantified Publisher programı, her ay 1,4 milyardan fazla çerez tarafından oluşturulan 75 milyardan fazla medya tüketimini yakalamaktadır (Haziran 2008 itibariyle veriler). Dahası, Quantified Publisher ortaklarımızın çoğu, çerezlerden bağımsız olan adsız tanımlayıcıları bizimle paylaşır. Modelimiz ayrıca insan tabanlı referans noktaları ve çerez silme içermeyen kalibrasyon sağlayan birkaç panel içerir. Farklı veri toplama süreçleri, önyargılar ve konularla birlikte bu veri kitlesini üçgenleştiriyoruz. Modellerimiz ziyaret sıklığını, zaman periyodlarını, çoklu bilgisayar kullanım olasılığını ve hatta aynı bilgisayarı kullanan birden fazla insanın insanlara dayalı tahminler vermesinin etkisini hesaba katar. Benzersiz çerezleri insanlara çevirme modelimiz, bekletme örnekleri ve bağımsız veri setleri kullanılarak doğrulanmıştır. Dahası, modelimiz dinamik ve İnternet trafik düzenlerinin gelişen doğasını yansıtmak için sürekli olarak yeniden kalibre edilmektedir.


2
İlginç. İkinci alıntı ilkinden daha bilgilendiricidir (ve ikna edicidir). GA, birinci taraf çerezlerini kullandığı için üçüncü taraf çerezlerini hesaba katması gerekmez. Evet, saat dilimi farkları kesin sayıları değiştirecek, ancak ay boyunca sürecek olan sürelerin önemli ölçüm farklarını hesaba katması pek mümkün değil.
Yahel

27

Quantcast alt hesapta oynaması için başka bir faktör daha var: Üçüncü taraf çerezlerini ( .quantserve.cometki alanından sunulan çerezler ), Google Analytics ise birinci taraf çerezlerini ( stackexchange.comvb.) Kullanıyor .

Bazı tarayıcılar (özellikle Safari, ancak son zamanlarda Firefox ve Chrome) varsayılan ayar olarak üçüncü taraf çerezlerini devre dışı bıraktıklarından ve diğer birçok kişi üçüncü taraf çerezlerini yasaklayan gizlilik ayarlarını tek tek seçebildiğinden, bu çok önemlidir. Bu, QuantCast'ın çerezleri tarafından asla takip edilmeyecek bir popülasyon alt kümesi olduğu anlamına gelir. Doğal olarak, bu, Google Analytics’in her zaman daha yüksek bir ziyaretçi sayısı getireceği anlamına gelir.

Genel bir kural olmadığını söyleyebilirim. Bir analiz uzmanı olarak, 'gerçek' bir ziyaretçi sayımı arayışının umutsuz olduğunu ve bunun yerine ziyaretlerin kendilerine odaklandığını söyleyebilirim. Örneğin, Google Analytics hesabınıza, iş dizüstü bilgisayarımda, kişisel dizüstü bilgisayarımda, telefonumda ve iPad'imde Chrome, Safari ve Firefox'tan StackOverflow'a erişen en az 8 farklı ziyaretçiyim. Analytics hizmetlerinin tümü farklı şekillerde sayılır ve bu nedenle hepsi önemli ölçüde farklı numaralar döndürür.

Mükemmel bir uygulama olsa bile, Google Analytics neredeyse her zaman sunucu günlüğü tabanlı bir analitik sistemden daha düşük ziyaret sayısını gösterir, ancak Quantcast gibi üçüncü taraf çerez tabanlı bir sistemden daha yüksek ziyaret sayısını gösterir. Önemli olan, ham toplamlara bakmak değil, her yöntemin güçlü yanlarında gösterdiği eğilimlerdir. Yani, Quantcast numaralarını hiçbir zaman Google Analytics numaralarıyla karşılaştırmayın; bunun yerine, sayıları toplandıkları bağlamlar içinde kullanın.

Başka bir sorun, Google Analytics uygulamanızın doğru olmaması olabilir, çünkü bu tür bir çok alanlı ve alt alan adı kurulumuna göre yapılandırılması doğru ve titizlikle yapılmazsa kabus olabilir, bu da tek bir tarayıcının sayılmasına neden olabilir Birden fazla ziyaretçi, sayınızı şişiriyor. Tüm çerezler bir üçüncü taraf etki alanında ayarlandığı için bu asla Quantcast için bir sorun değildir.


Google Chrome, üçüncü taraf çerezlerini varsayılan olarak engelliyor görünmektedir.
MrWhite

7

Çerezlerin benzersiz ziyaretçilere oranı, bir milyondan fazla ziyareti olan siteler için genellikle 1,3 ile 1,7 arasındadır.

Yc01, GA'nın üçüncü taraf çerezlerine karşı birinci taraf çerezleri kullandığı doğru olsa da, RealSelf.com'da biz iki birinci taraf analitik sağlayıcısı kullanıyoruz (GA ve Comscore Direct) ve GA, Comscore'un Benzersiz Ziyaretçilerinden% 30 daha fazla Mutlak Benzersiz Ziyaretçiler gösteriyor.

Comscore yalnızca ülkeye göre benzersiz ziyaretçiler gösteriyor, bu nedenle GA'yı Comscore ile karşılaştırmak için ABD merkezli mutlak benzersiz ziyaretçilerin sayısını şu şekilde hesaplamamız gerekiyor:

ABD Ziyaretleri / Küresel Ziyaretler * Mutlak Benzersiz Kullanıcılar

(1,150,110 / 1,650,979) * 1,273,059 = 886,842 ABD merkezli Benzersiz Kullanıcılar

Buna karşılık, Comscore, 680.900 ABD merkezli Tekil Kullanıcıyı bildirir. Yani GA% 30.2 daha fazla gösterir.

Comscore işlerini doğru olmaya çalışarak geliştirdi, GA ise öncelikle AdWords ve AdSense kullanan siteleri izlemek ve optimize etmek için ücretsiz bir yol. Comscore, trafiği tahmin etmek için de kullandıkları bir insan paneline sahiptir ve bu paneli kişi başına ortalama bir çerez sayısını belirlemek için kullanır. Mobil cihazları kullanan daha fazla kişiyle (mobil kullanımımız% 15'tir), benzersiz çerezlerin benzersiz kişi sayısını abarttığı anlamlıdır.


“Çerezlerin benzersiz ziyaretçilere oranı, milyonlarca ziyaret eden siteler için genellikle 1,3 ile 1,7 arasındadır.” Bu Comscore-yayınlanan bir rakam mı?
Ciaran

bu bizim için şaşırtıcı bir şekilde doğrudur; Koştum UserSessionbirkaç sitede masa istatistikleri ve onlar arasındaki her şey ile 2.0 (yığın taşması) den 1.46 (webapps.se) arasında değişir. 1.6 teknoloji merkezli siteler için çok akıllıca bir varsayılan gibi görünüyor.
Jeff Atwood


2

Belki de GA ziyaretçi sayılarınız, izleyicilerin daha teknik yapıları nedeniyle normal bir siteden daha fazla şişirilmiş olabilir? Örneğin, özellikle web geliştiricileri olan programcıların bir dizi tarayıcı kullanması ve dolayısıyla çerez sayısının artması daha olasıdır.

1. soru için, birçok ölçümde olduğu gibi, toplamlar yanıltıcı olabileceğinden, genel standartları aramak yerine kendi sitenizdeki verileri kullanmak daha iyi olur. Bir çerezi gerçek ziyaretçi sayısına ulaştırmanın bir yolu, kayıtlı her bir kullanıcıdan kaç tane çerez gördüğünüzü saymak ve ardından sayıyı türetmek olabilir.

2 numaraya gelince, teorik olarak gerçek ziyaretçi saymanın en iyi yolu herkesi bir hesap açmaya zorlamak olacaktır. Belli ki iyi bir fikir olmadığı için normalleşmeye bakabilirsiniz. Örneğin, yukarıda tavsiye ettiğim kayıtlı kullanıcı metriği için ortalama çerezleri kullanabilir ve bunu GA'nın rapor ettiği ziyaretçi numaralarına uygulayabilirsiniz.


bu BÜYÜK bir nokta. Stack Overflow'da şu anda 531.484 oturumumuz var; bunun 261.547'si benzersiz kullanıcılara işaret ediyor - yani her 1 kullanıcı için 2 çerez.
Jeff Atwood

-1

IP'nin güvende olduğunu düşünüyorum ... GA gibi python ile bir istatistik sistemi oluşturduğumda böyle bir yöntem kullanıyorum

  • tarayıcıya çerez gönder ve tüm ajan verilerini veritabanına al
  • Yeni ziyaretin yeni çerezi olmadığı için kolay bir yoldur, bu yüzden yeni ziyaretim olmadığı için kaydederim.
  • kullanıcı IP'sini ve bu kullanıcı için bazı kimlikleri ve IP ve çerezleri kaydet (ayrıca çerezlere kaydet)
  • yeni kullanıcı geliyor ve çerez içermiyor ... bu IP yeni mi? Evet? Tamam, yeni kullanıcısı yalnızca kullanıcı aracısını ve IP / hayır'ı mı alıyor? bu kullanıcı kaç kez geliyor? sınırdan daha mı fazla? gerçekten yeni bir ziyaret değil, bu kullanıcı aracısıyla daha fazla değil misiniz? Tamam bu yeni ...: D

bu yöntem hatalı ancak hatalı ve geçerli veriye yakın… (aynı zamanda yeni kullanıcı bulmak için gecikme süresine (2 ziyaret arasındaki gecikme) ve kullanıcıların çerez yapmadığı zamanları denemesine de bağlı)


5
Bu, örneğin, NAT'ın arkasından StackOverflow'a erişen birçok farklı geliştiriciye sahip bir şirketi nasıl ele alır? Hepsi bir ziyaretçi sayılır mı?
Svish

3
Bunun IP yönü gerçekten kusurlu. IP adresi benzersiz bir tanımlayıcı değil.
Yahel

bunun için deneme zamanı var ... ajanı ve diğer şeyleri kontrol ediyoruz ve 100'den fazla ip ekleyebiliriz ... bir NAT arkasındaki gerçek kullanıcıyı bulmak için önerilen yolu
Mohammad Efazati
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.