Neden ilk sayfada Google binlerce sonuç olduğunu, ancak son sayfada yüzün altında olduğunu söylüyor?


11

Neden ilk sayfada Google binlerce sonuç olduğunu, ancak son sayfada yüzün altında olduğunu söylüyor?

Bu, kendini açıklayan bir tür özyinelemeli Google Aramadır. Cümleyi düzeltmek ve tam olarak karşılık gelen bir sayı bulmaya çalışmak biraz zamanımı aldı, bunun yerine onu " yüzlerce " olarak değiştirmemin nedeni ! : P

Google'ı yeterince uzun süredir kullandıysanız, buna benzer durumlarda kesinlikle birçok kez tökezlediniz. 10 sayfadan daha az gösterdiği zaman bunu görmek oldukça kolaydır. Noktasıdır: sonuçlarının sayısı üzerinde son dışındaki herhangi bir sayfaya bir gibi görünüyor korkunç tahmini .

Hatta tuhaf olan, bazı rasgele zamanlar tahmin, aniden tüm sayfalarda son sayfadakinden çok daha iyi ve neredeyse aynı olur - her zaman doğru olan tek sayfa.

Peki, nedenini bilen var mı?


1
Şu anda bu arama için bir sayfada 3200 sonuç yazıyor, ancak son sayfada 75 (bir güncellemeyle ilgilenen insanlar için) diyor
dkuntz2

@DKuntz bu benim için 2990 ve 65 (oturum açtığım zaman) olurken, oturumu kapatırsam (ilk kez böyle yaptım) 3120 ve 77'ye dönüşür. Belki daha sonra soruyu biraz değiştirip inşa edeceğim tutarlı bir özyinelemeli sorgu yukarı - ama herkes de bunu yapmak için bekliyoruz! : P
cregox

Google tuhaf.
dkuntz2

Mine her zaman 4 sayfada sonuç olsun ya da 22 olsun son sayfada 208 sonuç diyor, her zaman 208 diyor.
mchid

Yanıtlar:


6

Kesin cevabı bilmiyorum - belki Google dışında kimse bilmiyor. Ancak, yararlı olabilecek iki veri noktam var.

Birincisi XKCD'nin konuyu ele geçirmesi :

Dolayısıyla, görünüşe göre Google'ın görünüşe göre “vidala” dediği ve devasa bir sayı attığı belirli bir sonuç hacmi eşiği var gibi görünüyor. Bunun muhtemelen kasıtlı aldatmacadan ziyade yetersizlikten kaynaklandığını düşünüyorum; Eminim birçok kaynaktan hızlı bir şekilde sayfa oluşturmak zordur ve belki de çok sayıda sonuç içeren aramalar için hepsini senkronize etmek için zamanları yoktur. Böylece sayıları geçiştiriyorlar. Bunun, kendilerinden çok daha fazla sonuca sahip gibi görünmesi, muhtemelen sadece istenmeyen bir bonus.

İkinci veri noktası, konuyu oldukça merak eden ve Google'daki bazı arkadaşları rahatsız eden bir bilgisayar bilimi profesörüdür. Ona, bazen bir aramadan kaç sonucun gerçekten döndürüldüğünü anlamanın çok pahalı hale geldiğini söylediler, bu yüzden sadece en iyi tahminde bulunun ve çoğu insanın umurunda olduğu sonuçların ilk sayfasını döndürün. Yalnızca sayfalarda ayrıntılı inceleme yapmaya başladığınızda Google, kalan sayfaları tam olarak hesaplamaya zahmet eder.

Dolayısıyla, bunların hiçbiri kesin bir cevap değildir, ancak umarım Google'ın yanlışlıklarına neden olabilecek sorunları açıklamakta faydalı olacaktır.

DÜZENLE:

Sathya'nın bu sayfadaki cevabının Google'ın Web Yöneticisi KB'sinden bir cevabı var .

Bir arama yaptığınızda, sonuçlar genellikle şu bilgilerle görüntülenir: Yaklaşık XXXX sonuçları 1 - 10.

Google'ın toplam arama sonucu sayısını hesaplaması bir tahmindir. Bir basketbol sahası rakamının değerli olduğunu anlıyoruz ve kesin bir hesap yerine bir tahmin sağlayarak kaliteli arama sonuçlarını daha hızlı döndürebiliriz.

Ayrıca, arama sonuçlarının sonraki sayfasına tıkladığınızda, toplam arama sonucu sayısı değişebilir. Bu durumda, bazı sorgu sonuçlarının yinelenen olduğunu fark ederiz ve aradığınız belirli sonucu daha kolay bulabilmeniz için bu yinelenenleri daraltırız. Kopyaları daraltmak, tahmini sonuç sayısını ve toplam sonuç sayfası sayısını azaltır.


Ben XKCD ve sevgili eski öğretmenler seviyorum, ama bana söylüyorum muhtemelen stackoverflow.com bu sormak gerekir: P
cregox

Stackoverflow'daki kimsenin kesin bir cevabı olacağını sanmıyorum - gerçekten bilmeniz gerekiyorsa Google'a sormalısınız. Cevabı yalnızca Google'a birkaç ay önce soran birinden iletebilirim.
dsolimano

kesin bir cevap aramıyorum, sadece makul bir derin açıklama ile, tercihen iyi kaynaklı. Beni yanlış anlamayın senin mantıklı, ama yetkili ve mantıklı olsa bile "çünkü zor" demek benim için çok az. Hmm ... belki kuşkucu.
Se

Güzel düzenleme, şimdi bu iyi bir kaynak! Yine de "çünkü zor" diyor olsa da, daha fazla ayrıntı beklediğim anlamına geliyor. : P
cregox

7

Hayır - sayı sadece bir yaklaşık değerdir .

Bir arama yaptığınızda, sonuçlar genellikle şu bilgilerle görüntülenir: Yaklaşık XXXX sonuçları 1 - 10.

Google'ın toplam arama sonucu sayısını hesaplaması bir tahmindir. Bir basketbol sahası rakamının değerli olduğunu anlıyoruz ve kesin bir hesap yerine bir tahmin sağlayarak kaliteli arama sonuçlarını daha hızlı döndürebiliriz.

Ayrıca, arama sonuçlarının sonraki sayfasına tıkladığınızda, toplam arama sonucu sayısı değişebilir. Bu durumda, bazı sorgu sonuçlarının yinelenen olduğunu fark ederiz ve aradığınız belirli sonucu daha kolay bulabilmeniz için bu yinelenenleri daraltırız. Kopyaları daraltmak, tahmini sonuç sayısını ve toplam sonuç sayfası sayısını azaltır.


Sonuçların sayısını yalnızca 1000 ile az veya çok sınırlarsa, bunun iyi bir davranış olmadığını düşünüyorum. Kullanıcı daha fazlasını isterse daha fazla göstermelidir. Benim görüşüme göre, bazı yaygın anahtar kelimeler gerçekten çok sayıda arama sonucu döndürmelidir (çiçek, kitap ... gibi) ve bence internette tonlarca farklı resim var!

@ user11656 Google Görsel Arama'nın, kullanabileceğiniz standart bir uygulamadaki bir arama ile aynı şekilde çalıştığını varsayıyorsunuz. İşler tipik olarak bu ölçekte çok farklı çalışır . Avustralya'da bir sunucu olarak "çiçekle eşleşen tüm resimler" için henüz ABD'de sunucuya yayılmayan, yakın zamanda yüklenen bir resim olabilir. Ardından, kopyaları nasıl sunacağınız ve bunların hepsini milyonlarca kullanıcı için anında milyonlarca görüntüde nasıl yapacağınız gibi şeylerle uğraşmanız gerekir. Bu zor şeyler ve mimari ödünler vermek zorunda.
George Mauer


2

Yukarıdaki cevapların hiçbiri doğru değil.

Google'ın tahmini, gerçek sonuç sayısına, verilenden daha yakın olmalıdır.

Bu basit bir örnekle gösterilebilir. "Rusya" veya "michael" gibi sıkça kullanılan bir kelime seçin. Gerçekte, internette, sitelerinde bir yerde bu kelimeleri içeren yüz binlerce olmasa da binlerce web sitesi bulunmalıdır. Ancak Google sonuçları size örneğin 700 verebilir.

Gerçek şu ki, Google çok geniş tahminler vermektedir, ancak şimdi Google size vereceği sonuç sayısını büyük ölçüde sınırlamaktadır. Sonuçları ciddi olarak bireyler olarak büyük zararımıza kısaltır. Bu talihsiz bir durum çünkü bazı durumlarda binlerce siteyi terimlerimle okumak istiyorum.

Bunu biliyorum, çünkü Google'ı uzun zamandır, belki 10-15 yıldır kullandım ve genel bir kural olarak, aynı terime sahip site sayısının genellikle Google’ı kullandığım sürede arttı.

Geçmişte, yıllar önce bazı terimler için belki 1000 sonuç alabildim, şimdi 1000 terim için alacağım terimler için 500 sonuç alıyorum.


2
Lütfen "yukarıda" nın cevaplarda bağlam olmadığını unutmayın, çünkü bunlar birkaç farklı şekilde sıralanabilir. Varsayılan sıralamayı "oylar" olarak kabul etseniz bile, yukarı ve aşağı oylar eklendikçe konumları değişir.
ale

Çok ilginç! Rusya bana şu anda sadece 322 sonuç veriyor ve sadece son 34. sayfada gösteriyor . O zamana kadar 799 000 000 sonuç derdi! Bu güzel bir fikir olsa da, hala doğru görünmüyor. İlk tahminlerin de doğru olduğunu düşünmüyorum ve niyet, yalnızca "web'de var olduğunu düşündüğü kadar değil", dolayısıyla son sayfayı düzelten yalnızca gösterilen sonuçları getirmektir.
cregox

1

Google (Resim) Arama motoruyla ilgili sorunlar, sapmayı bırakarak alaka düzeyini hedeflemesidir. İlk olarak, nasıl çalıştığını anlamak önemlidir. İnternete yüklenen bir görüntünün iki şekilde dizine eklenmesi gerekir:

  • özgünlüğe dayalı (resim renk, boyut, desen, şekil tanıma, tür vb. temelli bir "akıllı bot" tarafından analiz edilir)
  • benzerliğe dayanarak (görüntü bir "akıllı bot2" tarafından analiz edilir ve bir veritabanında zaten var olan görüntülerle çapraz referanslandırılır ve ayrıca bir veya iki kategori etiketi ile etiketlenir: "görüntü eşleşir" ve "görüntü benzer ... ")

Endeksleme yapıldıktan sonra, konu dışı sonuçların son kullanıcıya gösterilmesini önlemek için resim tanıma sonucunda "anahtar kelimeleri" devralır. Mesele, her bir anahtar kelimenin alaka düzeyine bağlı olarak% olarak atanan değeri olan bağımsız bir kelime öbeğidir (bu nedenle, arama kutusunda daha fazla kelime gruplamanın daha az sonuç almasını ve ayrıca bir resim yükleyerek veya URL girerek arama yaptığınızda, Google yalnızca en iyi anahtar kelimeleri içeren bir "tahmin" atayacaktır. Bu, yalnızca arama yapmak için tasarlanmadığı için aramanın size hiçbir zaman tüm resimleri göstermeyeceği anlamına gelir)

Dolayısıyla, bir görsel araması yaptığınızda ve arama kutusunun hemen altında bir günün sonunda, "25.270.000.000 sonuç (0.55 saniye)" şeklinde büyük bir sayı göreceksiniz, çünkü artık her zaman sahte bir numara olacak, çünkü artık hariç tutmak için filtrelenen 200'den (maks. 500 ancak yalnızca kullanıcı istedikten sonra) sonuçlar:

  • harici kopyalar (aynı resim aynı site sayfasında 2+ kez ise)
  • alaka düzeyi kopyaları (yalnızca "en iyi sonuçları gösterir" - aşağıdaki resme bakın)
  • yasa ile ilgili sorunları olan resimler (aşağıdaki resme bakın)
  • DMCA'yı ihlal eden resimler (aşağıdaki resme bakın)
  • SPAM, MALWARE, PHISHING kaynaklarından gelen görseller
  • gizli resimler (bir kullanıcı Güvenli Aramayı devre dışı bırakmadıysa)
  • Google tarafından kara listeye alınan resimler ( makale )
  • farklı AR'ye sahip resimler (temel olarak, resim arama referansından farklı bir en boy oranına sahip tüm resimler. ör. seçtiğiniz resim tarafından arama yaparsanız, diyelim ki garip oran 9: 7 - tüm resimler dizine eklenirken Google, 3: 4 oranına sahiptir - bu, bu arama motorunun belki de en büyük dezavantajıdır, çünkü her zaman ilk kriter olarak En Boy Oranına uymaktadır)
  • ve bir sürü daha

Özetlemek gerekirse: bir resmin arama sonuçları hiçbir zaman tam anlamıyla alakalı değildir. Bazen istenen sonuç için bir arama ifadesi "kapı posteri" alırsınız, aksi takdirde "kapı kapağı", "kapı bluray", "kapı dvd", "kapı 2015" veya hatta "自衛隊 彼 の 地 に て 斯 く 戦ALL り "-" TÜM "görüntü sonuçlarına sahip olamazsınız, çünkü" TÜMÜ "olan herhangi bir şey yoktur, bu yüzden oraya ulaşmak için oynamaya ihtiyaç vardır. Ayrıca, farklı standartlar ve kriterler üzerinde çalıştıkları için işi daha farklı bir şekilde yapabilen başka görsel arama motorları olduğunu da belirtmek gerekir. "Google" değil ve sadece ... >> https://www.yandex.com/images/

dikkate değer uzantılar:


Yine, bunları kopya olarak işaretlemek her sorunun cevabını göndermekten çok daha yararlı olacaktır.
jonsca

0

En üstte 7000 sonuçtan 70'inde sayfa yazıyor (örnek). Sayfa numarasını ve kaç sonuç verecektir. 70 sonuç değil, 70 sayfa var. Bu yardımcı olur umarım.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.