Tamam. Bu, süreç boyunca çalışacağım ve böylece daha net olacağı vakalardan biri olacak. Biraz uzun olacak, ama umarım acı verici bir şekilde uzun olmayacak.
En baştan başlayalım mı?
Google'ın 1997 yılında Brin ve Page tarafından hazırlanan araştırma makalesine dayanarak nasıl çalıştığına dair bildiklerimizle başlayarak, bugün hâlâ devam etmekte olan bazı şeyleri biliyoruz.
Google'ın dizinde bir URL'si var ve kuyruğu getir ve sayfayı getir. Sayfanın kodu, çeşitli işleme biçimleri için veritabanında saklanır. Süreçlerden biri yeni bağlantılar bulmak olacaktır. Google tarafından bulunan herhangi bir bağlantı, varsa ilk olarak bağlantı dizininde bulunur. Olmaz, bağlantı bağlantı tablosuna eklenir ve getirme sırasına eklenir.
Bağlantı tablosundaki herhangi bir bağlantı en azından bu öğelere, bağlantı URL'sine, kaynak URL'ye ve bağlantı metnine sahiptir. Diğer veri unsurlarının olması muhtemeldir, ancak bunlar tartışmayı ilerletmez. Bağlantı tablosuna eklenen herhangi bir bağ, kaynak URL'yi doğruladı, ancak mutlaka hedef URL'ye sahip değil. İlişkisel veritabanlarını örnek olarak kullanarak, kaynak ve hedef URL'ler, URL tablosunda bir URL kimliği olabilir ve bir birleştirme tablosu, bağlantı tablosunun kaynak URL'sine ve hedef URL öğelerine, URL tablosuna geri bir kimlik kullanarak katılır. Şaşkın? Olma.
Hedef sayfanın getirilmediği herhangi bir durumda, bağlantı tablosundaki bağlantının sarkan bir bağlantı olduğu söylenir. Sayfa getirildikten sonra, bağlantı tablosundaki bağlantı tamamlanır. Hedef sayfa yoksa, bağlantı tablosundaki bağlantı bozuk bir bağlantıdır. Basit?
Yalnızca tam bağlantılar değer iletebilir. PageRank algoritması, değeri hesaplamak için tam bir bağlantı gerektirir. Tüm sarkan ve kopuk bağlantılar, bağlantıyı kullanarak tüm hesaplamaları durdurur. Daha önce, PR, herhangi bir bağlantıya ayarlanabilen değer o kadar küçük bir sayısal değerin içine düşene kadar etkili bir fark yaratmayacak şekilde bağlantı tablosunu kullanarak bağlantı değerlerini tekrar tekrar hesaplayan bir özyinelemeli işlemdi. Eminim bu hala bir ev tutma süreci olarak gerçekleşir. Bununla birlikte, bugünkü PR, bir ağdaki bir sayfadan diğerine mesafeyi göreceli olarak ölçen atlamalara benzer başka bir yöntem kullanılarak hesaplanmaktadır. Orijinal PageRank modelinin taklit edilmesi için tasarlanan güven ağı modeline dayanır. Bağlantı, bir varlıktan diğerine olan güven oyudur. Bundan daha karmaşık olsa da, resmi alırsın. Muhtemelen daha az kesin ancak güvenilir olacak kadar kesin olmakla birlikte, daha gerçek zamanlı bir hesaplama kullanarak özyinelemeli süreçle aynı şeyi yapar. Güven belirlenmediyse güven değerleri (güven ağ modelini kullanarak) geçirilemediğinden bu tam bağlantılar gerektirir. Bir bağlantının güven ağı modelindeki bir güven oyu veya bağlantısı olduğunu unutmayın. PageRank, bir güven ağında güven değeri olarak temsil edilir.
Artık bağlantıları ve ne kadar önemli olduklarını anladığınıza göre, devam edelim.
Bir arama motoru için, herhangi bir URL'yi kaldırmak mantıklı değildir. URL tablosunda bir URL yoksa, URL hakkında hiçbir şey bilemezsiniz ve zarar görür. Örneğin, URL artık mevcut değilse, URL'ler genellikle silinmez. Ancak, bir sayfa NOINDEX olarak ayarlandığında, arama motoruna açıkça sayfayı dizine ETMEMESİ talimatı verilir. Dizin içindeki bir web sayfası bir URL ve HTML kaynak kodu olmak üzere iki şey içerdiğinden, NOINDEX sayfayı bu noktada etkin bir şekilde kaldırır. Bir NOINDEX sayfasına bağlantılar en azından sarkıyor.
Şimdi dizine eklenmiş bir sayfanın nasıl göründüğünü bildiğinize göre, daha ileri gidelim.
Bir arama motorunun bir web sayfasını veya siteyi cezalandırmasının birçok yolu vardır. Biri listeliyor. Bu, tüm cezaların en ağır olanıdır ve iyileşmesi uzun zaman alır. Sayfa bulunmayacağından ve bulunamadığından bu kategoride ispat edebileceğiniz ceza kategorisi Ayrıca, Googles Search Console, yuvarlak bir şekilde, sayfaların listelendiğini size bildirir. Kalan cezalardan, cezalar SERP filtrelerinde uygulanır.
Bir arama sorgusu gerçekleştirildiğinde, aslında bir kerede dizine karşı birkaç sorgu vardır ve bunlar daha sonra algoritmanın bir bölümüne dayalı olarak bir sonuç kümesine karıştırılır. Genellikle tek bir varlık olarak adlandırdığımız kalan algoritma, nispeten basit bir SERP algoritmaları serisidir. Birincil algoritmaları, trendler gibi daha gerçek zamanlı metriklere göre sonuç kümesini yeniden sıralar. Algoritmalar arasında, girişleri sonuç kümesinden kaldıran veya bir girişin sonuç kümesi içindeki yerleşimini ciddi şekilde düşürenlere filtre denir. Uygulanan, DMCA'yı kanıtladığı gibi işleyen filtredir....we have removed 1 result(s) from this page...
Artık cezaların nasıl uygulandığını bildiğinize göre bağlantılar, PR ve DMCA filtreleri bağlı mı?
Bununla, bir filtrenin uygulandığını biliyoruz, ancak bunun PageRank'in nasıl hesaplandığı bağlantı endeksi ile ilgisi yoktur. Olabildiğince link / PR sürecinden kaldırılır. Linkler ve halkla ilişkiler endeksleme işleminin başlangıcındayken DMCA cezalandırılan sayfanın kaldırılması sorgulama işleminin sonundadır. Aslında, bunlar tamamen ayrı iki motor. Bu nedenle, bir sayfa DMCA şikayeti nedeniyle kaldırılabilse de, aslında dizinden kaldırılmaz ve bu nedenle sayfaya ve sayfanın bağlantıları hala hesaplanır.
Çamur kadar temiz? Umarım bunu iyi açıklamışımdır. Sizin için bir şey netleştirebilir miyim lütfen bana bildirin.
[Güncelleme]
OP senaryosu için geçerli olmayan bir istisna.
@StephenOstermiller yukarıdakilere zarar vermeyen iyi bir nokta getiriyor, ancak tamlık için eklemek istiyorum.
Bildiğiniz gibi, bir siteyi veya sayfayı arama içinde puanlamak birçok faktör gerektirir. Bu hayal edebileceğiniz kadar teknik veya mistik olmasa da, tartmak için hala çok veya faktörler var. Güven skorlarının etkisini daha çok OP için geçerli olmadığı için unuttum. Bu yüzden buraya ekliyorum.
Açıkçası spam siteleri gibi iyi olmayan siteler var. Sitelerin bu sınıflandırmasında, telif hakkı içeriğinin alışılmış istismarları olan siteler bulunur. Bu, yıllar önce içerik kazıyıcılarının zor işlerinizden site oluşturacağı büyük bir sorundu. Uzun zamandır hiçbir şey yapılmadı. Orijinal içeriğe sahip siteler, sıyırıcı sitelere oldukça tutarlı bir şekilde kaybeder. Bilmeliyim. Ben kesinlikle hiçbir başvuru ile kazıyıcı siteleri nedeniyle neredeyse tüm trafik kaybetti iki PR 8 siteleri vardı.
Ancak işler değişti. Ve önemli değişikliklerin başlamasından bu yana sadece dört yıl geçti.
Sitelerin bu özel sınıflandırması için sitelerin güven puanı önemli ölçüde azaltılabilir. Bu iyi bilinir. Güven puanlarını yeniden oluşturmak yıllar alır ve bazı siteler için bu asla gerçekleşmeyebilir. Örneğin, alan adı para kazanma uzmanlarının neden yüzlerce binlerce aynı istismar için kanatlarında bekleyen bir siteyi iyice çöpe atmaya istekli olduğunu düşünüyorsunuz? Çünkü gerçek, bir alanın itfa edilmenin ötesindeki değerini mahvedebilmesidir.
Güven oluşturmaya giden birçok faktör vardır. Burada buna girmeyeceğim. Ancak, güvenin herhangi bir site için rütbe oluşturmanın önemli bir bileşeni olduğunu bilin.
Bununla birlikte, oldukça kapsamlı bir sicile sahip DMCA'nın ciddi bir ihlali olan herhangi bir site için güven puanında ciddi bir darbe göreceğini söyledi. Bu OP'nin açıkladığı senaryo değil. Ancak, burada varsaydığım senaryo.
Bağlantılar ve PageRank'in oluşturulması birden fazla bileşene sahiptir. Bunlardan biri sayfanın kendisinin PageRank (yetkisidir). Oldukça güvenilir sayfalar için bir yetki sınırı vardır. Bir PR 8 sayfası, o sayfadaki bağlantılar arasında 8 değerini paylaşmaz. Bu, PR'ye daha doğal bir eğri koymayı amaçlayan orijinal PageRank algoritmasının bir parçasıdır. Aksi takdirde, yeni bir sayfanın uzun bir süre sonra bile yüksek otoriteye sahip bir sayfaya karşı rekabet etmesi neredeyse imkansızdır. Bağlantının kendisinin değeri, bağlantı metninin semantik değeri, bağlantı URL'si, bağlantının konumu (önem), varsa bağlantıyı içeren içerik bloğunun semantik değeri vb. Gibi çeşitli faktörler kullanılarak puanlanır. 0 ile .9 arasında puanlandırılır. Yetki ve bağlantı puanının hesaplanması, herhangi bir bağın geçirdiği değerdir.
İyi ve güzel. Peki bu, DMCA'nın önemli bir ihlali olan bir siteyi nasıl etkiler?
Herhangi bir gelen bağlantının değeri, bağlantı değeri kaynak siteden geldiğinden hedef sitenin güven skorundan etkilenmez. Ancak, herhangi bir giden bağlantı olabilir. Önemli bir DMCA kötüye kullanımı olan herhangi bir sitenin yetkisi, güven puanından etkilenir. Sonuçta, otorite güvenden gelir. Bu şekilde, gelen bağlantının değeri, güven puanına bağlı olarak bozulmadan giden bağlantılardan geçirilmez.
Bu cevabı biraz değiştirir.
OP senaryosu için geçerli olmasa da, gelen bağlantı değerinin DMCA ihlali olan siteden tamamen geçmediği bir senaryo vardır. Bununla birlikte, bu zor bir durumdur ve bu nedenle bu gerçekleşmeden önceki eşik önemlidir.