Başka bir web sitesi arama sonuçlarında yansıtıyor ve sitemin üstünde yer alıyor


55

Sitemi tamamen yansıtan ve şu anda Google’da görünen 1. bağlantıda, içeriğimi kullanan bağlantılar olarak bilinen, küfür olarak bilinen, kötü niyetli bir site var. Günlük dosyalarımı kontrol ettim ve bu sitenin bir süredir benimkileri taradığını ve ayrıca sitelerinden benimkine 10.000 bağlantı olduğunu fark ettim.

Bu siteden yönlendirilen ve daha önce Google’a web spam olarak bildiren kullanıcı erişimini engelledim. Ayrıca etki alanını da reddettim.

Böylesine çılgınca taktikler için Google’da en iyi bağlantıları nasıl alıyorlar (benimki bile üstleniyorlar)? Böyle bir sorunu tamamen ortadan kaldırmak için atılacak adımlar nelerdir?

GÜNCELLEME 28.08.2014:

Şimdi daha fazla bilgiye sahip olduğum için bu konuda bir güncelleme yapacağımı düşündüm. Bu nedenle, onların alt etki alanları, kendi alt etki alanlarını web siteme benzeyen hale getirme etkisi olan iplerime işaret etti.

Birkaç gün boyunca bu önemli değildi çünkü htaccess'i kullanarak, etki alanım yerine tüm HOSTS’i, alt alan adlarını Google’da trafik bağlantılarına aldığım anlamına gelen etki alanıma geri yönlendirdim. Birkaç gün sonra, internet artık alt etki alanlarını değiştirdi, böylece artık bundan yararlanamayacağım.

Yani tüm mesele, Google’da en üst sıralarda yer almak için içeriğimi kullandılar ve şimdi bu bağlantıları kendilerine daha fazla trafik çekmek için web sitelerine yönlendiriyorlar.

Bu kirli bir web sitesi tarafından kirli bir taktiktir. Umarım Google’ın böyle bir davranışı cezalandırmasıdır.


3
Sebebini sorguladığınız kısmı burada konu dışı olarak düzenledim. Ama aksi halde iyi bir soru.
John Conde

1
Web sitesi klonlama yeni bir numara gibi görünüyor, şu anda bir çok web sitesi kötüye kullanılıyor. Heise'da (almanca) bu konuyla ilgili haberler var . Alışılmış çözüm (sahte alanı bildirmenin yanı sıra), tarayıcıların IP adreslerine özel içerik beslemek gibi görünüyor, bu nedenle örneğin gerçek sitenize bir bağlantı gösterecekler.
martinstoeckli

1
Gelecek için bir başka endişe - Google’ın webspam’a karşı çok sert bir duruş sergilediği - rakiplerimin, itibarımı incitecek kötü şöhretli sitelerdeki içeriğimi bilerek yayınlayacağı yönünde. Ya da bilgim olmadan siteme işaret eden spam görünümlü bloglar yayınlayacağım.
Marlboro Goodluck

3
@ Robrod Roberson: gerçekten değil, herkes bir dava hakkında ne bilir, ama kaç tane tehnik çözüm ?!
machineaddict

1
@JarrodRoberson Ancak bu sadece web yöneticilerinin karşılaştığı bir problemdir ve bu nedenle bu site için çok önemlidir; Ayrıca, kişilerin yasal olanlarla birlikte çeşitli teknik çözümler sundukları da anlaşılmaktadır.
saat

Yanıtlar:


45

Sitenizi bir proxy komut dosyası yoluyla besleyerek veya HTML verbumunuzu sıkılaştırıp yalnızca sitenize yansıtıyorlarsa, sayfalarınıza kanonik URL'ler ekleyebilirsiniz . Bu, Google’ın içeriğinizin orijinal kaynak olduğunu bilmesini ve URL’nizi arama sonuçlarında göstermesini sağlar.

Google’a bir DMCA isteği gönderin. Onlarla biraz yavaşlar, ancak sonuçta bu sayfaları dizinlerinden kaldıracaklar.

Bağlantıların kaldırılması akıllı bir harekettir.

Kullanıcıları engellemek olsa da yardımcı olup olmadığını bilmiyorum. Belki sayfalarınızın en üstüne, asıl site olduğunuzu ve diğerlerinin sahtecilik yapmasının daha iyi bir çözüm olabileceğini bildirmelerini sağlayan bir mesaj koymak.


2
Kanonik URL'ler her zaman yardımcı olmuyor. Sitemi yansıtan komut dosyası, sahte URL'yi sahte siteye işaret edecek şekilde değiştirdi; bu yüzden anlamsızdı.
CaptainCodeman

28

Bir DMCA şikayetinde bulunabilirsiniz ve ABD’de iseniz, bir telif hakkı hukuk davası açabilirsiniz.

İşte DMCA şikayetinin herkese nasıl yardımcı olabileceğini açıklayan kısa bir cevabın bağlantısı:

Bir DMCA şikayeti için Amerika Birleşik Devletleri'nde olmak zorunda mısınız?

... ve bir tane daha açıklayan ...

Bir DMCA şikayetinde bulunmadan önce içeriğinizin ne kadarının kopyalanması gerekiyor?

ABD’deyseniz, telif hakkıyla ilgili sorunları bilen bir avukat tutabilir ve kendilerine bir durma ve ısrar mektubu göndermelerini sağlayabilirsiniz. İçeriği kaldırmak için onlara 10 gün verin (gerçek günler ve iş günleri iyi de olsa iş günleri değil). Kanıtlarınız ve sitenizin anlık görüntüleri için hakaret eden sitenin anlık fotoğraflarını yakalamak istersiniz. Bir sayfanın kaldırılıp kaldırılmadığını kontrol ediyorsanız, arama sonuçlarını değil siteyi doğrudan kontrol edin.

Sayfa bu süre zarfında kaldırılmadıysa, savunmak için en az 10.000 ABD Doları alacağınız bir federal dava açabilirsiniz. Şoför koltuğunda olacaksın. Bir anlaşmanın en az 10.000 $ ve muhtemelen daha fazlasına sahip olması muhtemeldir. Masraflarınızı da geri alabilirsiniz. Önemli olan, sorunu gidermek için ücretsiz bir seçenek sunmaktır; dolayısıyla, mektubu sona erdirir. Ondan sonra, davalıya sorumluluğu olmayan bir dava açabilirsiniz.

Diğer bir not, mahkemeye çıkarsanız tazminat göstermeniz gerekeceğidir. Arama trafiğinin kaybı zarar görüyor. Burada trafik kaybını gösteren metrikleri toplamak için avukatınızla birlikte çalışacaksınız ve bu trafiğin değerinden para kazanmanız gerekecektir. Elbette, burada% 100 dönüşüm oranıyla bile daha yüksek rakamlar elde edebilirsiniz. Bu durumda, bugün ve geleceğe yönelik Google Analytics’i ve günlük dosyası analiz yazılımınızı kullanarak trafik kaybına ilişkin ölçümleri topluyor olurdum.

Lütfen bir dava açmanın özellikle şu anda ve gelecekte yaşadığınız zararlarla karşılaştırıldığında zor veya çok pahalı olmadığını unutmayın. Telif hakkı ihlali son zamanlarda azalmaktadır, ancak telif hakkını ihlal eden çok az kişi bu günlerde daha cesur. Bu insanları durdurmamız gerekiyor ve tek gerçek yol, telif hakkı ihlalini kârlı olmayan iş stratejisine maliyet faktörü koymak.


2
Kaçırdığınız tüm sorun, sitenin arkasında kimin olduğunu bulmak neredeyse imkansız. Yani, siteyi gerçek bir bireye geri izlemeyi kolaylaştırmak için aptal olmak zorunda kalacaklardı.
David Mulder,

1
@DavidMulder Sidepepping yok. Bir avukat, ihtiyaç duydukları bilgiler için şirketleri mahkeme edebilir. Nazik bir mektup bile yeterli. Eğer bilgi verilmezse, avukat ortaya çıkmazsa ya da talep edilen bilgiyi vermezse, hapis cezasına çarptırılan bir yargıç önünde mahkemede ifadeye başvurabilir. ABD'de hukuktan ya da başka bir şeyden saklanmak yok. Bu hala bazı istisnalarla uluslararası çalışır.
Closetnoc

@closetnoc: Şirket bilgileri serbestçe vermek istemeyebilir, hatta bunu yapma konusunda özgür olabilir. Bir mahkemenin mahkeme celbi çıkarması ya da izlemenin yetki alanı içinde kalacağı kesin değildir. Kendinizi, suçlunun gerçek adını bile bilmeyecek üçüncü bir şahısla çok pahalı ve uzun bir yasal savaşta bulabilirsiniz. Tam cevabınıza bakarsak, şüphesiz bu engellerin farkında olursunuz, ancak David Mulder ile taraf olmak zorundayım: Siteyi bir bireye geri izlemenin ne kadar zor olduğunu anladığınızı düşünüyorum.
Marcks Thomas

@closetnoc: Evet, ancak barındırma sağlayıcısının doğru bilgisi yok. Muhtemelen ön ödemeli bir kredi kartı veya başka bir ön ödemeli kart, çalınan bir kredi kartı, bir bitcoin veya başka bir takip edilemeyen işlem mekanizması ile yapıldı. Ah, ve barındırma sağlayıcısı ilk etapta ABD'de bile olmayabilir. Buna internet denir, beğen veya beğenme.
David Mulder

@DavidMulder Ne söylediğinizi takdir ediyorum. Özellikle kötü adamları bulma konusunda araştırma alanında güvenlik işindeyim. Bahsettiğiniz şeylerin çoğu Çince, Rusça veya Lehçe olacaktır. Yine de, bu insanların kalıplardan nasıl geçtiğini belirlemenin yolları var. Kendilerini veriyorlar. Bu özellikle yaptığım şey. Denemelisin. Sadece devrilemezsin. İyi bir internet avukatı benim gibi insanları ve nasıl bilgi alacağını bilir. İhtiyacım olan tek şey bir diş ve genelde onu alıyorum. Ancak bu gerçek bir çaba olabilir. Ama bu en kötü senaryo olayı.
closetnoc

27

IP'lerini (veya IP'lerini) izleyebilir ve istediğiniz gibi yansıtmaları için tamamen farklı içerikler sunabilirsiniz. Bu şekilde reklamcılık için boş alan elde edersiniz ve Google’daki yüksek konumlarını kendi yararınıza kullanabilirsiniz.

Bunu bir zamanlar aynalı web sitesindeki kullanıcılara bunun yanlış etki alanı olduğunu açıklamak için kullandım. Ayrıca basit bir HTTP yönlendirme başlığı da gönderebilirsiniz.


8
Aslında bir nedenden dolayı bunu oldukça komik buluyorum. +1
Mehrdad

1
Muhtemelen HTTP başlıklarını klonlamayacaklardır, ancak onlara javascript animasyonları ve 'Bu bir ripoff' diyen komik Marquee tarzı pankartlar ve iyi eski animasyonlu gifler gönderebilirsiniz: P
Florian Fida

meta etiketleri ve javascript yönlendirmelerini de kullanabilir, üçünden biri neredeyse kesinlikle işe yarayacak. Her durumda, bu kararlı bir çözüm değildir ve yalnızca onu bulup karşı çalışmaya başlayana kadar çalışacaktır. @Mehrdad, sanırım komik çünkü hacky :)
Igor R,

aynı zamanda benim için komikti, çünkü saldırgan, herhangi bir zamanda durdurabilse bile, kurbanın (saldırganlar) oyun alanına izin vererek kendi üzerinde bir güvenlik açığı açıyor. bu saldırganın oldukça aptal görünmesini sağlar.
Igor R,

Google’daki yüksek konumları, orijinal web sitesinin yüksek konumunun yerini alıyor, bu yüzden gerçekten "ücretsiz reklam" değil.
CaptainCodeman

12

: Size ancak (gelecekte) web sitenize korumak için en iyi fikir için biraz geç bu olacağını https://www.youtube.com/watch?v=I3pNLB3Cq24 dönüş kodu kullanıcıları böylece taklit (DEFCON 21 numaralarıyla savunma) içeriği görecek, ancak botlar görecek

  • içeriği atmak
  • çevrelerde gezinme
  • çalışmayı kes

diğer olası fikirler - kullanıcılarınızın bunlardan hiçbirini görmediğinden emin olun:

  • GB bilgilerinizi kaydetmelerine izin verin (sunucunuzda yalnızca birkaç kb varken)
  • botların sahte hafıza ile kendi hafızalarını doldurmalarını sağlamak
  • Sahte içerik gönder (100% boolsh * t - "Obama hamile", "Örümcek Adam 5 - gelecek yaz" gibi bir şeyler yazmalısın, ... böylece hırsızların ev sahipliği yapabilir ...)
  • Sahte dosyalar gönderin (42.zip gibi, kopyalanan içeriği kontrol etmezlerse, kullanıcılarının eğleneceği -> AV araçları bir şeylerin yanlış olduğunu gösterir -> kullanıcılar p * ss * d ... olur)
  • daha fazla veri beklemelerini sağlayın (dosya boyutu = 1-10 MB ve 1 Bayt / sn veya daha az olan rasgele cr * p gönder)

diğer fikirler:

  • Javascript ile korunan bağlantılar (eski, artık kullanmıyorum? ama değişmeden kalırlarsa kullanıcılar size gönderilecektir (bir süre))
  • dinamik çöp (botların kullanıcıların göremediği şeyleri indirmelerini sağlamak için yorum veya görünmez öğeler kullanın - bunun için iyi botlar düşmez)
  • çok fazla / çok hızlı / yanlış yoldan indirilen ip adreslerini engelleyin (botlar insanlar gibi davranmaz 1) her sayfadaki her bağlantı 2) bir sonraki bağlantıyı seçecek şekilde bir desen veya toplam kaos vardır)
  • Dosyalar sunucunuz tarafından barındırılmıyorsa, sunucunuza yönlendirmek için Javascript kullanın (hırsızlığa karşı yardım yok, ancak hırsızlar onu kaldırmak zorunda kalır veya kullanıcıları sayfalarında kalmaz - farklı rutinler halinde kodlayabilirsiniz (içerik şifresini çözme gibi) ))

Örümcekleri bloke eden bazılarını ayarlamam gereken kendi kodum var. Fikirlerine bakacağım çünkü bu benim olduğum türden bir adam! ;-) Harika ipuçları!
Closetnoc

4
Örümcekleri ve botları engellemenin sorunu, muhtemelen hepsinin engellenmesini istememenizdir. Örneğin, insanların web sitenizi bulmalarını istiyorsanız, Google’lar oldukça önemlidir. (Ve Google’ın sitenizi önbelleğinde bulundurmasından dolayı, bir web tarayıcısının siteyi çoğaltmak için taraması gerekmez.)
saat

Onlara kasıtlı olarak alternatif bir şeyler verecekseniz - Igor’un , size geri dönmekten ziyade, size yarar sağlama (yöneltme / yanlış olduğunu söyleme / reklamlar) demesini tercih ediyorum .
OJFord

2

Buna Google Proxy Hack adı verilir ve benim de başıma geldi.

İlk önce ilk şeyler:

  • Web Host'a bir DMCA şikayeti gönderin. Doğru şekilde oluşturulmuş bir şikayet oluşturmak için bu bağlantıyı kullanın ve bunu sunucunun destek veya suistimal e-postasına gönderin. Ev sahibi ABD’de ise, siteyi yıkmak zorundadırlar. ABD’de bulunmasalar bile, yine de siteyi kaldırmayı seçebilirler. (Bir kere basima geldi.)
  • Yansıtılmış URL’lerin arama sonuçlarından kaldırılmasını istemek için Google DMCA aracını kullanın .
  • Kullanım Google'ın Raspa Raporu Google'ın algoritması yetmezliği raporu.

Temelde olsa, bu Google tarafında bir başarısızlık. Sıralamanın "kaliteli orijinal içeriğe" dayalı olduğunu söyledikleri her şey için, bu açıkça açıkça utanç verici olan saçma basit bir karşı örnek.

Umarım, yeterince insan şikayet ederse, sonunda Google bir araya gelerek, bir sitenin daha önce kurulmuş bir sitenin aynası olup olmadığını kontrol etmek için gereken 10 satır kodunu yazacaktır.

Ayrıca, kanonik URL’leri kullanmanın her zaman bu örnekte çalışmadığını unutmayın. Bu proxy komut dosyalarının çoğu yansıtma sitesine işaret etmek için kanonik URL'leri değiştirir, böylece onları işe yaramaz hale getirir.

Son olarak, sıralamanıza zarar vermek için ana sitenizi çöp bağlantılarıyla spam olarak göndermiş olabileceklerini unutmayın. (Bu bana da oldu.)

Biraz araştırma ve yaratıcı düşünme yaparsanız, geri dönmenin bazı yolları vardır. Burada tam bir liste yayınlamanın iyi bir fikir olduğunu sanmıyorum, çünkü bu sadece bilgisayar korsanlarının hayatını kolaylaştırıyor.


1

Diğerlerinin de belirttiği gibi, bir DMCA şikayetinde bulunmak ve telif hakkı yasası davası açmak en iyi seçenek olabilir.

Yayınladığınız yeni içerik için, sitenizin güncellemelerini sosyal medyada (Twitter, Facebook vb.) Yayınladığınız anda bildirmeyi düşünebilirsiniz. Orada kaydedilen zaman damgası, ispatlamanız durumunda önce ilk yazdığınızın adil bir göstergesi olabilir. Google Web Yöneticisi Araçları aracılığıyla , Googlebot’un sitenizi sıkça taramasını sağlamak için bir ayar uygulayabilirsiniz . Popüler arama motorlarının web sayfalarınızı düzenli olarak endekslediğini varsayalım (site operatörünü, site: example.com'u bulmak için kullanın), önbelleğe alınmış kopyadaki tarih, içeriğin ne zaman yayınlandığının kaba bir göstergesi olarak kullanılabilir.

Ayrıca yayınladığınız yeni içerik için, filigranları resimlerin içine gömebilir ve bu dosyaların orijinal sahibi olduğunuzu belirten yorumlara JS dosyalarının içine yerleştirebilirsiniz.


İçeriği kopyalayan bir bot varsa, sayfaya basitçe yazarlık bilgisi ekleyebilir, böylece kopyalanan içerik "Bu, Foo tarafından yaratıldı, tüm hakları saklıdır" gibi bir şey içerecektir; Bu akrostik, ama bir bot olarak, düz metin olarak çalışacak ve davanızı güçlendirecek).
Ángel,
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.