Bu siteler neden içeriğimi klonlıyor ve onları nasıl durdurabilirim?


14

Google'da kendi web sitelerimden birini arıyordum: http://www.botlibre.com

ve sürprizime göre web sitemin bazı klonlarını buldum, örneğin:

http://83waystowasteyourtime.adidas.com

ve:

http:// mediaiq.astral.comm

Sorum şu:

  1. Neden web sitemin klonlarını oluşturuyorlar? Bir tür SEO şeması veya ne? Ne kazanabilirlerdi?
  2. Nasıl bir URL var adidas.comve astral.comm? Sanırım Adidas'ın içeriğimi canlandırması değil.
  3. Bu siteleri nasıl kapatabilirim ve insanların içeriğimi çalmasını nasıl önleyebilirim? (Tomcat'te)

copyscape.com Yinelenen içerik bulmak için iyi bir kaynak gibi görünüyor, sitemin bazı kopyalarını bu şekilde buldum.
Kzqai

Yanıtlar:


17

Tamam. Bu oldukça garip ama düşündüğünüz kadar trajik değil.

Getirinin ne olacağından emin değilim. Bu, birisinin bunu neden yapacağına dair hiçbir anlam ifade etmiyor. Bilgisayar korsanı için hiçbir avantaj göremiyorum. İyi haber ziyaretçi ulaşıyor olan sizin sitenizi. Ancak, bir SEO bakış açısından bir hit olacak, bu yüzden bu hızlı düzeltmek istiyorum.

Sanırım siteniz paylaşılan bir sunucuda değil, bu nedenle sitenize IP adresiyle erişirseniz yine de çalışır. Bunu test ettim ve öyle.

83waystowasteyourtime.adidas.com ve mediaiq.astral.com, hiç kimsenin şüpheli olmayan bir alan için bir alt alan oluşturmasına izin veren eski bir kesmek kullanan alt alan adlarıdır. Bu konuda buradan okuyabilirsiniz: http://www.techrepublic.com/blog/it-security/watch-out-for-dns-sub-domain-hijacking/ Google alt alan adı dns hack'iniz varsa daha fazla site var .

İyi haber şu. Bu klonlar veya sitenizin kopya değildir, vardır siteniz. Her alt etki alanı IP adresinizi özellikle işaret eder.

Şunları yapabilirsiniz:

> dig 83waystowasteyourtime.adidas.com any

ve

> dig mediaiq.astral.comm any

görmek için herhangi bir linux bilgisayarda.

Hangi yöntemin işe yarayacağından emin olmasam da, muhtemelen bununla mücadele edebilirsiniz:

Apache'nin yüklü olduğunu varsayarsak, .htaccess dosyanızı web kök dizininizde düzenleyebilir ve aşağıdaki kodu ekleyebilirsiniz.

Yeniden yazma motorunu açmak için dosyanın üstüne aşağıdakileri ekleyin.

RewriteEngine On

Ana bilgisayar tarafından engelleme:

RewriteCond %{HTTP_HOST} ^83waystowasteyourtime\.adidas\.com$ [NC]
RewriteRule .* - [F,L]

--veya--

Yönlendiren tarafından engelleme:

RewriteCond %{HTTP_REFERER} ^83waystowasteyourtime\.adidas\.com$ [NC]
RewriteRule .* - [F,L]

Bunları test etmek ve hangisinin işe yaradığını anlatmak isteyeceksiniz. Lütfen. Başka bir yöntem için balık tutmamız gerekebilir.

Elbette yeniden yazma kuralını değiştirebilir ve bunları doğrudan sitenize yönlendirebilirsiniz:

RewriteRule .* http://www.botlibre.com [R=301,L]

--veya--

Onları cehenneme (mizah) gönderin:

RewriteRule .* http://www.hell.com [R=301,L]

... gerçek bir site. Ama problemi onlara geçirdin.

Onları engellemenizi öneririm.

@Martijn'nin yorumunda belirtildiği ve korunmaya değer olduğu gibi, sizi korumak için sayfa başına kanonik bağlantılara sahip olabilirsiniz. Bu durumda, bağlantı, bağlantının bulunduğu sayfayı gösterir. Daha fazla iş, ama bugünlerde iyi bir fikir gibi görünüyor.

<link rel="canonical" href="http://www.example.com/booger-eating-tyrants" />

Ayrıca, ana alan sahiplerine ulaşabilir ve savaşta size katılmalarına izin verebilirsiniz:

Adidas.com

Admin Name: Albert Pedraz
Admin Organization: adidas AG
Admin Street: Adi-Dassler-Strasse 1
Admin City: Herzogenaurach
Admin State/Province:
Admin Postal Code: 91074
Admin Country: DE
Admin Phone: +49.9132844584
Admin Email: adidas@role.noris.net

Tech Name: noris.net Hostmaster
Tech Organization: noris network AG
Tech Street: Thomas-Mann-Str. 16-20
Tech City: Nuernberg
Tech State/Province:
Tech Postal Code: 90471
Tech Country: DE
Tech Phone: +49.91193520
Tech Fax: +49.9119352100
Tech Email: hostmaster@noris.net

Astral.com

Admin Name: Van Tu Duong
Admin Organization: Bell Media Inc.
Admin Street: 9 Channel Nine Court,
Admin City: Scarborough
Admin State/Province: Ontario
Admin Postal Code: M1S 4B5
Admin Country: CA
Admin Phone: +1.5148702477
Admin Phone Ext:
Admin Fax:
Admin Fax Ext:
Admin Email: trademarks@bell.ca

Tech Name: Van Tu Duong
Tech Organization: Bell Media Inc.
Tech Street: 9 Channel Nine Court,
Tech City: Scarborough
Tech State/Province: Ontario
Tech Postal Code: M1S 4B5
Tech Country: CA
Tech Phone: +1.5148702477
Tech Phone Ext:
Tech Fax:
Tech Fax Ext:
Tech Email: trademarks@bell.ca

3
Ve sitenize 301 başlık ekleyin ve sayfalarınıza bir arama etiketi orijinali örten bir kanonik etiket ekleyin. Bunu da kendi yararınıza alabilir :)
Martijn

@Martijn Yorum için teşekkürler! Cevabı kanonik bir bağlantı örneği ile güncelledim. Bu, gelecekte insanlara yardımcı olacaktır.
closetnoc

Harika bilgi için teşekkürler. "RewriteCond" dosyasını tam olarak hangi dosyaya koyacağım? Ayrıca 1. soruya verilen cevap, neden? bundan ne gibi yararlar elde ediyorlar?
James

1
@James Cevabı güncelledim. 1. soruya cevap verdim, fakat cevabım daha düşüktü ve muhtemelen kolayca cevapsızdı. Onu yukarıya taşıdım ve üzerine biraz genişlettim. Ayrıca Apache (bu Apache kodu) varsayarak hangi dosyayı ve nerede bulacağımı ekledim. Artık IIS'yi tanımıyorum. IIS ile bir şey yaptığımdan beri on yıldan fazla bir süredir varım. Hatırlayın, hangi kod kümesinin çalıştığından emin değilim, ancak% {HTTP_REFERER} sürümünün doğru olduğundan şüpheleniyorum. Lütfen test edin ve sonuçların ne olduğunu bize bildirin. Yine Apache'yi varsayalım.
Closetnoc

Maalesef, Tomcat kullanıyorum, bunu Tomcat'te nasıl yapacağınız hakkında bir fikriniz var mı?
James
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.