Tüm kullanıcı aracılarını http://www.user-agents.org/ adresinden indirdim ve +
stil bağlantılarını düz bağlantılara karşı kullananların sayısını saymak için bir komut dosyası çalıştırdım . RFC 2616 ile eşleşmeyen "standart dışı" kullanıcı aracısı dizelerini hariç tuttum.
Sonuçlar burada:
Total: 2471
Standard: 2064
Non-standard: 407
No link: 1391
With link: 673
Plus link: 145
Plain link: 528
Plus link only: 86
Plain link only: 174
Dolayısıyla, bir bağlantı içeren 673 kullanıcı aracısından sadece% 21'i artı içerir. Sadece bir bağlantı olan bir yorumu olan 260 kullanıcı aracısından sadece% 33'ü artı içerir.
Bu analize dayanarak, artı yaygındır, ancak kullanıcı aracılarının çoğu bunu kullanmamayı tercih eder. Dışarıda bırakmak iyidir, ancak dahil etmenin de iyi olacağı kadar yaygındır.
Kendiniz çalıştırmak istiyorsanız, bu analizi yapan Perl betiği.
#!/usr/bin/perl
use strict;
my $doc="";
while(my $line = <>){
$doc.=$line;
}
my @agents = $doc =~ /\<td class\=\"left\"\>[ \t\r\n]+(.*?)\ \;/gs;
my $total = 0;
my $standard = 0;
my $nonStandard = 0;
my $noHttp = 0;
my $http = 0;
my $plusHttp = 0;
my $noPlusHttp = 0;
my $linkOnly = 0;
my $plusLinkOnly = 0;
for my $agent (@agents){
$total++;
if ($agent =~ /^(?:[a-zA-Z0-9\.\-\_]+(?:\/[a-zA-Z0-9\.\-\_]+)?(?: \([^\)]+\))?[ ]*)+$/){
print "Standard: $agent\n";
$standard++;
if ($agent =~ /http/i){
print "With link: $agent\n";
$http++;
if ($agent =~ /\+http/i){
print "Plus link: $agent\n";
$plusHttp++;
} else {
print "Plain link: $agent\n";
$noPlusHttp++;
}
if ($agent =~ /\(http[^ ]+\)/i){
print "Plain link only: $agent\n";
$linkOnly++;
} elsif ($agent =~ /\(\+http[^ ]+\)/i){
print "Plus link only: $agent\n";
$plusLinkOnly++;
}
} else {
print "No link: $agent\n";
$noHttp++;
}
} else {
print "Non-standard: $agent\n";
$nonStandard++;
}
}
print "
Total: $total
Standard: $standard
Non-standard: $nonStandard
No link: $noHttp
With link: $http
Plus link: $plusHttp
Plain link: $noPlusHttp
Plus link only: $plusLinkOnly
Plain link only: $linkOnly
";