2013-01-02 18 views
5

'Ne denediniz' ve 'bunu kendiniz test et' demeden önce, sitemin arama motorlarındaki herhangi bir site için robots.txt güncellemelerinin gerçekten yavaş olduğunu unutmayın, böylece teorik deneyim sağlayabiliyorsanız, Takdir edilecektir.Belirli URL parametrelerini engellemek için robots.txt kullanabilir miyim?

Örneğin, mümkün izin vermektir:

http://www.example.com 

Ve blok:

http://www.example.com/?foo=foo 

Çok emin değilim.

Yardım?

+1

bir robot emülatör kullanmaya çalışıyorum, ama kullanarak olabilir ** bunu takip edecek hiçbir robot anlamına gelmez robots.txt ** inkar! –

cevap

6

Wikipedia göre, "robots.txt desenler basit alt dize karşılaştırmaları tarafından eşleştirilen" ve GET dize URL olduğu gibi sadece eklemek mümkün olmalıdır:

Disallow: /?foo=foo 

falan fazla fantezi

gibi Tüm dizeleri devre dışı bırakmak için

. Yıldız işareti bir joker karakterdir, bu yüzden bir ya da daha fazla karakterle eşleşir.

Example of a robots.txt with dynamic urls.

+0

Sadece, sadece temel dizini değil, '? Foo = foo' ile tüm URL'leri engellemek mümkün mü acaba? – think123

+0

Eğik çizgiyi kaldırırsanız, sadece URL'deki herhangi bir yerde diziyle eşleşecektir. –

+1

'*' joker karakterinin orijinal robots.txt belirtiminin bir parçası olmadığını unutmayın. – unor

İlgili konular