2013-04-05 12 views
51

indeksleme Google'ı nasıl engellenir. Bu yüzden aynı metin hem sitem hem de Github'da görünecek. Örneğin. this search En büyük hit benim sitem. İkinci vuruş Github deposudur.Ben Github benim web sitelerinden birinde metnini saklamak için kullanabilirsiniz, ancak sorun hakkında yanı Github metni indeksleme benim Github depo

İnsanların kaynakları görüp görmediğini umursamıyorum, ancak Google'ın bunu dizinlemesini istemiyorum (ve yinelenen içerik için ceza verebiliriz.) Google'ın dizinlemeyi durdurmasını söylemek için depoyu özel olarak almanın yanı sıra herhangi bir yol var mı? o?

Ne Github Pages durumunda olur? Bunlar kaynağın bir Github deposunda bulunduğu siteler. Aynı kopyalama sorunu var mı?

the Marpa site için this search en üst isabet yol alın ama arama sonucunda listelenen source görmüyorum. Nasıl?

+7

özel, ben efendi dalında lekeler izin verilir bkz ama tüm diğer dalları devre dışı gidebilir . Bu muhtemelen Marpa içeriğinin endekslenmemesi için bir açıklamadır. Bu yüzden farklı bir şube kullanırsam ve ana dalı depodan çıkarırsam, dizinleme duracaktır. – szabgab

+0

[robots.txt yönergelerinin özeti] [1] [1] (http://antezeta.com/news/avoid-search-engine-indexing) –

cevap

65

GitHub'dan ait https://github.com/robots.txt dosyası 'efendi' dalında lekeler endekslenmesini sağlar, ancak tüm diğer dalları kısıtlar. Yani bir 'ana' dal yoksa, Google sayfalarınızı dizine eklememelidir.

'master' dalı nasıl kaldırılır:

sizin klon olarak

yeni bir şube oluşturmak - varsayılan dalı değiştirmek en GitHub'dan On GitHub'dan

git checkout -b main 
git push -u origin main 

bunu 'Ana' diyoruz ve itmesine izin ( ya da burada https://github.com/blog/421-pick-your-default-branch

Sonra GitHub'dan klon ve master dalını ortadan kaldırın) depo Ayarlar bölümünde bakın:

git branch -d master 
git push origin :master 

Daha önce deponuzu aynı şeyi yapmaya zorlamış olabilecek başka kişileri bulun. Eğer maddi GitHub desteklemek isterseniz

Alternatif olarak, Github ait robots.txt baktığımızda https://help.github.com/articles/making-a-public-repository-private

+2

Teşekkürler. Adımları takip ettim ama bunu doğrudan github.com'dan yaptım. – Gabriel

+1

İlginç. Bu güzel yan etkiye sahip olacağının farkına varmadan, Github websitemdeki ana dalımı hijyenik nedenlerle sildim. –

+0

Ana dal yoksa github sayfalarının doğru şekilde oluşturulmasını nasıl sağlarsınız? – Bevan

-5

Kısa saçlı. Evet robots.txt ile yapabilirsiniz. Sitenizde içerik Googlebot tarafından taranmasını önlemek istiyorsanız

, sunucunuzdaki dosyalara ve dizinlere erişimi engellemek için robots.txt kullanma dahil seçenekleri, bir dizi var.

Yalnızca sitenizde arama motorlarının dizine istemediğiniz içerik varsa robots.txt dosyasına ihtiyacım var. Arama motorlarının sitenizdeki her şeyi dizine eklemesini istiyorsanız, bir robots.txt dosyasına (boş bir hatta) ihtiyacınız yoktur. Google, robots.txt tarafından engellenen içerik sayfalarını taramaya veya dizin etmeyecek olsa

, hala endeks URL'ler web üzerindeki diğer sayfalarda bulduğumuz eğer. Sonuç olarak, sayfanın URL’si ve potansiyel olarak, sitenin bağlantılarındaki metin ya da Açık Dizin Projesi’nin başlığı (www.dmoz.org) gibi diğer herkese açık bilgiler Google arama sonuçlarında görünebilir.

Kaynaklar:

http://support.google.com/webmasters/bin/answer.py?hl=en&answer=93708 http://support.google.com/webmasters/bin/answer.py?hl=en&answer=156449

+9

robots.txt dosyasının web'in kökünde olması gerekir site ve http://github.com/robots.txt adresine yazma erişimim yok. HTML üstbilgisinde gezinme kısıtlanabilir, ancak kaynak kodum için Github tarafından oluşturulan sayfaları değiştirebileceğimi düşünmüyorum . – szabgab

+0

Oluşturulan GitHub sayfalarında robotları engellemeye çalışan birisi varsa: GitHub Sayfalarını kullanan kullanıcılar, Kullanıcı Sayfası havuzuna bir robots.txt dosyası ekleyebilir ve tüm yerleşik sayfalardaki robotları kontrol etmek için kullanabilir (username.github.io/*). Ancak, Kullanıcı Sayfasının kaynağını "master" durumunda olması gerektiği gibi gizleyemezler. Proje depoları için '' '' '' 'silinebilir ve GitHub Sayfaları için başka bir şube kullanılabilir. Szabgab, Github Sayfalarını kullanmadığını söylüyor çünkü bunların hiçbiri OP için geçerli değil. – olavimmanuel

0

özel repo kullanarak (ve GitHub hesabını upselling) veya özel sunmaktadır başka bir hizmeti kullanan hiçbir yolu var gibi görünüyor ana dal sopa istiyorsanız Bitbucket gibi ücretsiz olarak repos.

+0

Zaten (yaklaşık bir saat önce) 'ana' dalını çıkardım ve şimdi bir 'ana' dalım var ama merak ediyorum, bu yeterli mi? – szabgab

+1

GitHubs robots.txt öğesinin gösterdiği gibi, yeterli olmalıdır. https://github.com/robots.txt – iltempo