> 1000 .html dosyalarına sahip bir dizinim var ve bunların tümünü hatalı bağlantılar için kontrol etmek istiyorum; Bu görev için önerebileceğiniz herhangi bir araç var mı?Linux'taki büyük projede html bağlantılarını kontrol etmek için ne gerekir?
cevap
Lynx metin tarayıcısını kullanarak html dosyalarından bağlantıları ayıklayabilirsiniz. Bu etrafında Bash komut dosyası zor olmamalıdır.
Sana Perl, aynı yazar tarafından HTML::TagReader modülü ile rahat iseniz checklink (W3C projesi)
Kullanıcı aracısını ayarladığınıza ve üstbilgileri kabul ettiğiniz sürece (bot detektörlerinden gelen sahte hata kodlarından kaçınmak için) bu işe yarayacaktır. –
Tamam görünüyor, ama kesinlikle bu kadar büyük projeler için tasarlanmamıştır - sadece kırık linkleri listelemenin hiçbir yolu yoktur ve projem için çıktı * gerçekten * büyüktür. –
, webgrep komut satırı araçlarını deneyin veya kullanmayı tercih ediyorum. Eğer wget
kullanabilirsiniz
, output.log dosyanın altındaki örn
wget -r --spider -o output.log http://somedomain.com
, bu wget
kırık bağlantılar bulmuştur olmadığını gösterir. awk/grep
Kırık linkleri kontrol etmek için alternatif bir ** wget ** komut satırı [bu yanıt] 'da bulunabilir (http://stackoverflow.com/a/15029100/1497596). Ayrıca, bu cevapta bıraktığım bir yorumun Windows ** için ** wget bağlantısına da sahip olduğunu unutmayın. – DavidRR
- 1. document.implementation.createHTMLDocument'i kullanmak için ne gerekir?
- 2. Vim: Büyük bir projede bul ve değiştir?
- 3. Açısal meteor yardımcılarının çalışması için ne gerekir?
- 4. nasıl kontrol etmek
- 5. Kullanılmayan CSS seçicilerini kontrol etmek için araç?
- 6. Maven Eclipse Büyük bir projede SVN entegrasyonu
- 7. Android db bağlantılarını ne zaman açıp kapatmalıyım?
- 8. Android: ne kadar bellek kaldığını kontrol etmek nasıl?
- 9. Mac OS X 10.6.8'de Verilog programlarını derlemek ve simüle etmek için ne gerekir?
- 10. Rotayı kontrol etmek için raptiye form_for özel denetleyiciye
- 11. kontrol etmek için WiX koşulları boolean mantığı
- 12. Iphone: NSPredicate bir kimlik kontrol etmek için
- 13. Hangi dalda olduğunuzu kontrol etmek için mercurial
- 14. Dosyalarını kontrol etmek için Unix komutu
- 15. kontrol etmek için alternatif, bir değerin
- 16. Sadece bu java koduyla bir URL'nin bağlantılarını kontrol ediyor muyum?
- 17. Bir RSS yayını XML dosyası için ne kadar büyük büyük?
- 18. js "var" ne zaman gerekir?
- 19. Python'da bir giriş kontrol programı gerekir
- 20. Büyük bir projede simgeler (xaml yolları) nasıl yeniden kullanılır?
- 21. Büyük sayı ne kadar?
- 22. FxCop: montaj bilgisi değerlerini kontrol etmek için özel kural
- 23. MySQL sunucusunun bağlantılarını kabul edip edemediğini kontrol edin
- 24. FluentValidation nasıl Uzunluk kontrol etmek?
- 25. benzersiz e-postaları kontrol etmek için django'da form doğrulaması
- 26. Oracle'da bir satırın varlığını kontrol etmek için hızlı sorgu?
- 27. nasıl kontrol etmek için "checkbox" dinamik - jQuery Mobile
- 28. HTML tablo hücresinin boş olup olmadığını kontrol etmek için javascript kullanma?
- 29. PHP @ dizi değerlerini kontrol etmek için güvenli midir?
- 30. ListView'deki tüm onay kutularını kontrol etmek için doğru yol?
Lynx bunu kullanarak ayrıştırabilir, ancak gerçekten desteklemiyor. wget amaç için çok daha uygundur. – reinierpost
Sayfadaki bağlantıların bir listesini çıkarmak için nasıl wget alırsınız? – Quentin
Gerçekten harika bir fikir. Neden daha önce düşünmedim? –