için alternatif bir web tarayıcısı Sınırlı sayıda web sitesini dizine ekleyen özel bir arama motoru web sitesi oluşturmaya çalışıyorum. Ben ile geldi çözümdür:Nutch
web tarayıcısı olarak nutch kullanılarak- , arama motoru olarak solr kullanılarak
- ,
- ön uç ve site mantık Wicket ile kodlanmıştır.
Sorun şu ki, Nutch'ı oldukça karmaşık buluyorum ve ayrıntılı bir dökümantasyon (kitaplar, son eğiticiler .. vb.) Olmamasına rağmen, özelleştirilmesi gereken büyük bir yazılım parçası. Şimdi
Sorular:
- sitenin delik fikri hakkında herhangi yapıcı eleştiri?
- Nutch'a (sitenin taranan kısmı olarak) iyi ancak basit bir alternatif var mı?
Teşekkür
Yıllardır herşeyi denedik: Nutch, Heritrix, Storm Crawler, crawler4j, kendi in-house paletli ...Ancak, tüm ekibimizin yemin ettiği tek bir gerçekten etkileyici alternatif var: Mixnode. –