Ben TestCrawl2
daha önce var ve oluşturulması gerekir etmediğini varsayarak aşağıdaki komutla nutch 1.10
koşmak ...nutch 1.10 giriş yolu/linkdb/akım
sudo -E bin/crawl -i -D solr.server.url=http://localhost:8983/solr/TestCrawlCore2 urls/ TestCrawl2/ 20
aldığım bir hata yok Aşağıdakilerin indekslenmesi üzerine:
Linkdb dizini var, ancak 'geçerli' dizini içermiyor. Dizin root'a aittir, bu nedenle izin sorunları olmamalıdır. İşlem bir hatadan çıktığı için linkdb dizini .locked
ve .. locked.crc
dosyaları içerir. Komutu tekrar çalıştırırsam, bu kilit dosyaları aynı yerde çıkmasına neden olur. TestCrawl2
dizinini silin, durulayın, tekrarlayın.
Nol ve solr yüklemelerinin kendileri daha önce TestCrawl
örneğinde sorunsuz olarak çalıştığını unutmayın. Sadece şimdi sorun yaşadığım yenisini deniyorum. Bu sorunu gidermek için herhangi bir öneriniz var mı? Bu sorunun bir sürümüne haline çalıştırmak sanki