this rehberini takip ederek URL'leri taramak için Apache Nutch'ı kurmaya çalışıyorum. Eski bir rehber olmak (Kılavuz, 1.x, 2.3 kullanıyorum), yapıya gerekli değişiklikleri yaptım. Bir tarama çalıştırmayı denediğinizde Ancak, bu hatayı alıyorum: Ubuntu (14.04) yeni olmasıApache Nutch - Yollarla İlgili Sorunlar
[email protected]:~# /usr/local/nutch/framework/apache-nutch-2.3/src/bin/crawl urls FirstCrawl 2
No SOLRURL specified. Skipping indexing.
Injecting seed URLs
/usr/local/nutch/framework/apache-nutch-2.3/src/bin/nutch inject urls -crawlId FirstCrawl
Error: Could not find or load main class org.apache.nutch.crawl.InjectorJob
Error running:
/usr/local/nutch/framework/apache-nutch-2.3/src/bin/nutch inject urls -crawlId FirstCrawl
Failed with exit value 1.
[email protected]:~#
, bana zor burada dizin yapısını ve yolları yönetmek buluyorum. /usr/local/nutch/framework/apache-nutch-2.3/src/java/org/apache/nutch/crawl
JAVA_HOME
Zaten Nutch kaynak kodunu derlemek emin olun /usr/lib/jvm/java-7-openjdk-amd64