2015-11-15 22 views
10

this rehberini takip ederek URL'leri taramak için Apache Nutch'ı kurmaya çalışıyorum. Eski bir rehber olmak (Kılavuz, 1.x, 2.3 kullanıyorum), yapıya gerekli değişiklikleri yaptım. Bir tarama çalıştırmayı denediğinizde Ancak, bu hatayı alıyorum: Ubuntu (14.04) yeni olmasıApache Nutch - Yollarla İlgili Sorunlar

[email protected]:~# /usr/local/nutch/framework/apache-nutch-2.3/src/bin/crawl urls FirstCrawl 2 
No SOLRURL specified. Skipping indexing. 
Injecting seed URLs 
/usr/local/nutch/framework/apache-nutch-2.3/src/bin/nutch inject urls -crawlId FirstCrawl 
Error: Could not find or load main class org.apache.nutch.crawl.InjectorJob 
Error running: 
    /usr/local/nutch/framework/apache-nutch-2.3/src/bin/nutch inject urls -crawlId FirstCrawl 
Failed with exit value 1. 
[email protected]:~# 

, bana zor burada dizin yapısını ve yolları yönetmek buluyorum. /usr/local/nutch/framework/apache-nutch-2.3/src/java/org/apache/nutch/crawl

JAVA_HOME Zaten Nutch kaynak kodunu derlemek emin olun /usr/lib/jvm/java-7-openjdk-amd64

cevap

3

olarak ayarlanır içinde

InjectorJob olduğunu. Ardından, tarama komutunu $ {APACHE_NUTCH_HOME}/runtime/local (veya $ {APACHE_NUTCH_HOME}/runtime/deploy/bin) 'dan çalıştırın. Bu yardımcı olur

Umut,

Le Quoc Do