2012-02-28 27 views
7

OCR öğelerinden hiçbir şey anlamadım. Eclipse'e giriş yapabilmem için (.mmp, .tiff, .jpeg) bir resim elde edebilmem için bir .jar almam gerekiyor ve bana resmin metin içeriğiyle bir dize çıktı. Captcha veya handwritting değil, sadece bazı harflerin basit bir "fotoğrafı".JAVA OCR API eclipse'de açık kaynak

Açık kaynak çözümleri takdir edilmektedir. Ben Tess4j veya JavaOCR gibi projeler gördüm ama onlar biraz Herkes bir önerisi var :(

işlemek için karmaşıktır

Güncelleme:?. Ben AspriseOCR kullanımı çok kolay olduğunu tespit ettik Sadece için .jar içe inşa yolu ve bir yöntem çağrısı.Çok iyi! Ama ... Kendi projelerimde kullanamıyorum! Asprise kadar basit bir kütüphane biliyor musunuz (Herhangi bir şey derlemem ya da herhangi bir eğitimi:. sadece ithal ve bu kadar !!) Sen javaocr ve sourceforge.net/projects/ajol de bakabilirsiniz olabilir

+0

bunu kontrol edin: http://stackoverflow.com/questions/1813881/java-ocr-implementation ve bu http://asprise.com/product/ocr/index.php?lang=java – Favonius

+0

1) Neden açık? -kaynak? * "OCR öğelerinden herhangi bir şey anlama" * olmayan birinin kodda kârlı bir şekilde değişiklik veya uzantı yapabilir mi? Yoksa aslında 'özgür' mi demek istiyorsun? 2) 'Java' sadece bir büyük harf içerir, 'JAVA' 3 diye yazılacak bir kısaltma yerine uygun bir isimdir. Lütfen 'Selamlar N.' gibi gürültüyü bırakın. –

+2

Cevabınız için teşekkür ederiz. 1) Açık kaynak sadece kütüphaneyi satın almak için param olmadığı için! Kodda herhangi bir uzantı yapmak istemiyorum, ancak bunu mobil uygulamalarımdan birinde kullanabilirdim. 2) Benim "ana-dil" olarak ingilizcem yok, bu yüzden bazı hatalar yapabilirim, üzgünüm. 3) Her zaman kibar olmaya çalışıyorum :) – nunoaac

cevap

9

olarak i yerli bir kaynak Java OCR SDK'sı olmadığını biliyorum. Örneğin, en popüler open-end OCR motorlarından biri olan Tesseract (http://groups.google.com/group/tesseract-ocr/) için yerel arayüzler için çağrıları sarmalayan Java API'leri vardır - tesjeract (http://code.google.com/p/tesjeract/) veya Tess4J (http://tess4j.sf.net/) gibi bazı Java sarmalayıcıları vardır. Bu sizin için işe yarayabilir, ancak kurulması çok zor ve sizin tarafınızda görüntü ön işleme ve yazı tipi eğitimi geliştirilmesini gerektirecektir.

Bir çözüm daha bir bulut hizmeti olabilir. İnternet bağlantısına sahip olmak için son kullanıcı uygulaması gerektirir, ancak programlama dil seçiminiz ve kaynak sınırlamalarınızdan bağımsızdır. http://ocrsdk.com'a bir göz atın, web API'sı yoluyla bir resim yükleyebilmenizi ve size OCRed verilerini döndürmenizi sağlayan bulut tabanlı bir OCR SDK'sıdır. Bu Web API tabanlı OCR SDK, sizin için uygun olmayabilir, ancak sizin için uygun olmayabilir, ancak kurumsal düzeyde sağlarken kurumsal çözümleri ile karşılaştırıldığında fiyatlandırma gerçekten çok uygun olduğu için bunu denemenizi öneririz (ücretsiz deneme sürümü var) Açık kaynaktan daha iyi olan OCR doğruluğu. Ayrıca bu Java codesample'u github adresinde de bulabilirsiniz. Disclamer: @ ABBYY çalışıyorum.

+0

, ABBYY'nin OCRed verilerini almak için bir PDF dosyası (taranmış bir belge olabilir) yüklememize izin veriyor mu? – Dax

5

Bildiğim kadarıyla