2016-04-12 21 views
0

Ephesoft topluluğu sürüm 4.0.2.0'ı, ephesoft'un belirli görüntülerden gelen verileri sınıflandırabilen veya ayıklayabileceği sorunu olan e-maillerle (ephesoft tarafından test edilmiştir) kullanıyorum diğerleri dosyada hata mesajı olmadan yapamaz, şimdi neden yok. Ephesoft, belirli bir tif görüntüsünü öğrenemez veya çıkartamaz (tüm görüntülerde değil)

i bilgi dosyaları tıklayıp

HOCR ve HTML dosyaları sadece bu gibi meta veri içermeyen boş oluşturulan:

Application_Checklist_HOCR.xml:

<?xml version="1.0" encoding="UTF-8" standalone="yes"?> 
<HocrPages<HocrPage> 
<Title></Title><Spans/> 
<HocrContent></HocrContent> 
</HocrPage></HocrPages> 

Ancak ABD-invoice_HOCR için

. xml ephesoft öğrenebilir ve dosya şu şekilde görünebilir:

<?xml version="1.0" encoding="UTF-8" standalone="yes"?><HocrPages><HocrPage> 

<Title></Title><Spans><Span><Value>INVOICE</Value><Coordinates><x0>579</x0> 

<y0>247</y0><x1>881</x1><y1>304</y1></Coordinates></Span><Span> 

<Value>ACME</Value><Coordinates><x0>168</x0><y0>394</y0><x1>311</x1><y1>431</y1> 

</Coordinates></Span><Span><Value>Company</Value><Coordinates><x0>329</x0> 

<y0>395</y0><x1>541</x1><y1>442</y1></Coordinates></Span><Span> 

<Value>lnvoice</Value><Coordinates>............ 
+0

Yukarı ............ –

+0

Tam olarak aynı pb var. Ama ben doğrudan komut satırında tesseract kullanırsanız, iyi çalışır. Bu komut satırı:> myfile.tif myfile hocr tesseract. Ancak Ephesoft'tan çalıştırıldığında işe yaramaz bir HOCR html dosyası üretilir. – ElArbi

+0

tesseract yapılandırma dosyasını /Path-To-Ephesoft/Application/WEB-INF/classes/META-INF/dcma-tesseract/tesseract-reader.properties içinde düzenleyebilir ve bu satırı yorumlayın # tesseract.command_parameters = -psm 4 Varsayılan segmentasyonu kullanalım. –

cevap

1

Siz yapabilirsiniz tesseract config dosyasını/Path-To-Ephesoft/Uygulama/WEB-INF/sınıfları/META-INF/dcma-tesseract/tesseract-‌ reader.properties ve bu satırı yorumlamak tesseract.command_parameters = -psm 4 izin vermek tesseract varsayılan segmentasyonu kullanın.

İlgili konular