2016-03-26 31 views
4

Merhaba ben şu basamağı dayalı yeni yazı tipi için teserakt yetiştirilmesine katkıda tek hane ile yeni font: digits with transparent backgroundtesseract Eğitim -

tüm basamaklar şeffaf arka plan ile bir png dosyası sağlanmaktadır. Ondan bir kutu dosyası oluşturursam, onu eğitirsem - her şey yolunda gider! Eğer rakam tam olarak bu yüzden aynı yanı sıra pozisyonları ve vardır görebileceğiniz gibi digits without transparent background

:

Şimdi problem, aynı durum ama şu görüntüye dayalı teserakt yetiştirmek istiyoruz. Resim 1'deki tek fark, sarı bir arka plan kullanmam ve şu andan itibaren hiçbir şeyin artık işe yaramaması. Bir kutu dosyası i ilk görüntü için aynı pozisyonları set oluşturmak i kutusunu eğitimli sonra iyice

0 5 4 20 22 0 
1 27 4 38 21 0 
2 48 4 60 22 0 
3 71 3 83 22 0 
4 94 5 109 22 0 
5 119 5 131 22 0 
6 143 5 157 22 0 
7 172 5 184 22 0 
8 197 5 211 23 0 
9 224 5 238 22 0 

ve ancak ortaya çıkan .tr dosya burada durmadı tamamen boş ve tüm diğer tamamladı adım. Elde edilen yazı tipi kullanmak mümkün değildir!

Sorularım, hangi basamakların onlar için kullanıldığına bakılmaksızın bu basamakları tanımak için tesseract'ı nasıl eğitecekleridir?

Düzenleme 2016/04/16:

Ben preprocess görüntüleri ImageMagick kullanılan ve ben kökenden her türlü çok iyi çalışan bir komut buldum. Bu yüzden oluşturulan bu görüntüler için tesseract yapmak istedim, ama düşündüğüm gibi çalışmıyor ... Her şeyden önce, çoğunun boş olduğu kutu dosyaları oluşturdum. Ben karakter pozisyonlarını düzenlemek için bir web sitesi kullandım ve mükemmel bir şekilde kırpmak için çok zaman harcadım! Sonrasında ortaya çıkan .tr dosyalarını yarattım ve aynı zamanda tesseract'ı eğitmek için diğer şeyleri yaptım.

Son olarak ben "traineddata" var i tesseract ait "tessdata" dizine taşınmış ve kullanılması gerektiğini gibi kullandı:

tesseract example.jpg output -l mg 

(i "mg" yeni yazı denir)

Pekala, bunların hepsini veya çoğunu tanımıyor! Bu ipucunu yardım bulmak için açtım, şimdiye kadar hiç kimse bunun nasıl yapılacağına dair bir ipucu yok, ne yazık ki ... Lütfen bana yardım edin.

i kullanılmış ve yaratılan bütün teserakt eğitim dosyaları, u burada bulabilirsiniz:

Tesseract training directory (hiçbir zip/sıkıştırılmış değil -> dizinin tüm dosyaların görünümü)

+0

Belkide OT, ancak arka plan rengini kaldırmak için ön işlem yapabilirdiniz. – xvan

cevap

1

değiştirebilirsiniz herhangi bir renkli görüntüyü ikili görüntüye ve daha sonra üzerinde tesseract kullanın, bu şekilde kullandığınız renk ne olursa olsun her zaman aynı sonuca sahip olacaksınız.

İlgili konular